首页 > 解决方案 > 修改 df 后更新 df 变量列表

问题描述

我有一个来自我的 df 的预测变量 (X) 和结果 (y) 变量列表。我的 df 中有 100 个变量,所以我只关心下面的几个。

X = df[['a', 'b', 'c']]

y = df['d']

然后我想删除我的任何“X”变量的所有缺少数据的行,所以我运行了这个:

for i in X:

    df = df[df[i].notna()]

然后,这给我留下了一个修改后的 df,在感兴趣的列中没有缺失值。但是,我的列表 X 和 y 仍然填充了旧的 df,因此我不能将它们用作模型的输入。虽然我知道我可以首先复制并粘贴用于创建这些列表的代码以“刷新”代码,但这似乎效率低下。虽然我似乎想不出更好的方法。想法赞赏!

标签: pythonmachine-learningrefresh

解决方案


您可以使用df.dropna

X = X.dropna()

推荐阅读