python - 修改 df 后更新 df 变量列表
问题描述
我有一个来自我的 df 的预测变量 (X) 和结果 (y) 变量列表。我的 df 中有 100 个变量,所以我只关心下面的几个。
X = df[['a', 'b', 'c']]
y = df['d']
然后我想删除我的任何“X”变量的所有缺少数据的行,所以我运行了这个:
for i in X:
df = df[df[i].notna()]
然后,这给我留下了一个修改后的 df,在感兴趣的列中没有缺失值。但是,我的列表 X 和 y 仍然填充了旧的 df,因此我不能将它们用作模型的输入。虽然我知道我可以首先复制并粘贴用于创建这些列表的代码以“刷新”代码,但这似乎效率低下。虽然我似乎想不出更好的方法。想法赞赏!
解决方案
您可以使用df.dropna
:
X = X.dropna()
推荐阅读
- javascript - 使用变量值从 React 类的状态问题中检索对象值
- vue.js - 显示我添加到矩阵的食谱
- bash - 使用 head 和 tail 命令显示选定的行
- http - 服务器端出现意外错误时使用哪个 http 代码?
- python - 用张量流连接两个数据集
- jquery - 在 html 文件中引用 nuget 包
- sql-server - SQL 错误:将数值转换为数值的算术溢出错误 - 使用 Numeric(20,20) 列类型
- python - Python FTPS (FTP_TLS) 连接被拒绝。没有证书?
- kotlin - Kotlin 转换双倍?翻倍
- git - SonarQube 自动分支检测