首页 > 解决方案 > 在缺失值的数量上循环删除列

问题描述

我正在尝试创建一个循环来创建一个循环,该循环可以帮助我删除任何具有一定数量缺失值的列。有人能帮我吗?

for col in df:

"""Delete columns with over 200 missing values"""

if df[col].isnull().sum() > 200:
    pd.DataFrame.drop(col)

标签: pythonfor-loopmissing-data

解决方案


for col in df:
    if df[col].isnull().sum() > 200:
        df=df.drop(col)

不要从 中删除pd.DataFrame,而是从 中删除df,并且也可以将其分配回去。

甚至更好:

df=df.dropna(thresh=len(df)-200,axis=1)

推荐阅读