首页 > 解决方案 > Python Pandas 识别不正确的数据

问题描述

我有一个用逗号分隔的 csv 文件,每行有 215 列。这些文件非常大,我正在使用带有块的 pandas 数据帧 pd.read_csv() 来读取数据。文件中的一行有 214 列而不是 215 列,但数据框读取数据,并将 NaN 应用于最后一列。

有没有办法在熊猫数据框中识别这一行,因为我更喜欢数据框而不是 csv_reader。

注意:最后一列也可以为空,因此按等于空的最后一列过滤数据框将不起作用

标签: pythonpandascsv

解决方案


您可以按行对空值求和,然后过滤总和不等于 0 的那些,这将为您提供带有空值的行。

df[df.isnull().sum(axis=1)!=0]

推荐阅读