python - Python Pandas 识别不正确的数据
问题描述
我有一个用逗号分隔的 csv 文件,每行有 215 列。这些文件非常大,我正在使用带有块的 pandas 数据帧 pd.read_csv() 来读取数据。文件中的一行有 214 列而不是 215 列,但数据框读取数据,并将 NaN 应用于最后一列。
有没有办法在熊猫数据框中识别这一行,因为我更喜欢数据框而不是 csv_reader。
注意:最后一列也可以为空,因此按等于空的最后一列过滤数据框将不起作用
解决方案
您可以按行对空值求和,然后过滤总和不等于 0 的那些,这将为您提供带有空值的行。
df[df.isnull().sum(axis=1)!=0]
推荐阅读
- php - PHP中的组和循环问题
- python - 使用绘图字典在同一图形上绘制两条线
- reactjs - Redux saga - 如果数据已存在于 redux 存储中,则跳过 API 请求
- r - 谁能帮我用 R 处理数据?[图片更新]
- css - 使用线性渐变制作 CSS 颜色
- graphql - 如何使用从 Gatsby 中的 Contentful 获取的值过滤从 Contentful 获取的数据?
- visual-studio-code - 我可以通过 CLI 使用要在集成终端上运行的命令在 VS Code 中打开文件夹吗?
- mongodb - 猫鼬链接列表如何
- rest - 将非常大的组(20k+ 成员)添加为受邀者时,Google 日历 REST API 返回 503
- c++ - 如何使用 Win32 C++ 在 TCHAR 缓冲区 [] 的末尾添加斜杠