首页 > 解决方案 > 熊猫数据框中看不到一些空行

问题描述

背景:

我正在阅读一个包含超过 40K+ 行的大型 CSV 文件,因此它需要对数据进行如此多的修改,我没有任何问题,因为我在过去几个月使用熊猫。

问题:在 CSV 文件中,它包含许多空行,其中仅包含一种称为 EOL 的隐藏字符

问题: Panda 忽略的行包含隐藏字符 EOL:

我试图在这里分享示例数据,但隐藏的角色被删除了,所以我分享了一个显示隐藏角色的快照。

在此处输入图像描述

这个网站我用来获取上述信息 dostring.com/show-hidden-characters

我在这个论坛上遇到了非常流行的问题,但没有任何帮助。建议一些其他的解决方案

在这里,我如何知道一些空行在 DF 中不可见:

再次让我感到惊讶,当您在 MS Office 中打开第 168 行和第 169 行时,它是空的。在控制台中,我只能看到一行是空的,即 169,并且它被 Panda 标记为“nan”,同时行号 168 被替换为 167 的数据。

这种情况存在于整个工作表(CSV)中,熊猫只是在运行时忽略了一个空行,但在 MS Office 中您可以看到这些行。我试图在这里分享示例数据,但隐藏的角色被删除了,所以我分享了一个显示隐藏角色的快照。

供参考,

这是我在读取 CSV 文件时使用的设置:

 sep=",", skipinitialspace=False, skip_blank_lines=False, encoding='utf-8'

标签: pythonpandasdataframe

解决方案


推荐阅读