首页 > 解决方案 > python pandas read_csv长度是>csv中的行

问题描述

当我这样做时file = pd.read_csv("x.csv"),它确实将 csv 读入数据框,并且在head()显示正确的列的情况下看起来还不错。

由于我的 csv 有 1M + 行,所以我希望看到 1M + len(file),但我看到了 19M +。可能是什么问题呢?使用我朋友的计算机并对测试 csv 文件执行相同的操作,在执行 len(file) 后会给出正确的行数。

该文件包含奇怪的特殊字符,例如可能显示为的中文字符??在 .csv 中。

因此,我很确定这不是因为使用的函数 - 它更可能是 python 2 和 3 之间的区别、使用的分隔符(默认 ,)或诸如丢失行之类的脏数据,还是其他原因?

例如 csv 包含

col1 col2 col3 col4

a       112      111       q??p

标签: pythonpandascsv

解决方案


推荐阅读