python - python pandas read_csv长度是>csv中的行
问题描述
当我这样做时file = pd.read_csv("x.csv")
,它确实将 csv 读入数据框,并且在head()
显示正确的列的情况下看起来还不错。
由于我的 csv 有 1M + 行,所以我希望看到 1M + len(file)
,但我看到了 19M +。可能是什么问题呢?使用我朋友的计算机并对测试 csv 文件执行相同的操作,在执行 len(file) 后会给出正确的行数。
该文件包含奇怪的特殊字符,例如可能显示为的中文字符??在 .csv 中。
因此,我很确定这不是因为使用的函数 - 它更可能是 python 2 和 3 之间的区别、使用的分隔符(默认 ,)或诸如丢失行之类的脏数据,还是其他原因?
例如 csv 包含
col1 col2 col3 col4
a 112 111 q??p
解决方案
推荐阅读
- javascript - 在 woo-commerce 中加载 bootstrap 3 模态的问题
- algorithm - 设计一个 O(|V | + |E|) 时间算法来找到有向图的根顶点(或报告不存在)
- javascript - 如何在 Yii2 中禁用/覆盖依赖项
- msbuild - MSBuild 下载文件任务路径中的非法字符
- laravel - 订单列表未按 order_date 排序
- android - 我如何通过 volley 从 json 响应中获取字符串
- robots.txt - 使用 robots.txt 向搜索引擎隐藏文件夹和子文件夹的正确语法
- javascript - 如何在加载/显示页面之前使用 Vue(路由器)获取 GET 请求变量
- drupal-8 - 如何 - 构建自定义 drupal 8 模块表单
- azure - Azure 流分析会话窗口异常行为