python - CSV 文件中的逗号分隔小数位
问题描述
在 CSV 文件中,其中一列的值带有以逗号分隔的小数位。例如,值15.4
写为15,4
。
因为它是一个 CSV 文件,所以当我尝试导入(例如到 Python 或 R)时,导入器认为15
属于一列而属于4
另一列。实际上,由于15,4
属于单个列,因此我最终得到的标题比分隔15
和所需的标题少一个4
。
为了解决这个问题,我认为我可以再创建一个标题,然后我会将 the15
和 the连接4
到一个列中。
问题是这些 CSV 文件中的每一个都有 6GB。我无法在记事本或 Excel 中打开它(以便手动添加标题)。
对于 6GB CSV 文件中逗号分隔小数位的问题,有什么解决方案?
笔记:
- 我无法替换文件中的所有
,
with.
,因为其他列中包含字符串值,
。 - CSV 文件中的分隔符是
,
,而不是;
。 - 无法再次生成文件,替换
15,4
为15.4
.
解决方案
当您使用 Pandas 读取 csv 文件时,您可以告诉它小数位的样子。decimal=',' 这是文档。 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
推荐阅读
- mongodb - 在 mongodb shell 中打印回车符
- java - Minecraft 服务器使用所有 CPU
- c++ - How to allocate memory to a 2D array of objects in c++?
- java - 我创建了该方法,但无法在 main 中调用它
- postgresql - 在 Mac 上忘记 PostgreSQL 13 db 的密码
- ios - 嵌套数组过滤器 swift
- android - 在 Android 上绘制边缘叠加
- django - 添加到购物车功能未执行
- sql - 用户在过去 n 天组中运行的中位数。大查询 SQL
- kubernetes - 有什么不同的 --dry-run 机会?