首页 > 解决方案 > CSV 文件中的逗号分隔小数位

问题描述

在 CSV 文件中,其中一列的值带有以逗号分隔的小数位。例如,值15.4写为15,4

因为它是一个 CSV 文件,所以当我尝试导入(例如到 Python 或 R)时,导入器认为15属于一列而属于4另一列。实际上,由于15,4属于单个列,因此我最终得到的标题比分隔15和所需的标题少一个4

为了解决这个问题,我认为我可以再创建一个标题,然后我会将 the15和 the连接4到一个列中。

问题是这些 CSV 文件中的每一个都有 6GB。我无法在记事本或 Excel 中打开它(以便手动添加标题)。

对于 6GB CSV 文件中逗号分隔小数位的问题,有什么解决方案?

笔记:

标签: pythonramazon-web-servicescsv

解决方案


当您使用 Pandas 读取 csv 文件时,您可以告诉它小数位的样子。decimal=',' 这是文档。 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html


推荐阅读