首页 > 解决方案 > 无法正确读取 .csv 文件

问题描述

导入 .csv 时,我将结果保存为 pandas DataFrame,如下所示:

csv_dataframe= pd.DataFrame(pd.read_csv(r'filepath.csv', delimiter=';', encoding='iso-8859-1', decimal=',', low_memory=False))

但是,当我调用包含数字和字母的特定列时,它会忽略某些字符或添加其他字符。例如,在“A”列中,有与此类似的元素:

'ABC123456789'
'123456789'
'1234567'

当我打电话时:

csv_dataframe['A']

结果是:

'ABC123456789'
'1234567342'
'3456475'

因此,某些值是正确的,但在其他值中,它会更改值,添加或删除元素。在某些情况下,它甚至会改变它们的长度。

例如,是否有某种形式可以改变其他程序读取 .csv 文件中的 .csv 文件的方式?也就是说,.csv 文件中是否有一个选项可以屏蔽打开时不明显的值?或者,请问我在调用文件/函数时是否犯了任何错误?

非常感谢。

标签: python-3.xpandascsv

解决方案


尝试删除 'pd.DataFrame()'

pd.read_csv 已经创建了一个数据框

这应该有效:

csv_dataframe= pd.read_csv(r'filepath.csv', delimiter=';', encoding='iso-8859-1', decimal=',', low_memory=False)

它可能会解决您的问题,除此之外,我愿意打赌问题出在 CSV 中。


推荐阅读