首页 > 解决方案 > 文件结构不一致的 Pandas 中的 Read_csv

问题描述

在将 csv 文件读取到行尾不标准的 pandas 数据帧时遇到问题。

这是我的代码:

df_feb = pd.read_csv(data_location, sep = ",",nrows = 500, header = None, skipinitialspace = True,encoding = 'utf-8')

这是输出(个人信息划掉): 输出

这是输入数据的样子: 数据

上面的输出将应该是单行的内容分成 4 行。每个电话号码都应该开始一个新行(电话号码=划掉的位)。我的目标是让每一行看起来像这样: 目标输出

预先感谢您的帮助!

标签: pythonpandasopencsv

解决方案


如果文件的格式有任何规则(不是每条记录的唯一格式),那么我建议您编写自己的转换工具

在这里,我建议该工具应该做什么

  • 以纯文本形式读取文件。
  • 将 4 行放入 1 个记录/类对象中(如图所示,4 条记录似乎有 4 行)
  • 解析行(用逗号分隔,制表符,无论你有什么)以获取属性
  • 在另一个文件中写入属性,按制表符(或逗号)分割 => 你的 csv

现在,您可以将 csv 加载到 Pandas。


推荐阅读