python - 文件结构不一致的 Pandas 中的 Read_csv
问题描述
在将 csv 文件读取到行尾不标准的 pandas 数据帧时遇到问题。
这是我的代码:
df_feb = pd.read_csv(data_location, sep = ",",nrows = 500, header = None, skipinitialspace = True,encoding = 'utf-8')
这是输出(个人信息划掉): 输出
上面的输出将应该是单行的内容分成 4 行。每个电话号码都应该开始一个新行(电话号码=划掉的位)。我的目标是让每一行看起来像这样: 目标输出
预先感谢您的帮助!
解决方案
如果文件的格式有任何规则(不是每条记录的唯一格式),那么我建议您编写自己的转换工具。
在这里,我建议该工具应该做什么
- 以纯文本形式读取文件。
- 将 4 行放入 1 个记录/类对象中(如图所示,4 条记录似乎有 4 行)
- 解析行(用逗号分隔,制表符,无论你有什么)以获取属性
- 在另一个文件中写入属性,按制表符(或逗号)分割 => 你的 csv
现在,您可以将 csv 加载到 Pandas。
推荐阅读
- sql - Entity Framework Core 是否会在重命名模型属性时删除旧列?
- c++ - 将动态分配的对象添加到对象指针数组
- javascript - 将数据输入数据库并从数据库谷歌表中读取数据
- reactjs - react-redux reducer 中扩展运算符和无扩展运算符之间的区别
- c# - 从 4.0 迁移到 .NET 4.7.2 框架后出现 AccessViolationException
- java - 如何修复包含 Textview 的线性布局的 Scrollview
- interface - Systemverilog modport 访问接口 clk 而不被声明为输入
- python-3.x - 多处理一个根据分布列表测试给定数据集的函数。通过列表从每次迭代中返回函数值
- go - 将 golang S2 Geometry 库与 dynamodb 一起使用
- python - 在 docker 容器中使用 python 脚本创建文件(pdf、xls)