python - pd.read_csv 问题,两个不同的表在 .csv 中相互重叠
问题描述
我有一个 csv 文件,该文件在信息之上设置了信息,并且我正在努力将其读入数据框。
原始 CSV 看起来像:
我希望基本上得到 3 个不同的东西:1)在第一行定义日期和公司名称 2)将汇总表(顶部表)放入数据框中 3)将详细的销售表放入另一个数据框
我试过df = pd.read_cs(filepath,error_bad_lines=False)
了,它只给了我汇总表,但只有 3 行,因为第一行只有 3 列。关于如何阅读这些文件的任何想法?汇总表的行号不固定(行数不同)。任何帮助将非常感激!谢谢!
解决方案
您可以使用参数指定要读取的行数nrows
,也可以使用skiprows
跳过读取某些行pd.read_excel
:
您可以将top-table
以下内容读入df:
在这里,您可以跳过包含一些无用标题的第一行并读取包含顶级表数据的接下来的 10 行。
df1 = pd.read_excel('test.xls', skiprows = 1, nrows= 10, usecols = 'A:D')
然后second-table
在另一个像这样的df中:
在这里,您可以跳过已在 df1 中读取的行,并从文件中读取剩余的数据。
df2 = pd.read_excel('test.xls', skiprows = 6)
推荐阅读
- python - 检测 guild.member 当前是否正在流式传输,并根据流式传输状态授予或删除角色
- javascript - 验证不适用于角度反应形式
- flutter - 当我在其他页面中使用获取首选项时,设置首选项不起作用并返回空值(共享首选项)
- r - 有没有办法计算从 sqlAppendTable() 生成的查询的大小?
- mongodb - $map 中有多个“in”表达式
- angular - 为什么RouterLink将输入添加到括号中当前URL的末尾
- java - Spring Boot 中服务接口类的用途
- python - Scrapy - 使用选择器的嵌套链接提取
- javascript - 如何以遵循函数的方式制作动态 div 曲线?
- reactjs - 当组件重新渲染时,React 组件的状态会发生什么变化?