python - 在连接它们之前删除每个 csv 文件的前两行 Pandas
问题描述
我有 4000 个 csv 文件,我想将它们与相同数量的列连接起来。问题是它们都有列名。我想删除每个 csv 文件的前两行并将它们连接起来。首先连接它们并使用以下代码删除具有列名的行意味着我丢失了 4000 行数据,这将影响我的数据。
df = pd.read_csv('Concatenated.csv',delimiter=',')
df = df.apply(pd.to_numeric, args=('coerce',)).dropna()
df = df.astype(int)
我通常使用 windows 命令提示符来合并所有文件,copy *.csv concatenated.csv
并学会more +X [file_containing data] > [file_to_export_data_to]
删除文件的前 x 行。但是如何将其应用于所有 4000 个文件?
解决方案
如果您阅读文档,您会看到它pandas.read_csv
有一个可选参数skiprows
,可以满足您的需要。
以下代码将从my-file.csv
没有标题的内容创建一个数据框,并跳过文件的前两行。
import pandas as pd
df = pd.read_csv('my-file.csv', sep=',', header=None, skiprows=2)
推荐阅读
- python - django-ratelimit 堆栈键。不是预期的行为
- vba - 如果文本存在则尝试在用户表单文本框中查找文本然后添加 1 + 文本
- spring-cloud-config-server - Spring Cloud Config Server/Bus 自动刷新扩展性
- glass-mapper - GlassMapper 升级后 SitecoreTypeCreationContext 抛出异常
- python - 如何在python中转换以下日期格式:'2020-12-03T05:21:56+0000'
- react-native - 如何在屏幕更改时对类组件做出反应原生 5x 时聚焦?
- tidb - 滚动更新 TiDB 有什么影响?
- linux - 如何在 Chef 中编写多个 iptables 规则?
- python - 模拟装饰器,它在 python 类之外,但使用它的类
- javascript - 如何在移动设备上放大 Fabric JS?