首页 > 解决方案 > 在连接它们之前删除每个 csv 文件的前两行 Pandas

问题描述

我有 4000 个 csv 文件,我想将它们与相同数量的列连接起来。问题是它们都有列名。我想删除每个 csv 文件的前两行并将它们连接起来。首先连接它们并使用以下代码删除具有列名的行意味着我丢失了 4000 行数据,这将影响我的数据。

df = pd.read_csv('Concatenated.csv',delimiter=',')
df = df.apply(pd.to_numeric, args=('coerce',)).dropna()
df = df.astype(int)

我通常使用 windows 命令提示符来合并所有文件,copy *.csv concatenated.csv并学会more +X [file_containing data] > [file_to_export_data_to]删除文件的前 x 行。但是如何将其应用于所有 4000 个文件?

标签: pythonpandas

解决方案


如果您阅读文档,您会看到它pandas.read_csv有一个可选参数skiprows,可以满足您的需要。

以下代码将从my-file.csv没有标题的内容创建一个数据框,并跳过文件的前两行。

import pandas as pd

df = pd.read_csv('my-file.csv', sep=',', header=None, skiprows=2)

推荐阅读