首页 > 解决方案 > 如何使用 pandas 清理多个数据

问题描述

我有一个数据文件夹,包含“admin,admin1 ... admin500”,我想删除标题并将列名添加到数据中

df = pd.read_csv('admin.tsv', comment='#', header=None, sep='\t',names=['index','count','text','tag'])

如何使用 for 循环来执行该文件夹中的每个文件,并将它们保存为与以前相同的名称?

标签: pythonpandas

解决方案


import glob
for file in glob.glob('foldername/*'):
    df = pd.read_csv(file, comment='#', header=None, sep='\t',names=['index','count','text','tag'])
    df.to_csv(f'./tmp/{file}')

我想代码将在同一个数据文件夹中执行,如果注意你可以.用数据文件夹替换glob.glob('.')

结果将在 tmp 文件夹中。


推荐阅读