python - 如何使用 pandas 清理多个数据
问题描述
我有一个数据文件夹,包含“admin,admin1 ... admin500”,我想删除标题并将列名添加到数据中
df = pd.read_csv('admin.tsv', comment='#', header=None, sep='\t',names=['index','count','text','tag'])
如何使用 for 循环来执行该文件夹中的每个文件,并将它们保存为与以前相同的名称?
解决方案
import glob
for file in glob.glob('foldername/*'):
df = pd.read_csv(file, comment='#', header=None, sep='\t',names=['index','count','text','tag'])
df.to_csv(f'./tmp/{file}')
我想代码将在同一个数据文件夹中执行,如果注意你可以.
用数据文件夹替换glob.glob('.')
结果将在 tmp 文件夹中。
推荐阅读
- php - 如何链接到页面的特定部分 HTML PHP
- c# - 当后端代码中的简单键值变量工作相同时,为什么要使用 redis 作为缓存层?
- google-apps-script - Google Slides Apps 脚本检索页面中的形状
- python-3.x - 在 KNeighborsClassifier 中使用自定义指标时,我不断收到“TypeError:只有整数标量数组可以转换为标量索引”
- java - JavaFX - 在使用选项卡时将 GUI 拆分为单独的类
- jquery - 通过函数调整电子窗口大小
- scheme - 匹配方案中的括号
- android - 当我使用 adb 显示 /sys/kernel/debug/tracing/available_filter_functions 时没有这样的设备
- python - 初始化以迭代抽象pyomo模型中的集合?
- angular-cli - 运行 ng serve -o 时出现错误