python - 为多个 CSV 文件导出 Pandas 输出
问题描述
我在一个文件夹的子目录下有许多 CSV 文件。它们都包含推文和其他元数据。我有兴趣删除大部分这些元数据并保留推文本身和时间。我使用 glob 读取文件,删除部分似乎工作正常。但是,我不确定如何保存输出,以便保存所有文件并使用其原始文件名。
import pandas as pd
import glob
path = r'D:\tweets'
myfiles= glob.glob(r'D:\tweets\**\*.csv', recursive=True)
for f in myfiles:
df = pd.read_csv(f)
df = df.drop(["name", "id","conversation_id","created_at","date"], axis=1)
df = df[df["language"].str.contains("bn|ca|ckbu|id||zh")==False]
df.to_csv("output_filename.csv", index=False, encoding='utf8')
解决方案
如果你这样做,它会覆盖同一个文件:
for f in myfiles:
df = pd.read_csv(f)
df = df.drop(["name", "id","conversation_id","created_at","date"], axis=1)
df = df[df["language"].str.contains("bn|ca|ckbu|id||zh")==False]
df.to_csv(f, index=False, encoding='utf8')
推荐阅读
- laravel - Laravel - EC2 图像上传文件夹权限
- cordova-ios - 如何使用 windows 和 iPhone 测试我的 cordova ios 应用程序
- c - 在新的 Linux 内核中,什么是 'struct zone' 中的 '.(in)active_list' 字段的替代品?
- python - 子图axis.set_zorder,地块消失
- cuda - 在 Ubuntu 主机上远程调试 CUDA 应用程序 - 未知错误
- php - 在数组中搜索最接近 0 的负值和正值
- c++ - 如何让另一个窗口识别 alt+f4 按键
- unix - 如何判断是否是 ssh shell?
- visual-studio-code - Visual Studio Code C/C++ 扩展:是否有 32 位的智能感知模式?
- python - Pandas - 查看 2 列并检查每列是否有不同的元素,如果两列都包含元素,则返回不同列中的值