pandas - 将文件夹中 tsv 的内容合并到数据框中
问题描述
我正在尝试将本地文件夹中的 tsv 文件合并到 pandas 数据框中。我正在尝试遍历文件夹并将它们附加到数据框。这是我到目前为止所尝试的:
bigdf=[]
for file in os.listdir(r'C:\Users\xxxx'):
print(file)
df = pd.read_csv(r'C:\Users\xxxx\xxxx\' + file, sep='\t')
bigdf.append(df)
'file' 只给我文件名而不是文件本身的内容。第 4 行完全不工作。有谁知道如何以附加内容的方式循环文件?
解决方案
您的代码似乎是正确的,但您可以尝试这样的事情:
import pathlib
rootdir = pathlib.Path(r'C:\Users\xxxx')
data = []
for file in rootdir.glob('*.tsv'):
print(file)
df = pd.read_csv(file, sep='\t')
data.append(df)
bigdf = pd.concat(data) # or pd.concat(data, axis='columns')
推荐阅读
- css - 在 Bootstrap 列中需要帮助
- vue.js - vue - 文本字段绑定值不反映实际值
- javascript - React Native 在静态 navigationOptions 中使用 this.props
- shell - 将 Org Babel 的 src 中的错误重定向到结果
- angular - 将monorepo angular 8应用程序部署到firebase时出现rxjs错误
- asp.net-mvc - DNN 9 MVC 模块中的内存泄漏
- php - (太多)导致问题的视图
- python - 如何将序列化示例的数据集直接写入 tfrecords 文件?
- bash - Bash创建一个变量除以_的路径并检查是否存在
- sql - 将一列总和的值与同一表的另一列进行比较