首页 > 解决方案 > 将文件夹中 tsv 的内容合并到数据框中

问题描述

我正在尝试将本地文件夹中的 tsv 文件合并到 pandas 数据框中。我正在尝试遍历文件夹并将它们附加到数据框。这是我到目前为止所尝试的:

bigdf=[]
for file in os.listdir(r'C:\Users\xxxx'):
    print(file)
    df = pd.read_csv(r'C:\Users\xxxx\xxxx\' + file, sep='\t')
    bigdf.append(df)

'file' 只给我文件名而不是文件本身的内容。第 4 行完全不工作。有谁知道如何以附加内容的方式循环文件?

标签: pandasloopscsvdirectoryappend

解决方案


您的代码似乎是正确的,但您可以尝试这样的事情:

import pathlib

rootdir = pathlib.Path(r'C:\Users\xxxx')

data = []
for file in rootdir.glob('*.tsv'):
    print(file)
    df = pd.read_csv(file, sep='\t')
    data.append(df)

bigdf = pd.concat(data)  # or pd.concat(data, axis='columns')

推荐阅读