首页 > 解决方案 > 使用 Pandas 导入多个数据框

问题描述

我正在尝试通过一个函数将多个数据集导入到单个数据框中。

# function to import each of the new datasets 
def csvImport(yearOfDataset):
import glob, os
for items in yearOfDataset:
    # dataset name 
    ds = pd.concat(map(pd.read_csv, glob.glob(os.path.join("PSNI_StreetCrime_"+str(yearOfDataset)),"*.csv")))

我想将参数传递给函数,如下所示,因为这意味着我可以更快地为我拥有的多个文件夹调用它;文件夹名称遵循模式 ChildFolder_YYYY

csvImport('2014')

运行上述内容时,这些是返回的错误。

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-61-bba2086ac576> in <module>()
----> 1 csvImport('2014')

<ipython-input-56-0459a8272784> in csvImport(yearOfDataset)
  2 def csvImport(yearOfDataset):
  3     import glob, os
----> 4     sd = pd.concat(map(pd.read_csv, glob.glob(os.path.join("Datasets/PSNI_StreetCrime_"+yearOfDataset),"*.csv")))

TypeError: glob() takes 1 positional argument but 2 were given

我是 Pandas 的新手,对 Python 来说是半新手,因此非常感谢您的帮助,我尝试过的各种更改均未成功。

标签: pythonpandasdataframe

解决方案


推荐阅读