python - 使用 Pandas 导入多个数据框
问题描述
我正在尝试通过一个函数将多个数据集导入到单个数据框中。
# function to import each of the new datasets
def csvImport(yearOfDataset):
import glob, os
for items in yearOfDataset:
# dataset name
ds = pd.concat(map(pd.read_csv, glob.glob(os.path.join("PSNI_StreetCrime_"+str(yearOfDataset)),"*.csv")))
我想将参数传递给函数,如下所示,因为这意味着我可以更快地为我拥有的多个文件夹调用它;文件夹名称遵循模式 ChildFolder_YYYY
csvImport('2014')
运行上述内容时,这些是返回的错误。
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-61-bba2086ac576> in <module>()
----> 1 csvImport('2014')
<ipython-input-56-0459a8272784> in csvImport(yearOfDataset)
2 def csvImport(yearOfDataset):
3 import glob, os
----> 4 sd = pd.concat(map(pd.read_csv, glob.glob(os.path.join("Datasets/PSNI_StreetCrime_"+yearOfDataset),"*.csv")))
TypeError: glob() takes 1 positional argument but 2 were given
我是 Pandas 的新手,对 Python 来说是半新手,因此非常感谢您的帮助,我尝试过的各种更改均未成功。
解决方案
推荐阅读
- c# - 用变量替换 Typing
- c++ - 代码只打印一个倍数而不是 3
- reactjs - 如何在本机反应中记录 SQLite 错误
- python - 如何在 matplotlib 中为线图迭代的子集设置不同的颜色?
- mongodb - 使用GraphQL,Springboot,MongoDB。json是1000+行深度嵌套。而不是更新整个文档,需要在任何位置更新特定的key-value
- javascript - 数组(推送 - 对象)未按预期工作
- u-boot - 什么是 bootaux 命令?
- python - rawpy.Params 中 output_bps 的含义
- java - 是否建议将 Arraylist 转换为 Reactor 的 Flux 用于处理数据?
- google-chrome - 如何在 puppeteer 中获取 (http) 协议版本?