首页 > 解决方案 > 使用 pandas 在 python 中加载多个数据集

问题描述

我想要一个独特的数据集,比如一个包含我所有数据的单个 .csv 文件。

问题:整个数据集分为 22 个文件夹,每个用户一个(见下图),然后,对于每个用户,有 7 个 .csv 文件对应每个用户的统计数据。

我想将所有这些数据集合并为一个,可能带有指示用户(用于行)的索引。图片是这些:

https://i.stack.imgur.com/uX0dc.png

对于每个用户:

https://i.stack.imgur.com/xZazG.png

我试图在下面写一个想法的代码;我想为所有用户插入一个,用“DataPaper/user_i.sleep.csv”更改路径,我不知道该怎么做,因为我不掌握python。还添加了其他功能,不仅是“sleep.cvs”

https://i.stack.imgur.com/r315i.png

标签: pythonpandasdataframecsvdataset

解决方案


如果我理解,您正在尝试读取多个数据帧并连接。但是你要避免写同样的句子。这不完全是解决方案,但您可以执行以下操作:

#this create a list of users
userList = [f"user_{i}" for i in range(1,22)] 

#read all df
dfList = []
for user in userList:
    thisDF = pd.read_csv(f"DataPaper/{user}/sleep.csv")
    dfList.append(thisDF)
    
result = pd.concat(dfList,keys = userList)

如果这不能正常工作,请告诉我!干杯!


推荐阅读