python - 使用 pandas 在 python 中加载多个数据集
问题描述
我想要一个独特的数据集,比如一个包含我所有数据的单个 .csv 文件。
问题:整个数据集分为 22 个文件夹,每个用户一个(见下图),然后,对于每个用户,有 7 个 .csv 文件对应每个用户的统计数据。
我想将所有这些数据集合并为一个,可能带有指示用户(用于行)的索引。图片是这些:
https://i.stack.imgur.com/uX0dc.png
对于每个用户:
https://i.stack.imgur.com/xZazG.png
我试图在下面写一个想法的代码;我想为所有用户插入一个,用“DataPaper/user_i.sleep.csv”更改路径,我不知道该怎么做,因为我不掌握python。还添加了其他功能,不仅是“sleep.cvs”
解决方案
如果我理解,您正在尝试读取多个数据帧并连接。但是你要避免写同样的句子。这不完全是解决方案,但您可以执行以下操作:
#this create a list of users
userList = [f"user_{i}" for i in range(1,22)]
#read all df
dfList = []
for user in userList:
thisDF = pd.read_csv(f"DataPaper/{user}/sleep.csv")
dfList.append(thisDF)
result = pd.concat(dfList,keys = userList)
如果这不能正常工作,请告诉我!干杯!
推荐阅读
- linux - 使用 Canon ImageClass D1320 打印机设置 CUPS,CUPS 无法识别?
- css - 如何正确在图像上使用绝对和相对定位?
- java - infixToPostfix 算法但没有操作优先级
- java - 导航抽屉活动未加载所有片段
- powershell - 获取电子邮件组成员的 PowerShell 命令 - Get-ADGroupMember 不起作用
- c# - 删除 DirectoryName 的一部分
- laravel - 通过 app() 获取/迭代 laravel 服务容器中的数据
- swift - SwiftUI - 将图像保存到共享表会导致图像保存模糊/低分辨率
- python-3.x - 为什么我安装的 python 模块没有在脚本中导入?
- github - 使用 gh-pages 工作树时,如何从另一台计算机部署我的站点?