python - 如何根据 MultiIndex 的一部分将 DataFrame 拆分为多个 DataFrame?
问题描述
对于一个项目,我正在使用 BeautifulSoup 为我的大学抓取一些表格调度数据,然后使用 pandas.read_html() 将其读入 DataFrame。但是,数据位于一个大表中,该表使用两个标题在视觉上分成多个表:一个大学标题(即“工程学院”),然后是每一列的标题(即“课程”、“开始”)。
前任:
工程学院
课程 | 开始 | 结束 | ...
Pandas 正确地将标题解析为 MultiIndex,其中每个索引元组的第一部分是学院,第二部分是列标题。但是,我想要多个具有单列索引的 DataFrame,由大学分隔。我该怎么做这样的事情?
解决方案
如果我理解正确,它是大学名称的多级索引,后跟列,您想按大学名称拆分。
Assuming df is your multiindex column dataframe,
di = {}
for i in df.columns.levels[0]:
di[i] = df[i]
这将创建一个包含大学键值对和相应数据框的字典
推荐阅读
- sql - 在表名称中使用连字符 (-) 创建 Hive 表
- c# - 我没有收到发送到 SignalR Group 的消息
- c# - 如何在逗号分隔的字符串集中填充所有字符串
- docker - NVIDIA Jetson Nano 上的 Google AutoML Vision 导出模型
- ios - 如何在 Swift 中设置时区
- java - Println 有两个条件
- java - 将 12 字符转换为长
- f# - 如何在 F# 中找到数组的第一个 NaN?
- python - 如何在codeigniter中调用python?
- android - 如何从 Android(kotlin)中 Firebase 提供的照片 uri 中检索和存储用户个人资料图片?