python - 如何使用python准备这种形式的数据
问题描述
我有以下格式的excel数据文件
我想按以下格式准备数据:
我可以使用 python 做到这一点吗?
解决方案
如果你正在学习数据科学,我建议你使用Pandas,这是 Python 数据科学堆栈中非常重要的库。Pandas 可以读取包括 excel 在内的多种文件格式,并将它们转换为名为DataFrame
. 然后,您可以对DataFrame
对象执行许多操作,包括统计、绘图和分析。您正在寻找的一般技术称为反透视,它可用于DataFrame
. 这是一个代码片段,请随意更改它以满足您的需求。
import pandas as pd
df_orig = pd.read_excel("YOUR_FILE.xlsx")
attributes = ["color", "liquid"]
df_new = df_orig.melt(id_vars=attributes)
顺便说一句,您应该真正考虑要在 的id_vars
参数中包含哪些原始变量melt
。通常,只有分类变量用于透视和反透视。因此,在您的示例中,我会使用color
and ,但如果它是数字变量liquid
,我可能不会使用。如果它是分类序数变量,则size
可以使用。size
推荐阅读
- r - 在数据表的单元格中显示多个字符串,可以通过单击它们来删除这些字符串
- parallel-processing - 使用 CUDA/thrust 在数组中设置每个 float4 的一个元素
- minecraft - 如果半径内有某个块如何执行
- python - 在 keras 回调文件名中包含时代和型号
- c++ - teensy3.2 上的闪烁 led 与 arm 编程
- operating-system - APU(例如apple m1 mac)上的内存复制是否使用GPU特定的宽向量指令?
- reactjs - Reactjs 中的 AWS Cognito 身份验证
- asp.net - Blazor WASM RuntimeError 内存超出范围
- docker - docker 文件的 docker build 问题:Jobber 在添加包后无法工作
- javascript - 我在设置我的 jest 配置时遇到问题 react native 无法导入组件