首页 > 解决方案 > 如何使用python准备这种形式的数据

问题描述

我有以下格式的excel数据文件

在此处输入图像描述

我想按以下格式准备数据: 在此处输入图像描述

我可以使用 python 做到这一点吗?

标签: pythondata-science

解决方案


如果你正在学习数据科学,我建议你使用Pandas,这是 Python 数据科学堆栈中非常重要的库。Pandas 可以读取包括 excel 在内的多种文件格式,并将它们转换为名为DataFrame. 然后,您可以对DataFrame对象执行许多操作,包括统计、绘图和分析。您正在寻找的一般技术称为反透视,它可用于DataFrame. 这是一个代码片段,请随意更改它以满足您的需求。

import pandas as pd


df_orig = pd.read_excel("YOUR_FILE.xlsx")

attributes = ["color", "liquid"]
df_new = df_orig.melt(id_vars=attributes)

顺便说一句,您应该真正考虑要在 的id_vars参数中包含哪些原始变量melt。通常,只有分类变量用于透视和反透视。因此,在您的示例中,我会使用colorand ,但如果它是数字变量liquid,我可能不会使用。如果它是分类序数变量,则size可以使用。size


推荐阅读