首页 > 解决方案 > 从多索引数据框中选择列,例如制作直方图

问题描述

这是我第一次使用多索引数据框。我有一个看起来像这样的数据框(小例子):

import random
col3=[0,0,0,0,2,4,6,0,0,0,100,200,300,400]
col4=[0,0,0,0,4,6,8,0,0,0,200,900,400, 500]

d = {'Unit': [1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 6, 6, 6, 6], 
 'Year': [2014, 2015, 2016, 2017, 2015, 2016, 2017, 2017, 2014, 2015, 2014, 2015, 2016, 2017], 'col3' : col3, 'col4' : col4 }
df = pd.DataFrame(data=d)
df.groupby(['Unit', 'Year']).sum()

df = df.groupby(['Unit', 'Year']).sum()

df['mask'] = (df.groupby(level=0, group_keys=False)
                  .apply(lambda x: x.col3/x.col4.shift()))

df['mask'] = df['mask'].fillna(0) 

现在我想从掩码列中的值制作一个直方图,如果不先制作一个列表,这可能吗?

我是这样做的:

values = [x for x in df['mask']]
plt.hist(values)

但我想最好在没有中间列表步骤的情况下做到这一点。

谢谢,

标签: pythonpandashistogrammulti-index

解决方案


此处的列表理解不是必需的,只需将 Series 传递给plot

plt.hist(df['mask'])

或使用Series.plot.hist

df['mask'].plot.hist()

推荐阅读