首页 > 解决方案 > 如何使用 plotnine 对堆积条进行排序

问题描述

我有以下dataframe

import pandas as pd
from plotnine import *

df = pd.DataFrame({
    'variable': ['gender', 'gender', 'age', 'age', 'age', 'income', 'income', 'income', 'income'],
    'category': ['Female', 'Male', '1-24', '25-54', '55+', 'Lo', 'Lo-Med', 'Med', 'High'],
    'value': [60, 40, 50, 30, 20, 10, 25, 25, 40],
})
df['variable'] = pd.Categorical(df['variable'], categories=['gender', 'age', 'income'])

我正在使用以下代码获取堆积条形图

(ggplot(df, aes(x='variable', y='value', fill='category'))
 + geom_col()
)

上面的代码取自这里

如何更改每个类别中的顺序。例如,我希望位于堆叠条age 1-24的底部age

标签: pythonpython-3.xpandasplotnine

解决方案


您可以使用pd.Categorical函数 with指定堆叠的列顺序ordered=True。此属性可确保在绘图过程中以您想要的方式保留类别顺序:

# Categories are shown in a top-down order, 
# so you must reverse 'ages' order to be shown in bottom-up fashion
cat_order = ['Female', 'Male', '55+', '25-54', '1-24', 'Lo', 'Lo-Med', 'Med', 'High']

df['category'] = pd.Categorical(df['category'], categories=cat_order, ordered=True)

推荐阅读