python - 显示带有比例和填充的条形图不起作用
问题描述
我正在使用plotnine绘制一些图。当我尝试显示比例条形图而不是计数时,该fill
参数变得无用。我注意到删除group=1
参数有助于让fill
参数再次“活跃”。但是,如果没有group=1
参数,则无法正确计算比例。
这是我的功能:
def plot_churn(df_):
color_dict = {
'Stayed': 'green',
'Churned': 'red'
}
myplot = ggplot(data=df_, mapping=aes(x='Flag_Churned', fill='Flag_Churned'))
myplot += geom_bar(mapping=aes(y="stat(prop)", group=1))
myplot += theme(subplots_adjust={'right': 0.71})
myplot += facet_wrap('Flag_Treat')
myplot += scale_fill_manual(color_dict)
myplot += scale_y_continuous(labels=percent_format())
print(myplot)
例如,当使用以下 pandas DataFrame 时:
data = {'Churn': [0,0,0,1,1,0,1,1], 'Flag_Treat': ['treated','treated','treated','treated','not treated','not treated','not treated','not treated'],
'Flag_Churned': ['Stayed', 'Stayed', 'Stayed', 'Churned', 'Churned', 'Stayed', 'Churned', 'Churned']}
df = pd.DataFrame(data=data)
结果输出没有被“Flag_Churned”填充:
我究竟做错了什么?
解决方案
问题是stat(prop)
计算每个方面的道具。虽然设置group
美学会给你正确的道具,但它会覆盖分组fill
。拥有 R 背景,我知道如何在 R 中即时进行此计算。但是,R 中建议的更简单的方法和大部分时间是在将数据传递给之前聚合您的数据ggplot
并使用geom_col
代替geom_bar
:
from mizani.formatters import percent_format
from plotnine import *
import pandas as pd
import numpy as np
data = {'Churn': [0,0,0,1,1,0,1,1], 'Flag_Treat': ['treated','treated','treated','treated','not treated','not treated','not treated','not treated'],
'Flag_Churned': ['Stayed', 'Stayed', 'Stayed', 'Churned', 'Churned', 'Stayed', 'Churned', 'Churned']}
df = pd.DataFrame(data=data)
df_.group_by(['Flag_Churned', 'Flag_Treat']).agg(len)
color_dict = {
'Stayed': 'green',
'Churned': 'red'
}
def plot_churn(df_):
color_dict = {
'Stayed': 'green',
'Churned': 'red'
}
df_ = df_.groupby(['Flag_Churned', 'Flag_Treat']).agg(len)
df_ = df_.groupby(level=0).apply(lambda x: x / float(x.sum())).reset_index()
myplot = ggplot(data=df_, mapping=aes(x='Flag_Churned', y='Churn', fill='Flag_Churned'))
myplot += geom_col()
myplot += theme(subplots_adjust={'right': 0.71})
myplot += facet_wrap('Flag_Treat')
myplot += scale_fill_manual(color_dict)
myplot += scale_y_continuous(labels=percent_format())
print(myplot)
plot_churn(df)
推荐阅读
- javascript - 播放框架删除请求
- php - 一旦文本框的值存储在 DB 中就禁用文本框 - PHP
- selenium-webdriver - 字符串和 for (Selenium)
- javascript - 构建从 API 提供的动态表单数据
- python-3.x - Ubuntu Core 与 Miniconda 中的 Sudo x chroot 冲突
- javascript - Lodash sortBy 以随机顺序返回元素(未排序)
- css - Firefox 中的 CSS 缩放属性
- django - 安装的 django-cors-headers 仍然发生跨源图像错误
- c# - Unity -> Android 通信:在嵌入时调试 Android Java 插件
- css - CSS 网格在 Safari 中不起作用