首页 > 解决方案 > 如何创建显示均值、中值和模式的海底小提琴图?

问题描述

有没有办法为 violinplot 添加均值和模式?我的一个列中有分类数据,下一列中有相应的值。我尝试研究 matplotlib 小提琴图,因为它在技术上提供了我正在寻找的功能,但它不允许我在 x 轴上指定分类变量,这在我查看每个类别的数据分布时至关重要。我添加了一个小表格来说明数据的形状。

plt.figure(figsize=10,15)
ax=sns.violinplot(x='category',y='value',data=df) 

在此处输入图像描述

标签: pythonseabornmeanmodeviolin-plot

解决方案


首先我们计算众数和均值:

import seaborn as sns
import pandas as pd
from matplotlib import pyplot as plt

df = pd.DataFrame({'Category':[1,2,5,1,2,4,3,4,2],
                   'Value':[1.5,1.2,2.2,2.6,2.3,2.7,5,3,0]})

Means = df.groupby('Category')['Value'].mean()
Modes = df.groupby('Category')['Value'].agg(lambda x: pd.Series.mode(x)[0])

您可以使用 seaborn 制作基本图,下面我使用inner=参数删除了内部箱线图,以便我们可以看到模式和含义:

fig, ax = plt.subplots()
sns.violinplot(x='Category',y='Value',data=df,inner=None)
plt.setp(ax.collections, alpha=.3)
plt.scatter(x=range(len(Means)),y=Means,c="k")
plt.scatter(x=range(len(Modes)),y=Modes)

在此处输入图像描述


推荐阅读