首页 > 解决方案 > ggplot2 中的 stat_summary_bin 如何处理?

问题描述

我想知道当我们使用参数时 stat_summary_bin 如何作用 bin bin

ggplot(df, aes(x=x,y=y)) +
               stat_summary_bin(fun='mean', bins=100,
               color='orange', size=2, geom='point') + geom_smooth(method='lm') + theme_minimal() 

它是否将其x-axis分成相等的宽度?或者每个 bin 是否有相同数量的观察值?

我认为stat_summary_bin将 x 轴分成等距的箱。但是下面将其绘制为上述代码的结果,并且看起来它在 x 轴上的间距并不相等。 stat_summary_bin

标签: rggplot2binning

解决方案


在您的示例代码stat_summary_bin中,将使 20 个箱沿 x 轴等距分布。然后,它将根据mean()该 bin 内发生的所有观察结果为每个 bin 绘制 1 个 y 轴点。

您可以在下图中观察到这种行为

library(tidyverse)
iris %>% 
  ggplot(aes(x=Sepal.Length,y=Sepal.Width)) +
  stat_summary_bin(fun='mean', bins=20,
                   color='orange', size=2, geom='point')+
  geom_point()

在有无geom_point()开启的情况下运行。

https://ggplot2.tidyverse.org/reference/stat_summary.html


推荐阅读