r - 为分箱数据生成置信区间 - ggplot2
问题描述
我正在尝试生成一个非常嘈杂且大的基础数据集的程式化版本和回归线。为此,我制作了箱或不同宽度的箱,试图使每个箱中的观察数量相等,如下所示:
library(mltools)
complete$mtgHours_evenBins <- bin_data(complete$mtgHoursPerUser_mean, bins=500, binType = "quantile")
然后我得到垃圾箱的中点并得到新的聚合方法,如下所示:
complete$mtgHours_evenBins_midpoints <- midpoints(complete$mtgHours_evenBins)
#generate new aggregated means after grouping by new bins
complete <- complete %>%
dplyr::group_by(mtgHours_evenBins) %>%
dplyr::mutate(even_binned_rev_2016_log_mean = mean(rev_2016_log))
我可以像这样绘制图表:
ggplot(data = complete, aes(x = mtgHours_evenBins_midpoints, y=even_binned_rev_2016_log_mean))+
geom_point(color='blue') +
stat_smooth(data=complete, aes(x = mtgHours_evenBins_midpoints, y = binned_rev_2016_log_mean),
method = "lm", formula = y ~ x + I(x^2), size = 1, color = "red", se = TRUE)
但是,无论我使用 stat_smooth 还是 geom_smooth,都不会生成置信区间。这是因为每个观测值(bin)都包含相同数量的观测值吗?有什么我想念的吗?
解决方案
推荐阅读
- yaml - 无法将 yaml 文件转换为 toml 文件
- java - 如何让休眠以急切地获取 EmbeddedId?
- git - Git 维护日志
- vba - 这个长公式导致语法错误有解决方案吗?
- keras - Seq2seq 推理模型仅预测起始标记
- python - 在python中替换JSON键值和分解值
- python - 如何在 BeautifulSoup 中获取嵌套标签的所有元素?
- ios - 在重新排序单元格时,同时使用 NSDiffableDataSourceSnapshot 和 NSDiffableDataSourceSectionSnapshot 可能会导致 UICollectionView 中的断言失败
- react-native - 最近我开始使用 react-native-modalize 但遇到了单元测试的问题。如何对 react-native-modalize 进行单元测试
- go - golang,测试中的 goroutines 竞争条件