首页 > 解决方案 > 如何通过 fitdistrplus 包选择分布参数?

问题描述

library(fitdistrplus)
data(groundbeef)
serving <- groundbeef$serving
fitg <- fitdist(serving, "gamma")
res<-bootdist(fitg)#further accuracy estimate
#which parameter should be selected?
> summary(res)
Parametric bootstrap medians and 95% percentile CI 
Median       2.5%      97.5%
shape 4.04523398 3.41773958 4.80480936
rate  0.05495878 0.04632007 0.06587446
> res$fitpart$estimate
shape       rate 
4.00825257 0.05441911

bootdist()之后总是用来获得更准确的参数fitdis()

如上例,summary(res) 提供几个参数,res$fitpart$estimate提供一个参数,应该选择哪一个?

标签: rstatisticsfitdistrplus

解决方案


当您进行引导时,您会通过替换对数据进行采样,并重新估计参数。在这种情况下,您将分布拟合到从原始数据集中采样的数据集。

通过这些 N 个估计,您可以获得中位数和置信区间。

如果您想要最适合您的数据的参数,您需要从fitdist(serving, "gamma")


推荐阅读