首页 > 解决方案 > R - Logistic 和 Gompertz 曲线中的非线性最小平方误差

问题描述

我正在研究变量 y 的模型,我打算在其中使用时间作为解释变量。我选择了 Gompertz 和逻辑曲线作为候选者,但是当我尝试估计系数时(同时使用 nls 和 nls2),我最终会得到不同的错误(奇异性或步长因子降低到“minFactor”以下)。我真的很感激任何帮助。这是我的代码和 info 对象的 deput 版本。

我根据http://www.metla.fi/silvafennica/full/sf33/sf334327.pdf中的标准选择了初始值

library(nls2)

> dput(info)
structure(list(y = c(0.308, 0.279, 0.156, 0.214, 0.224, 0.222, 
0.19, 0.139, 0.111, 0.17, 0.155, 0.198, 0.811, 0.688, 0.543, 
0.536, 0.587, 0.765, 0.667, 0.811, 0.587, 0.617, 0.586, 0.633, 
2.231, 2.202, 1.396, 1.442, 1.704, 2.59, 2.304, 3.026, 2.7, 3.275, 
3.349, 3.936, 9.212, 8.773, 6.431, 6.983, 7.169, 9.756, 10.951, 
13.938, 14.378, 18.406, 24.079, 28.462, 51.461, 46.555, 39.116, 
43.982, 41.722), t = 1:53), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -53L))

summary(gomp_nls <- nls2(y ~ alpha*exp(-beta*exp(-gamma*t)), 
                 data = info, 
                 start = list(alpha = 40, beta = 4.9, gamma = 0.02), 
                 algorithm = "default")
        )

summary(logist_nls <- nls2(y ~ alpha/(1+beta*exp(-gamma*t)), 
                          data = info, 
                          start = list(alpha = 40, beta = 128, gamma = 0.02), 
                          algorithm = "default"))
        )

我会很感激任何帮助

标签: rnlsnon-linear-regressionconvergence

解决方案


"default"算法nls2是使用nls. 您想指定"brute-force"或使用其他算法之一来查找初始值。起始值应该是两行的数据框,这样它将填充以潜在起始值定义的超立方体。

然后,它将评估每个起始值的残差平方和,并返回公式给出最小平方和的起始值。

如果您发现返回的结果nls2在您定义的区域的边界处,则放大该区域并重试。(如果返回的起始值足够好,您可能不需要此步骤。)

最后nls使用您找到的起始值运行。

library(nls2)

## 1

fo1 <- y ~ alpha*exp(-beta*exp(-gamma*t))
st1 <- data.frame(alpha = c(10, 100), beta = c(1, 100), gamma = c(0.01, 0.20))
fm1.0 <- nls2(fo1, data = info, start = st1, algorithm = "brute-force")

fm1 <- nls(fo1, data = info, start = coef(fm1.0))

## 2

fo2 <- y ~ alpha/(1+beta*exp(-gamma*t))
st2 <- data.frame(alpha = c(10, 1000), beta = c(1, 10000), gamma = c(0.01, 0.20))
fm2.0 <- nls2(fo2, data = info, start = st2, algorithm = "brute-force")

fm2 <- nls(fo2, data = info, start = coef(fm2.0))

# plot both fits

plot(y ~ t, info)
lines(fitted(fm1) ~ t, info, col = "blue")
lines(fitted(fm2) ~ t, info, col = "red")

截屏

笔记

请注意,对于显示的数据,这两个 2 参数指数模型非常适合,因此如果您只对它呈指数上升的范围感兴趣,那么这些可能是可以考虑的替代方案。(下面的第一个更好,因为系数彼此更相似。第二个可能存在缩放问题。)

fm3 <- nls(y ~ a * exp(b/t), info, start = c(a = 1, b = 1))
fm4 <- nls(y ~ a * t^b, info, start = c(a = .001, b = 6))

推荐阅读