首页 > 解决方案 > R中的TSLM函数

问题描述

我目前在 R 中运行 TSLM 函数,我正在创建一个基于回归的模型,该模型包含外部信息,例如天气和马铃薯价格。我从创建虚拟变量开始,但是建议我将温度作为连续变量合并,因为数据会因分类而丢失。虽然我没有收到错误消息,但我的预测错误有点大,所以我想知道我是否正确地这样做了。

我的代码如下:

x <- as.data.frame(cbind(month.dummies[, -12], df.Data$`Difference in Temp`, df.Data$`Potato price`, df.Data$`Quadratic.Term.Potatoes`, df.Data$`Quadratic.Term.Temp`))
y <- df.Data$Demand
nTotal <-length(y)
nValid <- 12
nTrain <- nTotal - nValid
xTrain <- x[1:nTrain,]
yTrain <- y[1:nTrain]
xValid <- x[(nTrain + 1):nTotal, ]
yValid <- y[(nTrain + 1):nTotal]

formula <- as.formula(paste("yTrain", paste(c("trend", colnames(xTrain)), collapse = "+"),
                            sep = "~"))

Data.tslm <- tslm(formula, data = xTrain, lambda = "auto", h = 12)
Data.tslm.pred <- forecast(Data.tslm, newdata = xValid)

因此,当我尝试绘制此图时,我的时间序列似乎被扭曲了。

在此处输入图像描述

这表示实际的时间序列

然而,当我绘制图表时,时间序列的第一个值似乎超过 100,000,我似乎无法弄清楚为什么。

在此处输入图像描述

任何帮助将不胜感激,因为我完全被困住了。如果我忽略了某些事情,请指出我正确的方向。

亲切的问候

标签: rtime-seriesregressionlinear-programmingforecast

解决方案


推荐阅读