首页 > 解决方案 > rep(X, times = ceiling(length(Y)/length(X))) 中的错误:尝试在交叉验证中复制“闭包”类型的对象以进行线性回归

问题描述

我想为我的练习预测 snp101。我不需要使用一个好的模型,只需要一个有效的模型,并返回我预测的收盘价与给定的某个日期之间的相关性。我需要为此编写一个函数,并且在函数中我想应用交叉验证过程以使用 poly() 找到最佳模型

我附上了我的数据是如何构建的解释。

论据:
每个公司都有 1 行的 data.frame。
符号包含公司的标准普尔符号,名称包含公司全名
每个日期都是一个单独的列,日期格式为 XYYYY.MM.DD

这很重要,因为我运行的代码适用于另一个数据帧的交叉验证,但不适用于这个。因此,我认为问题出在我的数据结构中。

这是我编写的代码,用于创建作为预测变量的结束值和作为预测变量的日期(时间:

  predicted <- data.frame(Symbol = data_2020$Symbol, predVal = 0)
  
  for (name in data_2020$Symbol) {
    tempData <- data.frame(date = c(1:7), close = as.numeric(data_2020[data_2020$Symbol == name,3:9])  ) 

我写了 7 天,因为我需要预测数据框最后一天之后的 7 天。

这是我尝试运行的交叉验证,但出现此错误:

rep(X, times = ceiling(length(Y)/length(X))) 中的错误:尝试复制“闭包”类型的对象。

当我尝试调试时,我认为它来自 lm 函数行。我很想知道我的数据/创建变量以返回此错误的预测有什么问题。

  n_data    = nrow(data_2020)
  max_poly  = 7 # The highest degree we'll fit
  mse       = rep(NA, max_poly) # MSE vector
  bic_value = rep(NA, max_poly) # BIC vector
  log_lik   = rep(NA, max_poly) # log likelihood vector
  predicted = matrix(rep(NA, max_poly*n_data), nrow = n_data) # Matrix for all predicted points, for all degrees
  
 for (j in 1:max_poly) {  ​# For each degree
    # Leave-one-out
    for (i in 1:n_data){
      # Fit the model for all data but one point
      m = lm(data_2020[-i,], formula = close ~ poly(date, j, raw = T)) 
      
      # Predict the left out point
      predicted[i, j] = predict.lm(m, newdata = data_2020[i,])
    }
    
    # Calculate cross-validated MSE
    mse[j] = mean((predicted[, j] - data_2020$close)^2)
    
    # Plot the model fitted with the full data
    p = ggplot(data = data_2020, aes(x = date, y = close)) +
      geom_point() + 
      geom_smooth(method = "lm", formula = y ~ poly(x, j, raw = T), se = F)
    show(p)
    
    # Calculate the full model
    m = lm(data_2020, formula = close ~ poly(date, j, raw = T))
    
    # Save the BIC value
    bic_value[j] = BIC(m)
    
    # Save the log likelihood
    log_lik[j] = logLik(m)
  } ```
  

标签: rlinear-regressionpredictioncross-validation

解决方案


推荐阅读