首页 > 解决方案 > R插入符号包,错误:请确保`y`是一个因子或数值

问题描述

我正在尝试使用 caret 包来交叉验证我制作的模型。它取决于 3 个变量,但我使用的数据集远不止这些。为了重现更精确的示例,我制作了变量 abcd 和 e,但仅使用 ab 和 c 进行预测。

a <- rnorm(10)
b <- rnorm(10)
c <- rnorm(10)
d <- rnorm(10)
e <- rnorm(10)
y <- rnorm(10)
df <- data.frame(a,b,c,d,e,y, stringsAsFactors=FALSE)

library(caret)
model <- train(
df$y ~ df$a + df$b + df$c, x = df,
method = "lm",
trControl = trainControl(
method = "cv", number = 10,
verboseIter = TRUE, 
))

这给出了错误:请确保y是一个因子或数值

我尝试了几种方法来改变 y 但没有运气。任何人都从经验中知道为什么这不起作用?我用谷歌搜索了几个小时,找不到完全相同的问题。

标签: rlinear-regressionmodelingcross-validationr-caret

解决方案


您应该使用公式(和参数data 参数,您将两者混合使用。因此,您可以使用以下公式:xy

model <- train(
    y ~ a + b + c, data = df,
    method = "lm",
    trControl = trainControl(
        method = "cv", number = 10,
        verboseIter = TRUE, 
    ))

(您不需要编写df$y,df$a等,因为您提供了data参数,因此 R 知道要查看该数据帧)


推荐阅读