首页 > 解决方案 > 波士顿住房数据使用 R 的均方根误差 (RMSE):

问题描述

我感谢您为此提供的任何形式的想法或帮助。

我已经提交了一项包含波士顿住房数据的任务。

目标是使用 randomForest 进行预测。要优化的量是 RMSE。

我对如何进行 RMSE 感到困惑。请帮助伙计们

谢谢

我已经尝试遵循 RMSE 公式,并且我已经完成了基本想法,但我没有取得任何进展。请指导

谢谢

  raw.data <- read.csv("Boston Housing data.csv", header = T, sep = "")
  fit1<-lm(raw.data$MEDV~.,data = raw.data)
  RMSE<- sqrt(mean((raw.data-fit1)^2),na.strings="?")

Ops.data.frame(raw.data, fit1) 中的错误:长度为 12 的列表没有意义

标签: rmachine-learningrandom-forest

解决方案


看起来您正在尝试从整个raw.data数据框中减去拟合值。更新您的 RMSE 行应该可以修复它:

RMSE<- sqrt(mean((raw.data$MEDV - fit1$fittedvalues)^2),na.strings="?")

推荐阅读