首页 > 解决方案 > 为什么我使用 randomForest 得到负 %var

问题描述

我正在尝试使用 randomForest 为我在 R 中的数据集拟合回归模型。我的数据集有 17 个分类自变量和 8 个数字自变量。因变量是数字。这是我的 r 脚本:

#view data structure
str(my.data2)


#Partition data to train and test
ind<-sample(2,nrow(my.data2),replace = TRUE, prob=c(0.8,0.2))
train <- my.data2[ind==1,]
test <- my.data2[ind==2,]

#Fitting the Random Forest Regression Model to the dataset
install.packages("randomForest")
library(randomForest)
set.seed(123)
regressor = randomForest(x = my.data2[1],
                     y = my.data2$`GPS Utilization Rate`,
                     ntree = 100)

这是我得到的结果,谁能帮我理解为什么我得到一个负的 % var 解释?我应该将所有分类变量更改为因子吗?谢谢,如果有人可以提供建议,我该如何改进模型!

回归器

Call:
 randomForest(x = my.data2[1], y = my.data2$`GPS Utilization Rate`,         ntree = 100) 
           Type of random forest: regression
                 Number of trees: 100
No. of variables tried at each split: 1

      Mean of squared residuals: 0.03384334
                % Var explained: -0.09

标签: r

解决方案


推荐阅读