首页 > 解决方案 > R Randomforest未定义列问题

问题描述

我正在研究文本挖掘过程并使用随机森林将文本分类。我在处理我的文本后使用 caret 包。我拆分数据进行训练和测试,下面是相同的R代码:

traindata <- tdm_df[s,] # training set

testdata <- tdm_df[-s,] # testing set

rf.tfidf <- train(traindata[,c(1:69)], train[,70],
                  method = "rf", trControl = ctrl) # train random forest
rf.tfidf

当我运行最后一行时,出现以下错误:

Error in `[.data.frame`(train, , c(1:56)) : undefined columns selected

编辑1:更正后的下一个错误: Error in train[1:5, ] : object of type 'closure' is not subsettable

我看到 term_sparse 给了我一个问题,可能是文本挖掘部分,我怎样才能改善我的结果?

不确定是什么问题。请帮忙!

标签: rrandom-foresttext-mining

解决方案


替换train[,70]traindata[,70]

rf.tfidf <- train(traindata[,c(1:69)], traindata[,70],
              method = "rf", trControl = ctrl)

推荐阅读