r - R Randomforest未定义列问题
问题描述
我正在研究文本挖掘过程并使用随机森林将文本分类。我在处理我的文本后使用 caret 包。我拆分数据进行训练和测试,下面是相同的R代码:
traindata <- tdm_df[s,] # training set
testdata <- tdm_df[-s,] # testing set
rf.tfidf <- train(traindata[,c(1:69)], train[,70],
method = "rf", trControl = ctrl) # train random forest
rf.tfidf
当我运行最后一行时,出现以下错误:
Error in `[.data.frame`(train, , c(1:56)) : undefined columns selected
编辑1:更正后的下一个错误:
Error in train[1:5, ] : object of type 'closure' is not subsettable
我看到 term_sparse 给了我一个问题,可能是文本挖掘部分,我怎样才能改善我的结果?
不确定是什么问题。请帮忙!
解决方案
替换train[,70]
为traindata[,70]
:
rf.tfidf <- train(traindata[,c(1:69)], traindata[,70],
method = "rf", trControl = ctrl)
推荐阅读
- dependency-injection - 如何在 .net 核心依赖注入中自动注册服务?
- angular - 在 typescript 中监听 data-dismiss 触发的事件
- reactjs - 我怎样才能循环和显示专辑数据?
- typescript - 在 Pulumi 中,存在 pulumi.Output.apply 的等价物,但要转换 pulumi.Input 值?
- ios - UIImagePickerController 在视频仍在压缩时按时进入后台时完成拾取
- javascript - 如何从 Flask Blueprint 中的 HTML POST 变量构建动态路由
- java - 在 for 循环中使用迭代器从 ArrayList 中删除元素
- java - Zip 异步和同步 observables
- lua - Lua POST 请求包含垃圾
- excel - 循环工作簿并将动态范围复制到主工作簿