r - 我对预测随机森林中的新数据有一些疑问
问题描述
我有一些问题,当对 X_train、y_train、X_test、y_test 使用随机森林时。
训练数据时,我这样使用:
rf_train <- randomForest(y = y_train, x = X_train, ntree = 1000)
但是,我有一个问题。哪一个对预测新数据是正确的。:
1.
随机森林(y = y_test,x = X_test,ntree = 1000)
2.
预测(rf_train,X_test)
请告诉我哪一个是正确的。
解决方案
在这种情况下,您可以结合使用函数签名以及您的直觉(和文档)来回答您自己的问题。predict
您应该使用该函数将随机森林模型应用于新的测试数据。正如你所说的那样,predict
将模型输出作为第一个参数randomForest
。第二个参数是包含测试数据的数据框或矩阵,每个测试用例一行。正如文档所述,至少在使用回归构建的随机森林模型的情况下,输出是一个响应向量,每个测试用例/测试用例的输入矩阵/数据框的行的一个响应。
推荐阅读
- javascript - 将 props 传递给 React 组件
- android - 无法解决:firebase-auth-15.0.0
- reactjs - 如何处理组件中的数据依赖关系
- android - 我正在尝试通过单击当前 RecyclerView 中的按钮来加载 RecyclerView
- python - IMAPLIB“初始值必须是 str 或 none,而不是字节”错误
- javascript - PHP 无法与 html、js/jquery 和 ajax 一起正常工作
- version - Anylogic 将 ALP 从版本 8.3.2 转换为 7.1.2
- oracle - 如何在表 1 中显示每年的记录,然后将计算值自动关联到第二个表中?
- html - 如果我缩小页面,我的网页不会居中,有什么提示吗?
- javascript - 在电子事件处理程序中执行 JavaScript 方法