r - 我应该用整个数据集调整学习器吗?
问题描述
最近在学习使用mlr3包,遇到了一些问题:
(1)我读了“交叉验证 - 训练/预测”的误解。这对我来说是这样的:作为嵌套采样的结果,我应该关注模型的平均无偏估计性能。对我来说,调优就是在训练集中添加 CV(即找到最佳的超参数和特征重要性等级),如下图所示。 但是,mlr3gallery 中的许多示例(例如,调整 SVM;调整图形)似乎用整个数据集调整他们的学习者,这让我感到困惑。使用所有数据来调整学习器是否合适?
(2)不知道有没有什么办法可以把Feature Selection和Model Tuning结合起来。我在 mlr feature-filtering-with-tuning中找到了该功能,但在 mlr3 中没有。我想管道图可能会有所帮助,但我找不到教程。
非常感谢!任何帮助将不胜感激!
解决方案
推荐阅读
- python - 它不通过数据
- django - 在 django admin 中限制外键的字段选择
- python - 跨多个进程训练模型时在 PyTorch 中使用 tensor.share_memory_() 与 multiprocessing.Queue
- c# - IRONPDF 需要 3 分钟将 html 转换为 PDF
- scala - Scala中RDD的直方图?
- bayesian-networks - 从带有张量流概率证据的贝叶斯网络采样
- algorithm - 用于为密码破解者提取列表子集的组合算法
- java - 如何正确编写“重定向”(Spring MVC + Security)
- sql - 在 SSRS 报告中过滤多维 OLAP 多维数据集,使用存储过程检索参数值
- c# - 无法使用位图下载图像