首页 > 解决方案 > 我应该用整个数据集调整学习器吗?

问题描述

最近在学习使用mlr3包,遇到了一些问题:

(1)我读了“交叉验证 - 训练/预测”的误解。这对我来说是这样的:作为嵌套采样的结果,我应该关注模型的平均无偏估计性能。对我来说,调优就是在训练集中添加 CV(即找到最佳的超参数和特征重要性等级),如下图所示。 数据分析计划 但是,mlr3gallery 中的许多示例(例如,调整 SVM调整图形)似乎用整个数据集调整他们的学习者,这让我感到困惑。使用所有数据来调整学习器是否合适?

(2)不知道有没有什么办法可以把Feature SelectionModel Tuning结合起来。我在 mlr feature-filtering-with-tuning中找到了该功能,但在 mlr3 中没有。我想管道图可能会有所帮助,但我找不到教程。

非常感谢!任何帮助将不胜感激!

标签: rmlr3

解决方案


推荐阅读