首页 > 解决方案 > mlr3 中的 CV 或训练/预测

问题描述

在 Patrick Schratz 的一篇文章“交叉验证 - 训练/预测”的误解中

https://mlr-org.com/docs/cv-vs-predict/

提到:

(a) CV 用于评估模型的性能。

(b) 训练/预测是为了创建最终预测(你的老板可能会用它来做出一些决定)。

这意味着在mlr3中,如果我们在学术界,需要发表论文,我们需要使用CV,因为我们打算比较不同算法的性能。而在工业中,如果我们的计划是训练一个模型,然后必须一次又一次地使用工业数据进行预测,我们需要使用 mlr3 提供的训练/预测方法吗?

这是我完全选错的东西吗?

谢谢

标签: mlr3

解决方案


如果你想对模型的表现做出陈述,你总是需要一份简历。

如果要使用模型对未知数据进行预测,请进行单次拟合,然后进行预测。

所以在实践中,你需要两者:CV +“train+predict”。

PS:您的帖子并不适合 Stackoverflow,因为它与编码问题无关。有关统计问题,请参阅https://stats.stackexchange.com/

PS2:如果您谈论帖子,请附上链接。在这种情况下,我是该帖子的作者,但大多数其他人可能不知道您在说什么;)


推荐阅读