首页 > 解决方案 > Python 中的超参数优化与单独的验证集

问题描述

我正在尝试优化Python 中随机森林回归器的超参数。

我有 3 个单独的数据集:训练/验证/测试。因此,我不想使用交叉验证方法,而是想使用特定的验证集来调整超参数,即这个 stackoverflow 帖子中描述的“第一种方法” 。

现在,sklearn有一些很好的内置方法可以使用交叉验证进行超参数优化(例如本教程),但是如果我想使用特定的验证集来调整我的超参数呢?是否仍然可以使用像RandomizedSearchCV这样的方法?

此外,我的训练数据相当大。是否可以从该训练数据中随机采样以进行超参数优化,然后一旦找到最佳超参数就可以在整个数据集上进行训练?否则重复的优化训练评估周期可能需要很长时间......

标签: pythonmachine-learningscikit-learn

解决方案


推荐阅读