python - Python 中的超参数优化与单独的验证集
问题描述
我正在尝试优化Python 中随机森林回归器的超参数。
我有 3 个单独的数据集:训练/验证/测试。因此,我不想使用交叉验证方法,而是想使用特定的验证集来调整超参数,即这个 stackoverflow 帖子中描述的“第一种方法” 。
现在,sklearn
有一些很好的内置方法可以使用交叉验证进行超参数优化(例如本教程),但是如果我想使用特定的验证集来调整我的超参数呢?是否仍然可以使用像RandomizedSearchCV这样的方法?
此外,我的训练数据相当大。是否可以从该训练数据中随机采样以进行超参数优化,然后一旦找到最佳超参数就可以在整个数据集上进行训练?否则重复的优化训练评估周期可能需要很长时间......
解决方案
推荐阅读
- java - 如何为java项目集成google分析以跟踪多个页面上的用户行为
- r - 如何在 RMarkdown 中为数学方程式自动编号?
- r - 根据 R 中的日期范围创建列
- android - 如何在Android屏幕上制作屏幕关闭按钮?
- node.js - 如何在 nodejs 上为 CLI 创建 .js 文件?
- swift - Swift 基于属性中的单个数组创建新数组
- python - 根据条件在熊猫数据框中创建列
- performance - 调整浏览器大小时,按钮未重新定位到图像中心
- c - main{} 括号上的语法错误,“预期的同时”?
- jenkins-pipeline - 在 Jenkinsfile 中发布工件名称和版本