machine-learning - 如何在 XGBRegressor 中选择 'n_estimators' 和 'seed' 的值?
问题描述
我只知道线性回归,其他一无所知。任何速记解释或技巧都可以。
解决方案
seed
只是为算法添加随机性的随机数。把你的幸运号码放在那里。
n_estimators
是一个超参数,用于确定在集成模型中构建了多少树/估计器。由于 Gradient Boosting 算法的性质,你使用的越多,它就越准确。不利的一面是,规模越大n_estimators
,训练所需的时间就越长,并且可能会过度拟合您的训练数据,但同样考虑到算法的性质,它可能不会。
另一件n_estimators
需要考虑的事情是,你可以在没有太多估计量(即 300 或 500)的情况下获得一个好的分数,并且在那之后,更大的估计量(即 2000)只会增加潜在的过拟合。
推荐阅读
- curl - 是否有与 curl 或 wget 相反的方式将目录上传到 webdav 服务器
- c++ - 在 C++ 运行时错误中出现运行时错误:在 Leetcode 中添加无符号偏移量
- javascript - 根据给定值通过键过滤对象
- python - Pyspark如何过滤RDD Map Function中的数据框?
- r - 如何使用 dplyr 计算二分变量的值比例?
- drupal-7 - 如何在 Drupal & 的特定内容类型中显示(当前:用户)可用用户点?
- node.js - 如何设置猫鼬模式,使其只能修改一次?
- reactjs - 如何获取 json 对象以分隔数组 React
- symfony - Symfony:在没有请求的情况下覆盖默认语言环境
- sql - SQL 如何从单个列中的所有值创建 JSON 数组