首页 > 解决方案 > 如何在 XGBRegressor 中选择 'n_estimators' 和 'seed' 的值?

问题描述

我只知道线性回归,其他一无所知。任何速记解释或技巧都可以。

标签: machine-learningregressiondata-sciencerandom-forestxgboost

解决方案


seed只是为算法添加随机性的随机数。把你的幸运号码放在那里。

n_estimators是一个超参数,用于确定在集成模型中构建了多少树/估计器。由于 Gradient Boosting 算法的性质,你使用的越多,它就越准确。不利的一面是,规模越大n_estimators,训练所需的时间就越长,并且可能会过度拟合您的训练数据,但同样考虑到算法的性质,它可能不会。

另一件n_estimators需要考虑的事情是,你可以在没有太多估计量(即 300 或 500)的情况下获得一个好的分数,并且在那之后,更大的估计量(即 2000)只会增加潜在的过拟合。


推荐阅读