首页 > 解决方案 > sklearn 中随机森林分类器中组件树的数量(或估计器的数量)如何影响其准确性?

问题描述

当我们增加随机森林分类器中的估计器数量时,准确性是否必然会提高?

标签: machine-learningscikit-learnrandom-forest

解决方案


决策树倾向于过度拟合训练数据(它们在样本外数据上有很大的差异)。随机森林旨在通过创建一组独立的决策树来克服这一困难,这些决策树都有很大的个体差异,但是当投票过程发生时,它们往往在看不见的数据上表现更好。

鉴于您提供给我们的信息,无法概括准确性和给定信息之间的关系n_estimators,但您可以预期它是积极的,并且会以略微下降的速度增加。也就是说,树越多越好,但在某些时候,添加更多树的效果将变得可以忽略不计。

您可以尝试使用GridSearchCVwithparam_grid={'n_estimators':range(1, 101)}查看将更多估计器添加到随机森林的效果。

最后,你可能应该在这个论坛上问这种问题。查看@desertnaut 对您的帖子的评论。


推荐阅读