machine-learning - sklearn 中随机森林分类器中组件树的数量(或估计器的数量)如何影响其准确性?
问题描述
当我们增加随机森林分类器中的估计器数量时,准确性是否必然会提高?
解决方案
决策树倾向于过度拟合训练数据(它们在样本外数据上有很大的差异)。随机森林旨在通过创建一组独立的决策树来克服这一困难,这些决策树都有很大的个体差异,但是当投票过程发生时,它们往往在看不见的数据上表现更好。
鉴于您提供给我们的信息,无法概括准确性和给定信息之间的关系n_estimators
,但您可以预期它是积极的,并且会以略微下降的速度增加。也就是说,树越多越好,但在某些时候,添加更多树的效果将变得可以忽略不计。
您可以尝试使用GridSearchCV
withparam_grid={'n_estimators':range(1, 101)}
查看将更多估计器添加到随机森林的效果。
最后,你可能应该在这个论坛上问这种问题。查看@desertnaut 对您的帖子的评论。
推荐阅读
- c++ - 如何将 float 转换为 int 去除小数点?
- ios - Xcode 12 编译 bitcode 需要很长时间(内部构建)
- c# - 从 datagridview 或 datatable 插入数据
- java - Kotlin 布局不适合屏幕
- tkinter - Tkinter 未装饰的窗口出现在所有桌面上
- python - 如何计算对象关键点相似度
- python - 没有名为“six.moves.urllib”的模块;'six.moves' 不是一个包
- c++ - 对于函数调用,用“行号”显示错误消息的最佳/正确方法是什么?& 'src 文件名' 在里面吗?
- javascript - 如何从对象数组中获取仅包含我想要的对象键的新数组?
- python - 这个比例是什么意思?