random-forest - 使用随机森林进行变量选择的合适方法
问题描述
我正在使用随机森林运行回归模型,并且我想选择一组仍然可以实现良好模型性能的简约预测变量。为此,我运行了一个模型选择例程,包括两个步骤:我首先运行一个完整的模型并根据重要性对变量进行排名(我将重要性衡量为准确性的降低)。其次,我从完整模型中取出最重要的预测器,然后逐渐添加所有剩余的预测器,一次一个。通过这样做,我看到哪个预测器基于方差解释的改进最好地改进了建模结果,从而建立了一个新的简约模型。我反复重复这个程序,直到不能实现超过 2% 的方差改善。我已经读到大量可变 RF 选择方法是基于 OOB 误差的减少而不是通过检查方差改进,因此我不确定我是否选择了合适的方法。有人可以发表意见吗?谢谢
解决方案
推荐阅读
- node.js - 命令“npm ls -g --depth = 0”之后的 npm 错误我应该如何处理它们?
- sql - oracle sql、通配符、like、&、co
- excel - Excel电子表格:从方括号中的单元格中删除所有数据
- java - 删除对象数组中的特定元素
- embedded - 如何使用 SAM-BA 提高闪烁速度?
- google-sheets - 将 NB.SI 公式复制到 Google 表格中
- flask - Flask 405 方法不允许 - 尽管允许
- android - 如何让用户在 Firebase 数据库中每小时发一篇帖子?
- laravel - MinIO KES 的 Docker 组合服务
- json - JOLT 从平面结构到嵌套结构