python - 关于解释随机森林的问题
问题描述
我正在为我的论文查看能源消耗数据,我想使用随机森林模型来预测使用多个特征的能源消耗。
在我构建、训练和验证我的模型之后,我想尽可能多地解释数据。
在网上我发现可以查看特征重要性,看看哪些特征对结果影响最大。尽管我的老师问我是否有办法找出“共同导致某些结果的特征集群”。作为他使用的一个例子(这个例子完全是虚构的):
高收入通常会导致更多的能量消耗,作为男性通常会导致更少的能量消耗,但是作为男性并且具有高收入可能会比作为高收入的女性导致更多的消耗
有没有可以找到这样的组的包或功能?所以我猜他不是在寻找特征重要性,而是在寻找“群体重要性”之类的东西?我什至不确定了。
解决方案
推荐阅读
- kotlin - 构建器模式功能无法在 SpringBoot Kotlin 应用程序中工作
- ssis - Excel 停止刷新 Olap 多维数据集
- java - Android是否可以在没有dx的情况下加载jar?
- azerothcore - 重生后玩家看不见的生物
- javascript - 如何通过 instafeed.js 插件在我们的网站中显示 instagram 的标题部分
- arrays - 从 pyspark 数据框列创建结构数组
- javascript - 无法使用 http 删除/放置请求删除或编辑项目
- java - 有没有办法根据日志的内容更改日志的级别?
- windows - 无法使用 VSCode/GoLand 在 Windows 上调试 Go 代码(获取“%1 不是有效的 Win32 应用程序”)
- c# - 格式化小数以删除尾随零并使用千分位分隔符