首页 > 解决方案 > 关于解释随机森林的问题

问题描述

我正在为我的论文查看能源消耗数据,我想使用随机森林模型来预测使用多个特征的能源消耗。

在我构建、训练和验证我的模型之后,我想尽可能多地解释数据。

在网上我发现可以查看特征重要性,看看哪些特征对结果影响最大。尽管我的老师问我是否有办法找出“共同导致某些结果的特征集群”。作为他使用的一个例子(这个例子完全是虚构的):

高收入通常会导致更多的能量消耗,作为男性通常会导致更少的能量消耗,但是作为男性并且具有高收入可能会比作为高收入的女性导致更多的消耗

有没有可以找到这样的组的包或功能?所以我猜他不是在寻找特征重要性,而是在寻找“群体重要性”之类的东西?我什至不确定了。

标签: pythonrmachine-learningrandom-forest

解决方案


推荐阅读