首页 > 解决方案 > 为什么 h2o.gbm 在仅使用重要特征进行重建时会生成不同的模型

问题描述

不幸的是,我无法在我刚刚尝试过的开源数据上重现这个问题(我无法提供我遇到问题的原始数据,因为它具有商业敏感性)。然而, ...

我已经在具有一组参数和种子设置为 1 的数据集上构建了一个 h2o.gbm()。如果我采用特征重要性 > 0 的特征,然后构建一个新的 gbm(一切都与以前完全相同,但是指定的功能略少),然后我得到一个非常不同的模型!

怎么会这样?

我会尝试提供一些可重现的东西,但与此同时,任何见解都会受到赞赏。如果我表达的不够清楚,很高兴能澄清这个问题。

谢谢,汤姆

标签: rh2ogbm

解决方案


没关系 - 我发现了问题:列采样是罪魁祸首!

显然这不是一个错误,而是需要注意的事情。


推荐阅读