首页 > 解决方案 > 寻找二元分类中特征的标准

问题描述

我已经在 h2o 中使用 DRF 进行了二进制分类。我得到了特征的重要性,然后我要求找到每个特征的标准。

例如:我必须对接受和拒绝的用户进行分类,特征是年龄、薪水、工作经验、居住城市(当然已经解码)。所以,我的老板想知道哪个年龄段的用户有被拒绝或接受的趋势,在哪个薪水范围内,有哪些城市有被拒绝或接受的趋势。

我不会错,但我想要的输出可能如下所示:

Tendency salary for accepted user = 10k - 50k
Tendency salary for accepted user = 5k - 30k

Tendency age for accepted user = 18 - 55
Tendency age for rejected user = 31 - 35

Tendency cities for accepted user = 1, 5, 10, 23
Tendency cities for rejected user = 3, 4, 12, 36

so on..

如何实现?

ps:我有一个接受用户的列表。

标签: pythonmachine-learningdata-sciencerandom-foresth2o

解决方案


我认为你需要像部分依赖图这样的东西。这是 H2O 中的一个示例:https ://rdrr.io/cran/h2o/man/h2o.partialPlot.html

PDP 将显示目标的概率如何取决于某个变量的值。


推荐阅读