python - 寻找二元分类中特征的标准
问题描述
我已经在 h2o 中使用 DRF 进行了二进制分类。我得到了特征的重要性,然后我要求找到每个特征的标准。
例如:我必须对接受和拒绝的用户进行分类,特征是年龄、薪水、工作经验、居住城市(当然已经解码)。所以,我的老板想知道哪个年龄段的用户有被拒绝或接受的趋势,在哪个薪水范围内,有哪些城市有被拒绝或接受的趋势。
我不会错,但我想要的输出可能如下所示:
Tendency salary for accepted user = 10k - 50k
Tendency salary for accepted user = 5k - 30k
Tendency age for accepted user = 18 - 55
Tendency age for rejected user = 31 - 35
Tendency cities for accepted user = 1, 5, 10, 23
Tendency cities for rejected user = 3, 4, 12, 36
so on..
如何实现?
ps:我有一个接受用户的列表。
解决方案
我认为你需要像部分依赖图这样的东西。这是 H2O 中的一个示例:https ://rdrr.io/cran/h2o/man/h2o.partialPlot.html
PDP 将显示目标的概率如何取决于某个变量的值。
推荐阅读
- php - Laravel 5 会话问题(功能和安全)
- php - 找到正确的正则表达式
- c# - 在 MS loadTest (MS Enterprise)(Azure Devops) 中运行 selenium 测试
- android - 如何在没有 Helper 的情况下删除 BottomNavigationView 的所有动画?
- java - 将地址清理程序与 Surefire 一起使用
- java - 可以在浏览器中查看/检查来自 Java 的 HTTP 请求吗
- powershell - 从 devops 执行脚本时,Powershell 模块不可见
- kubernetes - NetworkPolicy 不允许 HTTP/HTTPS 端口上的出口
- seo - 新 Search Console 中是否有 robots.txt 测试程序?
- windows - 在另一个命令的末尾传递一个命令的输出