data-science - 当所有数据都是数字时,如何计算 CART 算法的基尼指数?
解决方案
基尼指数适用于分类数据,它衡量一个特定变量在随机选择时被错误分类的程度或概率。因此,对于一棵树,我们选择一个基尼指数最小的特征。
现在,在您的情况下,我们有数字数据,因此拆分的特征选择是使用高于阈值的元素完成的。
为了计算阈值,将数值特征按升序排序,并尝试将每个值作为阈值,并计算每个值的信息增益作为阈值。具有最大信息增益的阈值将是您的阈值。
推荐阅读
- java - 加装手柄 助焊剂返回型
- android - tns 医生说缺少“ANDROID_HOME”,即使它设置在 circleCi
- sql - SQL Server 中没有 Order By 子句的 SQL Select 语句的顺序
- python - 在 Heroku 上安装 ODBC 驱动程序
- c - C 程序:getenv 在 GDB/DDD 中返回 NULL
- javascript - html2canvas 无法加载图像未定义
- php - SQLSTATE [HY000]:一般错误:1364 字段“角色”没有默认值
- ios - 用于检查是否在数组中找到特定 id 的 For 循环
- jquery - FlexSlider itemWidth 未在窗口调整大小时更新
- c - 如何制作CAN协议的传输代码