machine-learning - 分类和回归树 (CART) 的分类属性拆分
问题描述
我知道我们可以在分类和回归树 (CART) 的不同级别中多次拆分数字属性,这是一种二叉树。分类属性怎么样?我们可以拆分多次还是只拆分一次?如果不是,是什么原因?
解决方案
如果分类预测变量有 2 个以上的类别;您可以像在数字变量的情况下一样再次拆分它。
例如;
如果预测变量之一是具有 3 个类别的“婚姻状况”:“已婚”、“未婚”和“离婚”。
您可以进行二元拆分,例如“未婚”与“其他”,其中后一组包含“已婚”和“离婚”这两个组的观察结果。
此外,如果在某个阶段需要,您可以将 'Other' 组分为两类'Married' 和 'Divorced'。
基于一些拆分规则,您也可以将此想法扩展到 3 个以上的类别。
推荐阅读
- r - 连接不同维度的数据框并填补空白
- python - 数据框根据与另一个数据框的比较过滤行
- pandas - 猫图的 Seaborn FacetGrid
- ionic4 - 在 IOS 设备上测试 ionic 应用程序时出错
- java - 我无法运行我的黄瓜 jvm 报告
- unity3d - 长按和随机时间值
- authentication - 一个 ASP.NET Core 2.2 控制器中的多种身份验证方法
- reactjs - 错误:“在“@ckeditor/ckeditor5-build-classic”中找不到导出“默认”(导入为“ClassicEditor”)
- reactjs - componentDidMount 生命周期方法中子组件抛出的错误未在错误边界中捕获
- angular - 从ngx-chips(标签输入)中选择项目时Angular2 +打开模态