首页 > 解决方案 > 分类和回归树 (CART) 的分类属性拆分

问题描述

我知道我们可以在分类和回归树 (CART) 的不同级别中多次拆分数字属性,这是一种二叉树。分类属性怎么样?我们可以拆分多次还是只拆分一次?如果不是,是什么原因?

标签: machine-learningclassificationdecision-tree

解决方案


如果分类预测变量有 2 个以上的类别;您可以像在数字变量的情况下一样再次拆分它。

例如;

如果预测变量之一是具有 3 个类别的“婚姻状况”:“已婚”、“未婚”和“离婚”。

您可以进行二元拆分,例如“未婚”与“其他”,其中后一组包含“已婚”和“离婚”这两个组的观察结果。

此外,如果在某个阶段需要,您可以将 'Other' 组分为两类'Married' 和 'Divorced'

基于一些拆分规则,您也可以将此想法扩展到 3 个以上的类别。


推荐阅读