首页 > 解决方案 > 如何在python的决策树中使用分类数据

问题描述

我有一个数据集,我从中提取了 12 个特征,用于使用决策树进行共指解析的任务。这些功能的一些示例是:

在创建所有这些特征以从数据集中提取结果之后,我不知道如何选择根节点或如何使用 sci-kit 学习决策树算法,因为数据不是结构化的并且是分类的。我读过的一篇论文提到了熵和信息增益,但这两个属性的所有示例都是基于结构化数据集的。

标签: pythonmachine-learningscikit-learn

解决方案


如果你有不同类别的不同特性,并且不想花时间自己编码,我建议使用CatBoost框架,它也比树的标准 scikit 实现更快。

检查这个kaggle的实施!


推荐阅读