python - 如何在python的决策树中使用分类数据
问题描述
我有一个数据集,我从中提取了 12 个特征,用于使用决策树进行共指解析的任务。这些功能的一些示例是:
distance_feature():i和j之间的距离,根据句子的数量。输出:0 或 1
Ispronoun_feature():如果名词短语是代词,则此功能设置为 true。
同位特征():此功能检查是否
j
与i
.
在创建所有这些特征以从数据集中提取结果之后,我不知道如何选择根节点或如何使用 sci-kit 学习决策树算法,因为数据不是结构化的并且是分类的。我读过的一篇论文提到了熵和信息增益,但这两个属性的所有示例都是基于结构化数据集的。
解决方案
推荐阅读
- php - 在循环期间将mysql查询回显到屏幕时,php脚本是否会变慢
- html - 如何将对象格式化为漂亮的 HTML 表格?
- android - React-Native 在特定目录打开“我的文件”应用程序
- c++ - 将 gsl::zstring_view 与 C API 一起使用
- matlab - 具有分散数据的二维插值问题
- matlab - Matlab图像变换(affine2d,projective2d)排序
- python - 在 Python 中切片创建什么类型的副本?
- android - 如何在 Kotlin 上持续监听 UDP 数据
- sql - 基于另一列的不同值的 SUM 值
- firefox - 如何让 Firefox 地址栏偏爱书签?