首页 > 解决方案 > 关于决策树的预测

问题描述

决策树如何预测新数据集的结果。假设使用超参数,我允许我的决策树只增长到一定程度以避免过度拟合。现在一个新的数据点被传递给这个训练好的模型,所以新的数据点到达叶子节点之一。但是该叶节点如何预测数据点是 1 还是 0?(我在这里谈论分类)。

标签: machine-learningdata-sciencedecision-tree

解决方案


好吧,你几乎回答了你自己的问题。但只是为了扩展,最后将数据标记为 0 或 1 很大程度上取决于您使用的算法类型,例如 ID3 ,使用众数值进行预测。同样,C4.5 和 C5 或 CART 基于信息增益、ginni 指数等有不同的标准......

简而言之,训练决策树和预测查询实例的目标特征的过程如下:

  1. 呈现一个包含许多训练实例的数据集,这些训练实例具有许多描述性特征和一个目标特征

  2. 通过在训练过程中使用信息增益的度量,沿着描述性特征的值连续分割目标特征来训练决策树模型

  3. 增长树直到我们完成一个停止条件 --> 创建代表我们想要为新查询实例做出的预测的叶节点

  4. 向树显示查询实例并沿着树向下运行,直到我们到达叶节点

  5. 完成 - 恭喜您找到问题的答案

这是我建议的链接,它从头开始非常详细地解释了决策树。好好读一读——

https://www.python-course.eu/Decision_Trees.php


推荐阅读