machine-learning - 关于决策树的预测
问题描述
决策树如何预测新数据集的结果。假设使用超参数,我允许我的决策树只增长到一定程度以避免过度拟合。现在一个新的数据点被传递给这个训练好的模型,所以新的数据点到达叶子节点之一。但是该叶节点如何预测数据点是 1 还是 0?(我在这里谈论分类)。
解决方案
好吧,你几乎回答了你自己的问题。但只是为了扩展,最后将数据标记为 0 或 1 很大程度上取决于您使用的算法类型,例如 ID3 ,使用众数值进行预测。同样,C4.5 和 C5 或 CART 基于信息增益、ginni 指数等有不同的标准......
简而言之,训练决策树和预测查询实例的目标特征的过程如下:
呈现一个包含许多训练实例的数据集,这些训练实例具有许多描述性特征和一个目标特征
通过在训练过程中使用信息增益的度量,沿着描述性特征的值连续分割目标特征来训练决策树模型
增长树直到我们完成一个停止条件 --> 创建代表我们想要为新查询实例做出的预测的叶节点
向树显示查询实例并沿着树向下运行,直到我们到达叶节点
完成 - 恭喜您找到问题的答案
这是我建议的链接,它从头开始非常详细地解释了决策树。好好读一读——
推荐阅读
- mysql - AWS Lambda 函数返回方括号“[]”结果
- c# - 检测玩家是否被阴影 unity2D 击中
- powershell - 如何在PowerShell中调用多个属性
- google-sheets - InsertRowBefore() + 定义范围问题
- angular - ag-Grid - 添加或修改数据后如何强制自定义排序
- python - Scikit - 线性回归 - 提取指标
- java - 努力构建libgdx项目
- android - Android图像视图边框未显示
- android - Expo android网络请求失败
- java - 为什么我从 MouseAdapter 的 getSource 方法中收到此错误?