machine-learning - 随机森林分类,测试训练数据
问题描述
我是机器学习环境的新手。我注意到随机森林分类器由决策树组成,决策树依靠统计数据对样本进行分类。随机森林是否有可能错误地对训练集中的样本进行分类?
解决方案
是的。如果决策树的深度不足以捕捉数据的本质。例如,让我们考虑具有两个特征X1
和的数据X2
。
target = 1 if X1 >5 and X2 > 10, else target = 0
对于深度一,决策树将不得不仅依赖于其中一个特征。
例如样本,如果决策树使用X1
特征来构造分裂,样本(7, 15)
和(7, 7)
都将被分类为 1,这对于 是错误的(7,7)
,因为X2 = 7 < 10
。
推荐阅读
- javascript - onbeforeunload() 函数在 jquery 中不起作用
- vba - MS.Access - 在 DoCmd.OpenReport [where 条件] 中使用 2 个过滤条件从表单打印报表
- html - 使用 NVDA 替代文本阅读
- java - 尝试转换尝试
- > 试一试
- > 使用 Java Vavr
- java - opengl中的3D对象选择
- javascript - 如何防止在JS中使用draggable拖动多个项目?
- web-services - 会话未在 Web 服务器上维护
- javascript - 在 ReactJS 中的一行按钮中更改按钮背景颜色
- python - 如何使用python在循环中处理脚本
- android - Proto DataStore 不适用于苹果芯片