首页 > 解决方案 > 随机森林分类,测试训练数据

问题描述

我是机器学习环境的新手。我注意到随机森林分类器由决策树组成,决策树依靠统计数据对样本进行分类。随机森林是否有可能错误地对训练集中的样本进行分类?

标签: machine-learningrandom-forest

解决方案


是的。如果决策树的深度不足以捕捉数据的本质。例如,让我们考虑具有两个特征X1和的数据X2

target = 1 if X1 >5 and X2 > 10, else target = 0

对于深度一,决策树将不得不仅依赖于其中一个特征。

例如样本,如果决策树使用X1特征来构造分裂,样本(7, 15)(7, 7)都将被分类为 1,这对于 是错误的(7,7),因为X2 = 7 < 10


推荐阅读