首页 > 解决方案 > 机器学习模型是否可能具有低测试误差和高训练误差?

问题描述

当我们有大的测试误差和大的训练误差时,我们就说它是一个 BIAS 问题。当我们有低训练错误和高测试错误时,我们说它是方差问题。当训练误差和测试误差都足够低以至于可以接受时,我们说它是 GOOD fit 或 BEST fit 模型。

但是是否有可能有更多的训练错误然后测试错误???如果是,那我们怎么说呢??此外,测试和训练集是随机选择的,因此没有进行先前的设置!

Training    Test    Model
error       error

low         low     GOOD FIT
low         high    HIGH VARIANCE
high        high    HIGH BIAS
high        low     ????????

标签: machine-learningvariance

解决方案


由于学习模型旨在减少训练错误(因为测试集在学习时不可用,因此“测试”)这是非常不可能的,我会说除非你专门创建一些发生这种情况的例子,否则它不会发生。

要发生这种情况,训练集必须是高方差之一,或者与所选模型不兼容的模型(例如,分离无法线性分离的数据的线性模型)会产生高训练误差,任何测试集都会产生一个低训练误差,它必须不反映与给定训练集中相同的方差。如果遇到这样的问题,很可能是这些套装的构造不好。由于这种情况不太可能发生,我不知道给它起什么名字


推荐阅读