首页 > 解决方案 > 机器学习中的“适合”是什么?

问题描述

什么是机器学习中的“适合”?我注意到在某些情况下它是训练的同义词。

有人可以用外行的话解释一下吗?

标签: machine-learningdata-science

解决方案


机器学习模型通常用一些包含参数的函数形式来指定。

一个示例是用于对具有y可以用特征描述的结果变量的数据进行建模的线x。在这种情况下,函数形式将是:

y = mx + b

拟合模型意味着根据训练数据找到m和的值,训练数据是一组点, , ..., 。可能无法设置和使得线穿过所有训练数据点,但可以定义一些损失函数来描述拟合良好的线。拟合算法的目的是最小化该损失函数。在直线拟合的情况下,损失可能是训练数据点到直线的总距离,但在数学上将损失设置为训练数据点到直线的总平方距离可能更方便。b(x1, y1)(x2, y2)(xN, yN)mb

通常,模型可能比线更复杂,并且包含许多参数。对于某些模型,参数的数量不是固定的,并且可以作为拟合过程的一部分进行更改。特征和结果变量可以是离散的、连续的和/或多维的。对于无监督问题,没有结果变量。

在所有这些情况下,拟合仍然类似于上面的行示例,其中运行算法以找到在某种意义上解释训练数据的模型参数。这通常涉及运行一些优化过程。

即使其他数据是从与训练数据相同的分布中采样的,与训练数据拟合良好的模型也可能无法与其他非训练数据良好拟合。可以使用一种称为正则化的技术来解决这个问题。


推荐阅读