machine-learning - 机器学习中的“适合”是什么?
问题描述
什么是机器学习中的“适合”?我注意到在某些情况下它是训练的同义词。
有人可以用外行的话解释一下吗?
解决方案
机器学习模型通常用一些包含参数的函数形式来指定。
一个示例是用于对具有y
可以用特征描述的结果变量的数据进行建模的线x
。在这种情况下,函数形式将是:
y = mx + b
拟合模型意味着根据训练数据找到m
和的值,训练数据是一组点, , ..., 。可能无法设置和使得线穿过所有训练数据点,但可以定义一些损失函数来描述拟合良好的线。拟合算法的目的是最小化该损失函数。在直线拟合的情况下,损失可能是训练数据点到直线的总距离,但在数学上将损失设置为训练数据点到直线的总平方距离可能更方便。b
(x1, y1)
(x2, y2)
(xN, yN)
m
b
通常,模型可能比线更复杂,并且包含许多参数。对于某些模型,参数的数量不是固定的,并且可以作为拟合过程的一部分进行更改。特征和结果变量可以是离散的、连续的和/或多维的。对于无监督问题,没有结果变量。
在所有这些情况下,拟合仍然类似于上面的行示例,其中运行算法以找到在某种意义上解释训练数据的模型参数。这通常涉及运行一些优化过程。
即使其他数据是从与训练数据相同的分布中采样的,与训练数据拟合良好的模型也可能无法与其他非训练数据良好拟合。可以使用一种称为正则化的技术来解决这个问题。
推荐阅读
- gradle - 如何使用 Gradle 并行运行 Cucmnber-JVM 测试(Gradle 中是否有等效的 MVN FailSafe 插件)
- elasticsearch - elasticsearch(6.0.1)中是否有替代方法代替嵌套类型
- java - 无法使用 startWebLogic.sh 启动 Weblogic 服务器
- php - 使用带有哈希密码的 PHPMailer 登录到 Gmail
- powershell - 使用默认消息在 Powershell 中扩展异常
- c# - WPF C# 无法从 Listview 中删除项目(ItemsSource 正在使用中)
- ms-word - 如何使用 Office JS 在 Word 文档的正文中添加书签
- java - 使用标头和数据帧的 Jetty HTTP2 服务器
- sql - 在 oracle 中使用 CASE 计数
- angular - 如何使用 Karma 和 Jasmine 在 Angular 中模拟 router.navigateByUrl(...).then