machine-learning - 机器学习 - 寻找界限有什么意义?
问题描述
我目前正在大学学习机器学习,借助机器学习基础(第二版)教科书。我了解了 PAC 学习、Rademacher 复杂性、增长函数和 VC 维度。在整个教科书和课程中,我们似乎花费了大量时间来寻找界限。
我对我们为什么要这样做感到有些困惑。
- 找到这些界限的重点到底是什么?
- 这些界限如何实际应用于现实世界的机器学习领域?
教科书和我的教授都没有特别帮助回答我的问题。
谢谢。
解决方案
决策边界是识别模式的基本原则(将事物分成两组的最简单的观点)。由此,泛化边界为:
在统计机器学习理论中,泛化界——或者更准确地说,泛化误差界——是关于学习算法或算法类的预测性能的陈述。
因此,找到界限的全部意义在于让您确定算法的性能(或效率)。
这似乎是一个微不足道的问题;答案很简单,因为学习算法可以搜索整个假设空间以寻找其最优解。虽然这个答案是正确的,但鉴于我们正在研究的泛化不等式,我们需要一个更正式的答案。
如果你的问题更像是:为什么要花很多时间(所以你强调花在这上面的时间),或者换句话说:为什么我们需要考虑每一个可能的假设?(更多):
这似乎是一个微不足道的问题;答案很简单,因为学习算法可以搜索整个假设空间以寻找其最优解。虽然这个答案是正确的,但鉴于我们正在研究的泛化不等式,我们需要一个更正式的答案。
推荐阅读
- vuejs2 - 如何从单选按钮获取值并在 url 中使用它
- c++ - 重载函数的特征
- ios - 如何将 double 转换为 int 并将其显示在 swiftUI 中的 Text 上?
- python - 如何将 JSON 密钥数据保存到 Python 变量
- javascript - 在纯 html 项目中渲染反应应用程序?
- vuejs2 - Quasar Framework - 如何根据方向有条件地更改类
- python - 在python的一行csv中插入两个值
- java - 单声道重试与回退没有被调用流中的少数元素
- sql - 将特定列从一个表复制到另一个表,并包括源表名
- java - 如何在不使用任何额外线程的情况下使当前正在运行的 API 调用超时?