machine-learning - 激活函数的导数与偏导数wrt。损失函数
问题描述
人工智能中的一些术语让我感到困惑。反向传播中使用的导函数是激活函数的导数还是损失函数的导数?
这些术语令人困惑:行为的派生。函数,偏导wrt。损失函数??
我仍然没有正确。
解决方案
当你优化一个模型时,你定义了一个损失函数。这通常表示关于某些训练数据的错误。
通常使用基于梯度的优化来最小化这个错误。通常,随机梯度下降 (SGD) 和相关方法(Adam、Adagrad 等)。
损失函数的梯度,是由损失对模型中每个权重的偏导数组成的向量。
在每次迭代中,权重都会根据梯度的方向进行更新(记住我们正在最小化)。
我想你可能会感到困惑的原因是因为链式法则,在计算损失函数的梯度时,你需要区分激活函数。但请记住,这是因为链式法则。
推荐阅读
- java - 如何将 Beam SQL 窗口查询与 KafkaIO 集成?
- swift - 无法在 Swift 中填充空字典
- cryptography - PGP 签名消息 - Bouncycastle - 无法使用 JcaPGPObjectFactory 提取完整的原始一次性签名
- odoo - 如何使用模型 A 字段中的 onchange 更新模型 B 中的字段?奥多 12
- javascript - 使用 async/await,array.length 仍然显示为 0
- jquery - Jquery ajax隐藏成功请求的元素
- javascript - 如何使用 javascript 或 es6 从对象中删除负值
- reactjs - Pushstate:启用子目录:未提供静态资产
- django - Django 如何在一个 Django 项目中管理不同的子域?
- c# - 数据网格数据模板中的项目源不起作用