backpropagation - 关于增量和激活之间的乘法顺序的问题
问题描述
我一直在用 Michael Nielsen 的在线书籍学习深度学习。对于反向传播部分,他在下面写了一行代码:
nabla_w[-1] = np.dot(delta, activations[-2].transpose())
这段代码对我来说听起来不太清楚。从他的书中,∂/∂^_{} = ^{−1}_ * ^_
,这个方程可以用链式法则来证明。所以,我假设了 activations[-2] * delta 的顺序,反之亦然。例如,假设 activations[-2] 是 3x1 矩阵,delta 是 2x1。由于它们的矩阵形式,activations[-2] * delta 是不可计算的,而 delta * activations[-2]^T 是 2x3 矩阵。∂/∂^_{} = ^{−1}_ * ^_
你能告诉我 1)和之间根本没有区别∂/∂^_{} = ^_ * (^{−1}_k)^T
吗?
解决方案
推荐阅读
- ms-access - 如何连接组合框中的值和访问中的数字字段
- javascript - 我想通过 google map api 检测用户位置
- java - Android Studio - 如何调用引用可绘制对象的方法?
- python - 如何检测龟蟒中两个物体之间的碰撞?
- html - 使用 css 样式输入单选
- laravel - Laravel + Tailwindcss 1.8.7:如何安装
- vue.js - Fancybox 3 - 从内联数据属性中指定按钮数组?
- c# - 如何将 SQL 表中的行数显示到 HTML 容器
- r - 在 Rstudio 中选择具有日期和时间值的特定行
- r - 如何更改 R 中 fviz_cos2 绘图的标签大小?