首页 > 解决方案 > Michael Neilsen 书中成本函数的选择:神经网络和深度学习

问题描述

在此处输入图像描述

这里,w表示网络中所有权重的集合,b表示所有偏差,n是训练输入的总数,a是输入x时网络的输出向量,总和是所有训练输入的总和,x。当然,输出 aa 取决于xwb,但为了保持符号简单,我没有明确指出这种依赖关系。

摘自 Michael Neilsen 的神经网络和深度学习

有谁知道他为什么将总和除以2?我以为他会通过除以n来找到平均值;相反,他除以2n

标签: neural-networkdeep-learning

解决方案


这样做是为了在计算C(w, b)的偏导数时,将与二次项的导数产生的 2 相抵消。

你是对的,通常我们会除以n,但这个技巧是为了便于计算。


推荐阅读