neural-network - Michael Neilsen 书中成本函数的选择：神经网络和深度学习

这里，w表示网络中所有权重的集合，b表示所有偏差，n是训练输入的总数，a是输入x时网络的输出向量，总和是所有训练输入的总和，x。当然，输出 aa 取决于x、w和b，但为了保持符号简单，我没有明确指出这种依赖关系。

摘自 Michael Neilsen 的神经网络和深度学习

有谁知道他为什么将总和除以2？我以为他会通过除以n来找到平均值；相反，他除以2n。

标签： neural-networkdeep-learning

这样做是为了在计算C(w, b)的偏导数时，将与二次项的导数产生的 2 相抵消。

你是对的，通常我们会除以n，但这个技巧是为了便于计算。