首页 > 解决方案 > 在 Kevin Lin 等人的 CVPR16 论文“Deepbit”中,是不是损失函数部分的错字?

问题描述

最近,我正在研究将图像编码为紧凑二进制描述符的可能方法,该描述符允许在大型语料库中进行快速图像匹配,并遇到了 Kevin Lin 及其同事撰写的这篇论文。

在文章中,他们提出了一种无监督学习方法来学习图像的紧凑二进制描述符。具体来说,他们提出了一个损失函数来惩罚由 3 个组件组成的描述符:

  1. 量化损失
  2. 均匀分布损失
  3. 比特相关损失

我的问题在于第一部分。在论文中,损失函数定义为小批量中所有训练数据的二进制位与最后一层激活值之间的平方误差之和。然而,当我实现这个时,整体损失变得如此之大,以至于其他 2 个组件变得有些无关紧要,因此根本没有均匀分布。

所以我想知道这是否是论文中的错字,它应该是平方误差的平均值而不是总和。

干杯。

标签: machine-learningcomputer-visionloss-function

解决方案


推荐阅读