首页 > 技术文章 > U-Net笔记

pipecat 2020-07-16 23:37 原文

U-Net阅读笔记

介绍

  • 在上采样部分有大量的特征通道,这使得网络可以将空间上下文信息向更高的分辨率层传播,呈现出一个U型。
  • 网络不存在任何全连接层,并且,只使用每个卷积的valid部分.
  • 为了预测图像边界区域的像素点,我们采用镜像图像的方式补全缺失的环境像素。
  • 采用弹性形变的方式增加数据

网络结构

  • 网络结构由 contracting path 和 expansive path 组成。
  • contracting path 每次重复中都有2个 3*3 卷积层(无padding)、非线性ReLU层和一个 2*2 max pooling层(stride为2)。
  • expansive path 每一步都首先使用反卷积(up-convolution),每次使用反卷积都将特征通道数量减半,特征图大小加倍。反卷积过后,将反卷积的结果与contracting path中对应步骤的特征图拼接起来。对拼接后的map再进行2次33的卷积。最后一层的卷积核大小为11,。

训练

  • 采用随机梯度下降法训练,框架为Caffe。
  • 卷积没有使用padding,输出图像总是比输入图像小一个恒定的宽度。
  • 倾向于大的输入图块而不是大的 batch size, 从而将批处理减少到单个图像。
  • 最后一层使用交叉熵函数与softmax。

数据扩充

  • 使用随机位移矢量在粗糙的 3*3 网格上(random displacement vectors on a coarse 3 by 3 grid)产生平滑形变(smooth deformations)。

总结

U-Net主要应用于图像分割问题,在医学图像分割中表现良好。同时,U-Net引入了非常底层的信息,对于恢复细节非常有效,在样本量小的训练集上效果依然很好。

推荐阅读