首页 > 解决方案 > tensorflow 2.0 中的多标签分割

问题描述

我正在处理一个分割任务,其中每个像素可以属于多个类 - 多标签分割。基本事实和输出(我从 U-Net 获得)已经None x H x W x 3成型。本质上,每个像素都由一个大小为 3 的向量表示。如果我像这样在模型上调用 compile,我做对了吗:

model.compile(
    optimizer='rmsprop',
    loss='binary_crossentropy')

还是我需要为此任务编写自定义损失函数?

谢谢!

标签: tensorflowdeep-learningimage-segmentationmultilabel-classification

解决方案


由于您正在执行多标签语义分割,因此最好使用某种加权二元交叉熵。通常在多标签语义分割中,可能会有一些标签没有足够的训练数据,它们的性能可能会被具有高训练信息的标签所掩盖。这反过来会导致更高的整体准确性,但在所有标签上的个人表现不佳。

这是关于这个问题的一个很好的讨论。 https://github.com/keras-team/keras/issues/6261


推荐阅读