首页 > 解决方案 > 利用rotated_rectangle/bounding_box GT得到分割掩码GT

问题描述

TLDR;一般来说,在给定旋转矩形/边界框的情况下,提取/预测分割掩码的可用选项是什么?


主题:

我有一个小的图像数据集,每个图像都包含 100 多个小实例(最多 300 个),这些实例已经使用框进行了注释,因为它比绘制蒙版要容易得多。未来的工作包括扩展数据集并通过额外提供分割掩码来丰富注释.. :O pff

我的概念:

所以我在想,由于对象被遮挡并且有时被隐藏,因此使用更适合其空间布局的旋转矩形手动注释它们,而不是为成千上万的对象绘制分割蒙版(不要惊慌 - 有一个团队!) . 下一步是使用当前注释信息在包含单个实例的子图片中分割带注释的图片,并可能将它们传递给语义(/pixel_wise)分割模型,以检索它们的掩码并将它们重新映射到整个图片。因此,通过在检索到的掩码中应用一些更正,从而节省注释阶段的时间和精力。


问题:

关于如何使用bounding_box的可用信息实现segmentation_mask提取有什么建议吗?分割模型基于线性的分割(例如,基于直方图使用 cv 可能更可行,但可能不能很好地概括),完全不同的概念

提前致谢!

标签: pythonopencvmachine-learningcomputer-visionobject-detection

解决方案


推荐阅读