首页 > 解决方案 > 将注释从 Mask-RCNN 数据集格式转换为 COCO 格式

问题描述

我想训练一个模型来检测图像中的车辆和道路。为此,我将使用 Mask R-CNN 和 YOLACT++。我用 vgg 图像注释器为 Mask R-CNN 标记了一些图像,分割点如下图所示。

在此处输入图像描述

如您所见,没有 area 参数或 bbox 参数。我可以使用 minx miny maxx maxy 找到我的实例的 bbox,但我找不到如何找到该分段区域的区域。您可以在下图中看到 Yolact 注释的形成。

在此处输入图像描述

标记所有实例需要大量时间。我花了至少 10 分钟来标记图像中的所有汽车,并且我已经有 500 个标记的图像。您对我有什么建议或想法可以帮助我节省时间,同时将第一个注释形成转换为第二个(掩码 r-cnn 到 coco(yolact))?

标签: pythonmachine-learningimage-processingdeep-learningcomputer-vision

解决方案


您必须创建自己的脚本并对其进行转换,我必须从 xml 注释到 json maskrcnn。

您可以查看示例: https ://github.com/adions025/XMLtoJson_Mask_RCNN


推荐阅读