首页 > 解决方案 > TensorFlow 对象检测 API CSV 文件格式

问题描述

我是使用 TensorFlows 对象检测 API 的新手,但我知道我需要将 csv 文件转换为 TFRecord。我理解csv的格式应该是8列,如下:

文件名、宽度、高度、类、最小值、xmax、ymin、ymax

我感到困惑的是图像的哪个角被假定为原点?

谢谢你的帮助!

标签: csvtensorflowobject-detection-apitfrecord

解决方案


假设图像的左上角为原点(0,0),宽度(x 坐标)随着您向右移动而增加,高度(y 坐标)随着您向下移动而增加。

所以基本上,图像的右下角将被索引为(width-1,height-1)

您上面描述的格式基本上是Pascal VOC注释格式,对于特定的边界框

xmin表示左上角的x坐标
ymin表示左上角的y坐标 表示右下角
xmax的x坐标 表示右下角
ymax的y坐标


推荐阅读