csv - TensorFlow 对象检测 API CSV 文件格式
问题描述
我是使用 TensorFlows 对象检测 API 的新手,但我知道我需要将 csv 文件转换为 TFRecord。我理解csv的格式应该是8列,如下:
文件名、宽度、高度、类、最小值、xmax、ymin、ymax
我感到困惑的是图像的哪个角被假定为原点?
谢谢你的帮助!
解决方案
假设图像的左上角为原点(0,0)
,宽度(x 坐标)随着您向右移动而增加,高度(y 坐标)随着您向下移动而增加。
所以基本上,图像的右下角将被索引为(width-1,height-1)
您上面描述的格式基本上是Pascal VOC
注释格式,对于特定的边界框
xmin
表示左上角的x坐标
ymin
表示左上角的y坐标 表示右下角
xmax
的x坐标 表示右下角
ymax
的y坐标
推荐阅读
- node.js - 离子命令无法识别并且 Npm 安装创建了不必要的文件
- java - MidiManager.getDevices() 返回一个空列表,其中包含通过 USB 直接连接的合成器
- r - 如何在不使用嵌套 for 循环函数的情况下基于两个字符变量的比较创建新变量?
- c# - ASP.NET MVC 中的自定义身份验证
- docker - Docker 中的 Docker on Continuous Integration 导致“设备上没有剩余空间”
- watchkit - 如何在 WatchOS 上的 SwiftUI 列表中设置行样式?
- scala - 在 Scala 中使用隐式的良好实践
- c++ - 我应该移动 std::exchange ed 成员吗?
- html - 如果我从表单中的选择输入中选择一个选项,textarea 会变为空,为什么会这样?
- react-native - 当应用程序的 onResume() [React-Native] 时,键盘未显示 .focus()