首页 > 解决方案 > Tensorflow - 如何训练模型以返回平面/地面上对象的(x,y)坐标

问题描述

我想将图像映射到一个值,将某个对象的位置映射到相对于地板的坐标:左上方放置球的房间图片将返回(0,0),中间顶部将返回(0.5,0)等等。房间的图像是静态的,因为相机固定在同一个地方,但是那个房间的环境可能会改变——例如人、其他物体。

我正在考虑通过从对象检测模型或通过 CNN 获取边界框坐标来解决这个问题,对 2 个模型进行训练 - 对于 X 和 Y 轴,提供边缘情况的图像(球位于左边缘的图像集和右边缘,类别 0 和 1,在使用概率确定对象与边缘的接近程度之后)。

你将如何解决这个任务?谢谢!

标签: tensorflowartificial-intelligenceobject-detection

解决方案


推荐阅读