首页 > 解决方案 > 将卷积特征回归到旋转的四元数表示是什么意思?

问题描述

我对机器人操作很感兴趣,我正在阅读论文“PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes”,在介绍部分找到了以下句子,它解释了 PoseCNN 的三个相关任务。这是第三个任务。

3D Rotation R 是通过将在对象边界框内提取的卷积特征回归到 R 的四元数表示来估计的。

将卷积特征回归到旋转的四元数表示是什么意思?如何回归到四元数表示?我们也可以使用旋转矩阵代替四元数吗?我们可以说将卷积特征回归到旋转矩阵吗?如果是,两者之间有什么区别?

标签: deep-learningcomputer-visionpose-estimation

解决方案


“回归卷积特征”意味着您使用网络提取的特征来预测一些数字。

在您的情况下,您试图预测代表旋转矩阵的四元数的数量。

我认为他们回归四元数而不是旋转矩阵的原因是因为它们更紧凑,数值更稳定,效率更高。有关差异的更多信息,请查看四元数和空间旋转

此外,我认为您可以尝试直接回归旋转矩阵,如果您查看它们用于四元数回归的损失,您会看到它们将四元数转换为旋转矩阵表示。所以损失本身是在旋转矩阵上,而不是直接在四元数上


推荐阅读