computer-vision - 基于内在和外在相机参数计算单应矩阵
问题描述
我愿意为6个鱼眼相机进行360°全景拼接。
为了找到相机之间的关系,我需要计算单应矩阵。后者通常是通过在图像中找到特征并匹配它们来计算的。
但是,对于我的相机设置,我已经知道:
- 我通过相机校准计算的内在相机矩阵 K 。
- 外部相机参数 R 和 t。相机方向是固定的,在任何时候都不会改变。摄像机位于已知直径 d 的圆上,每个摄像机相对于圆偏移 60°。
因此,我认为我可以手动计算 Homography Matrix,我假设这会产生比执行特征匹配更准确的方法。
在文献中,我发现了以下公式来计算将图像 2 与图像 1 相关联的单应矩阵:
H_2_1 = (K_2) * (R_2)^-1 * R_1 * K_1
这个公式只考虑了相机之间的旋转角度,而不是我的例子中存在的平移向量。
如何将每个相机的平移 t 插入 H 的计算中?
我已经尝试在不考虑平移的情况下计算 H,但是由于 d>1 米,图像在全景图片中没有准确对齐。
编辑:
根据下面弗朗切斯科的回答,我得到了以下问题:
校准鱼眼镜头后,我得到了一个
K
焦距f=620
为 1024 x 768 的图像的矩阵。这被认为是大焦距还是小焦距?我的相机位于直径为 1 米的圆圈上。下面的解释让我很清楚,由于相机之间的这种“大”平移,我对相对靠近它们的物体产生了显着的重影效果。因此,如果 Homography 模型不能完全代表相机的位置,是否可以使用其他模型,例如 Fundamental/Essential Matrix 进行图像拼接?
解决方案
您不能“插入”翻译:它的存在以及非平凡的旋转在数学上意味着图像之间的关系不是单应性。
但是,如果成像场景距离相机“足够远”,即如果相机之间的平移与场景对象与相机的距离相比较小,并且相机的焦距足够小,那么您可以使用由纯旋转引起的单应性作为近似值。
你的等式是错误的。得到正确的公式如下:
- 在相机 1 中取一个像素:
p_1 = (x, y, 1)
在齐次坐标中 - 将其投影到 3D 空间中的射线中:
P_1 = inv(K_1) * p_1
- 分解摄像机 2 坐标中的射线:
P_2 = R_2_1 * P1
- 将光线投影到相机 2 中的像素中:
p_2 = K_2 * P_2
- 把方程放在一起:
p_2 = [K_2 * R_2_1 * inv(K_1)] * p_1
乘积H = K2 * R_2_1 * inv(K1)
是(近似)单应性。旋转 R_2_1 将点从第 1 帧转换到第 2 帧。它是一个 3x3 矩阵,其列是在第 2 帧中分解的第 1 帧的 x、y、z 轴的分量。如果您的设置为您提供了所有摄像机的旋转对于一个共同的帧0,即R_i_0,那么它是R_2_1 = R_2_0 * R_1_0.transposed
。
一般来说,你应该使用上面的单应性作为初始估计,通过匹配点和优化来细化。这是因为 (a) 单应性模型本身只是一个近似值(因为它忽略了平移),并且 (b) 机械设置(即使是校准的)给出的旋转受到误差的影响。使用匹配的像素来优化转换将最大限度地减少图像上重要的错误,而不是抽象旋转空间中的错误。
推荐阅读
- php - 如何创建表单,并在 ClickUp 任务上创建任务
- reactjs - 从数据库中检索到的数据的 HTML 格式被弄乱了
- javascript - 在节点 js 中发送到服务器时解决损坏的 pdf 文件
- vue.js - 在 Nuxt 中,如何添加脚本?
- javascript - 如何在Javascript中获取元素的背景颜色(设置为RGBA)?
- javascript - 扩展函数对象
- csv - 是否可以将不同结构的 CSV 文件放入一个 Parquet 文件中?
- python - brew卸载python错误:拒绝卸载
- python - 从字符串Python中删除括号和数字
- python - 如果字段名称是字符串变量,如何从数据包层获取字段值?