使用 Roll-Pitch-Yaw 角度变换图像(图像校正)
Posted
技术标签:
【中文标题】使用 Roll-Pitch-Yaw 角度变换图像(图像校正)【英文标题】:Transform Image using Roll-Pitch-Yaw angles (Image rectification) 【发布时间】:2013-12-25 01:24:18 【问题描述】:我正在开发一个需要校正从移动相机平台拍摄的图像的应用程序。该平台测量滚动、俯仰和偏航角,我想让它看起来像从正上方拍摄的图像,通过对这些信息的某种变换。
换句话说,我想要一个平放在地面上的完美正方形,从远处以某种相机方向拍摄,然后进行变换,以便之后正方形完美对称。
我一直在尝试通过 OpenCV(C++) 和 Matlab 来做到这一点,但我似乎遗漏了一些关于如何做到这一点的基本知识。
在 Matlab 中,我尝试了以下方法:
%% Transform perspective
img = imread('my_favourite_image.jpg');
R = R_z(yaw_angle)*R_y(pitch_angle)*R_x(roll_angle);
tform = projective2d(R);
outputImage = imwarp(img,tform);
figure(1), imshow(outputImage);
其中 R_z/y/x 是标准旋转矩阵(以度数实现)。
对于一些偏航旋转,一切正常:
R = R_z(10)*R_y(0)*R_x(0);
结果如下:
如果我尝试将图像绕 X 轴或 Y 轴旋转相同的量,我会得到如下结果:
R = R_z(10)*R_y(0)*R_x(10);
但是,如果我旋转 10 度,除以某个巨大的数字,它开始看起来不错。但话又说回来,这是一个没有任何研究价值的结果:
R = R_z(10)*R_y(0)*R_x(10/1000);
有人可以帮我理解为什么绕 X 轴或 Y 轴旋转会使转换变得疯狂吗?有没有办法解决这个问题而不用除以一些随机数和其他魔术?这是否可以使用某种欧拉参数来解决?任何帮助将不胜感激!
更新:完整设置和测量
为了完整起见,添加了完整的测试代码和初始图像,以及平台欧拉角:
代码:
%% Transform perspective
function [] = main()
img = imread('some_image.jpg');
R = R_z(0)*R_y(0)*R_x(10);
tform = projective2d(R);
outputImage = imwarp(img,tform);
figure(1), imshow(outputImage);
end
%% Matrix for Yaw-rotation about the Z-axis
function [R] = R_z(psi)
R = [cosd(psi) -sind(psi) 0;
sind(psi) cosd(psi) 0;
0 0 1];
end
%% Matrix for Pitch-rotation about the Y-axis
function [R] = R_y(theta)
R = [cosd(theta) 0 sind(theta);
0 1 0 ;
-sind(theta) 0 cosd(theta) ];
end
%% Matrix for Roll-rotation about the X-axis
function [R] = R_x(phi)
R = [1 0 0;
0 cosd(phi) -sind(phi);
0 sind(phi) cosd(phi)];
end
初始图像:
在 BODY 坐标系中的相机平台测量:
Roll: -10
Pitch: -30
Yaw: 166 (angular deviation from north)
据我了解,偏航角与转换没有直接关系。但是,我可能对此有误。
其他信息:
我想指定使用设置的环境不包含可以可靠地用作参考的线条(海洋照片)(地平线通常不会出现在图片中)。并且初始图像中的正方形只是用来衡量变换是否正确,在真实场景中不会出现。
【问题讨论】:
你能上传原图和你的旋转矩阵实现吗? 嗨,Scap3y!我在上面的帖子中添加了该问题的完整信息和代码。 好吧,我认为你错过了一个关键步骤:找到与图像中线条水平投影相关的单应性。请参阅this link 了解如何使其工作。一旦你计算了单应性,你可以用它代替你的R
矩阵,这样就可以了。
感谢先生的出色建议。我将要分析的图像中没有任何线条(实际上根本没有)。但是,我认为我可以直接从 RPY 角度创建这些校正向量。校正矩阵看起来很合理,因为它会影响变换矩阵第三行中的元素。正是这些元素实际上使当前的变换变得疯狂,除非乘以一些“随机”的小数;我相信这可能是那个/那些数字。我会回复你的结果。
啊,好吧。那会很麻烦。您可能能够在海洋图像(地平线)中获得 1 条线,但绝对不足以获得矢量(或者至少,不是对矢量的准确估计).. 一切顺利,让我知道如何事实证明。!
【参考方案1】:
所以,这就是我最终要做的事情:我认为除非您实际处理的是 3D 图像,否则校正照片的透视是一项 2D 操作。考虑到这一点,我将变换矩阵的 z 轴值替换为 0 和 1,并对图像应用 2D 仿射变换。
在测得的 Roll = -10 和 Pitch = -30 的情况下,初始图像的旋转(参见初始帖子)按以下方式完成:
R_rotation = R_y(-60)*R_x(10);
R_2d = [ R_rot(1,1) R_rot(1,2) 0;
R_rot(2,1) R_rot(2,2) 0;
0 0 1 ]
这意味着将相机平台旋转到虚拟相机方向,其中相机放置在场景上方,指向正下方。请注意上面矩阵中用于滚动和俯仰的值。
此外,如果旋转图像以使其与平台航向对齐,则可能会添加围绕 z 轴的旋转,给出:
R_rotation = R_y(-60)*R_x(10)*R_z(some_heading);
R_2d = [ R_rot(1,1) R_rot(1,2) 0;
R_rot(2,1) R_rot(2,2) 0;
0 0 1 ]
请注意,这不会改变实际图像 - 它只会旋转它。
因此,围绕 Y 轴和 X 轴旋转的初始图像如下所示:
如上所示,进行这种转换的完整代码是:
% Load image
img = imread('initial_image.jpg');
% Full rotation matrix. Z-axis included, but not used.
R_rot = R_y(-60)*R_x(10)*R_z(0);
% Strip the values related to the Z-axis from R_rot
R_2d = [ R_rot(1,1) R_rot(1,2) 0;
R_rot(2,1) R_rot(2,2) 0;
0 0 1 ];
% Generate transformation matrix, and warp (matlab syntax)
tform = affine2d(R_2d);
outputImage = imwarp(img,tform);
% Display image
figure(1), imshow(outputImage);
%*** Rotation Matrix Functions ***%
%% Matrix for Yaw-rotation about the Z-axis
function [R] = R_z(psi)
R = [cosd(psi) -sind(psi) 0;
sind(psi) cosd(psi) 0;
0 0 1];
end
%% Matrix for Pitch-rotation about the Y-axis
function [R] = R_y(theta)
R = [cosd(theta) 0 sind(theta);
0 1 0 ;
-sind(theta) 0 cosd(theta) ];
end
%% Matrix for Roll-rotation about the X-axis
function [R] = R_x(phi)
R = [1 0 0;
0 cosd(phi) -sind(phi);
0 sind(phi) cosd(phi)];
end
感谢大家的支持,希望对大家有所帮助!
【讨论】:
好的,我看到你做了 +10,因为 Roll 是 -10 (-10+10=0),而 -60 因为 Pitch 是 -30 (-30-60=-90)。但是为什么要轮换the remainder of (90-pitch) degrees in the counter-clockwise direction of the y-axis, and the positive roll angle clockwise of the x-axis
?为什么不尝试将横滚和俯仰都归零呢?为什么将 Pitch 设置为 -90 度而不是 0 可以解决这个问题?【参考方案2】:
我认为您可以通过这种方式进行转换:
1) 让你有四个 3d 点 A(-1,-1,0), B(1,-1,0), C(1,1,0) 和 D(-1,1,0 )。您可以取任意 4 个非共线点。它们与图像无关。
2)您有变换矩阵,因此您可以通过将点坐标乘以变换矩阵来设置相机。您将获得相对于相机位置/方向的 3d 坐标。
3) 您需要将点投影到屏幕平面。最简单的方法是使用正投影(忽略深度坐标)。在这个阶段,您将获得变换点的 2D 投影。
4) 一旦你有 2 组 2D 点坐标(步骤 1 中没有第三坐标的集合和步骤 3 中的集合),你可以以标准方式计算单应矩阵。
5) 对图像应用逆同形变换。
【讨论】:
你说得对,这是 2D 变换。谢谢! :)【参考方案3】:您需要估计一个单应性。对于现成的 Matlab 解决方案,请参阅来自 http://www.robots.ox.ac.uk/~vgg/hzbook/code/ 的函数 vgg_H_from_x_lin.m
。
有关理论,请研究计算机视觉教科书,例如在http://szeliski.org/Book/ 或http://programmingcomputervision.com/downloads/ProgrammingComputerVision_CCdraft.pdf 第 3 章中免费提供的一本
【讨论】:
【参考方案4】:也许由于我对相机参数的误解,我的回答不正确,但我想知道 Yaw/Pitch/Roll 是否与您的对象的位置有关。我用general rotations的公式,我的代码如下(旋转函数R_x
,R_y
,R_z
是从你那里复制过来的,我这里没有贴)
close all
file='http://i.stack.imgur.com/m5e01.jpg'; % original image
I=imread(file);
R_rot = R_x(-10)*R_y(-30)*R_z(166);
R_rot = inv(R_rot);
R_2d = [ R_rot(1,1) R_rot(1,2) 0;
R_rot(2,1) R_rot(2,2) 0;
0 0 1 ];
T = maketform('affine',R_2d);
transformedI = imtransform(I,T);
figure, imshow(I), figure, imshow(transformedI)
结果:
这表明您仍然需要一些旋转操作才能在您的脑海中获得“正确”的对齐方式(但可能不需要相机脑海中的正确位置)。
所以我把R_rot = inv(R_rot);
改成R_rot = inv(R_rot)*R_x(-5)*R_y(25)*R_z(180);
,现在它给了我:
看起来更像你想要的。 谢谢。
【讨论】:
感谢您的回答!刚才我或多或少地得出了相同的结论(请参阅此线程的第三篇文章)。如果您将旋转按 YXZ 顺序放置,则旋转值是有意义的,并考虑相机帧的实际目标状态是什么(相机从场景上方直接指向下方)。为此,您必须沿 y 轴的逆时针方向将相机框架旋转(90 度)度的剩余部分,并沿 x 轴的顺时针方向旋转正滚动角。偏航旋转是非常可选的,只有当你有一个寻北平台时才有意义。 :-)以上是关于使用 Roll-Pitch-Yaw 角度变换图像(图像校正)的主要内容,如果未能解决你的问题,请参考以下文章