【转】仿射变换及其变换矩阵的理解
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了【转】仿射变换及其变换矩阵的理解相关的知识,希望对你有一定的参考价值。
参考技术A posted @ 2019-05-30 17:37 shine-lee 阅读(7203) 评论(7) 编辑 收藏分类: 传统计算机视觉
目录
写在前面
仿射变换:平移、旋转、放缩、剪切、反射
变换矩阵形式
变换矩阵的理解与记忆
变换矩阵的参数估计
参考
博客: blog.shinelee.me | 博客园 | CSDN
写在前面
2D图像常见的坐标变换如下图所示:
这篇文章不包含 透视变换 (projective/perspective transformation),而将重点放在 仿射变换 (affine transformation),将介绍仿射变换所包含的各种变换,以及变换矩阵该如何理解记忆。
仿射变换:平移、旋转、放缩、剪切、反射
仿射变换包括如下所有变换,以及这些变换任意次序次数的组合 :
平移 (translation)和 旋转 (rotation)顾名思义,两者的组合称之为 欧式变换 (Euclidean transformation)或 刚体变换 (rigid transformation);
放缩 (scaling)可进一步分为 uniform scaling 和 non-uniform scaling ,前者每个坐标轴放缩系数相同(各向同性),后者不同;如果放缩系数为负,则会叠加上 反射 (reflection)——reflection可以看成是特殊的scaling;
刚体变换+uniform scaling 称之为, 相似变换 (similarity transformation),即平移+旋转+各向同性的放缩;
剪切变换 (shear mapping)将所有点沿某一指定方向成比例地平移,语言描述不如上面图示直观。
各种变换间的关系如下面的venn图所示:
通过变换矩阵可以更清晰地看出这些变换间的关系和区别。
变换矩阵形式
没有平移或者平移量为0的所有仿射变换可以用如下变换矩阵描述:
[x′y′]=[acbd][xy][x′y′]=[abcd][xy]
不同变换对应的a,b,c,da,b,c,d约束不同,排除了平移变换的所有仿射变换为 线性变换 (linear transformation),其涵盖的变换如上面的venn图所示,其特点是 原点位置不变 , 多次线性变换的结果仍是线性变换 。
为了涵盖平移,引入 齐次坐标 ,在原有2维坐标的基础上,增广1个维度,如下所示:
⎡⎣⎢x′y′1⎤⎦⎥=⎡⎣⎢ad0be0cf1⎤⎦⎥⎡⎣⎢xy1⎤⎦⎥[x′y′1]=[abcdef001][xy1]
所以,仿射变换的变换矩阵统一用 ⎡⎣⎢ad0be0cf1⎤⎦⎥[abcdef001]来描述,不同基础变换的a,b,c,d,e,fa,b,c,d,e,f约束不同,如下所示:
此外,旋转和平移相乘得到刚体变换的变换矩阵,如下,有3个自由度(θ,tx,tyθ,tx,ty),这里旋转方向为逆时针方向,因此与上图中的正负号不同,
⎡⎣⎢cos(θ)sin(θ)0−sin(θ)cos(θ)0txty1⎤⎦⎥⎡⎣⎢xy1⎤⎦⎥=⎡⎣⎢x′y′1⎤⎦⎥[cos(θ)−sin(θ)txsin(θ)cos(θ)ty001][xy1]=[x′y′1]
再乘上uniform scaling得到相似变换,有4个自由度(s,θ,tx,tys,θ,tx,ty),如下:
⎡⎣⎢scos(θ)ssin(θ)0−ssin(θ)scos(θ)0txty1⎤⎦⎥⎡⎣⎢xy1⎤⎦⎥=⎡⎣⎢x′y′1⎤⎦⎥[scos(θ)−ssin(θ)txssin(θ)scos(θ)ty001][xy1]=[x′y′1]
自然,仿射变换的变换矩阵有6个自由度(a,b,c,d,e,fa,b,c,d,e,f)。
变换矩阵的理解与记忆
坐标系 由 坐标原点 和 基向量 决定, 坐标原点 和 基向量 确定了,坐标系也就确定了。
对于坐标系中的位置(x,y)(x,y),其相对坐标原点在[1,0][1,0]方向上的投影为xx,在[0,1][0,1]方向上的投影为yy——这里投影的意思是过(x,y)(x,y)做坐标轴的平行线与坐标轴的交点到原点的距离,即(x,y)(x,y)实际为:
[xy]=x[10]+y[01]=[1001][xy][xy]=x[10]+y[01]=[1001][xy]
当坐标系变化,坐标系中的点也跟着变化 ,但 点相对新坐标系 (x′−y′x′−y′坐标系) 的位置不变 仍为(x,y)(x,y),以旋转变换为例,新坐标轴的基向量则变为[cos(θ),sin(θ)][cos(θ),sin(θ)]和[−sin(θ),cos(θ)][−sin(θ),cos(θ)],所以点变化到新位置为:
[x′y′]=x[cos(θ)sin(θ)]+y[−sin(θ)cos(θ)]=[cos(θ)sin(θ)−sin(θ)cos(θ)][xy][x′y′]=x[cos(θ)sin(θ)]+y[−sin(θ)cos(θ)]=[cos(θ)−sin(θ)sin(θ)cos(θ)][xy]
新位置和新基向量是相对绝对坐标系(x−yx−y坐标系)而言的。其他变换矩阵同理。
总结一下:
所有变换矩阵只需关注一点: 坐标系的变化 ,即 基向量和原点的变化 ;
坐标系变化到哪里,坐标系中的所有点也跟着做同样的变化 ;
坐标系的变换分为 基向量的变化 以及 坐标原点的变化 ,在仿射变换矩阵 ⎡⎣⎢ad0be0cf1⎤⎦⎥[abcdef001]中, [ad][ad]和[be][be]为新的基向量,[cf][cf]为新的坐标原点,先变化基向量,再变化坐标原点;
这时再对照上面的各种变换矩阵,就很好理解了。
变换矩阵的参数估计
如果给定两个对应点集,如何估计指定变换矩阵的参数?
一对对应点可以列两个线性方程,多个对应点可以列出线性方程组,为了求解参数,需要的对应点数至少为自由度的一半,多个点时构成超定方程组,可以基于最小二乘或者SVD分解等方法进行求解,这里不再展开。
参考
Image Alignment and Stitching: A Tutorial
wiki: Affine transformation
Geometric Transformation
Coordinates and Transformations
Transformations
Geometric Transformations
Image Geometry
原文链接: https://www.cnblogs.com/shine-lee/p/10950963.html
affine transformation matrix 仿射变换矩阵 与 OpenGL
变换模型是指根据待匹配图像与背景图像之间几何畸变的情况,所选择的能最佳拟合两幅图像之间变化的几何变换模型。可采用的变换模型有如下几种:刚性变换、仿射变换、透视变换和非线形变换等,如下图:
参考: http://wenku.baidu.com/view/826a796027d3240c8447ef20.html
其中第三个的仿射变换就是我们这节要讨论的。
仿射变换(Affine Transformation)
Affine Transformation是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”(译注:straightness,即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”(译注:parallelness,其实是指保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变。)。
c和d的区别可以看下图:
仿射变换可以通过一系列的原子变换的复合来实现,包括:平移(Translation)、缩放(Scale)、翻转(Flip)、旋转(Rotation)和剪切(Shear)。
仿射变换可以用下面公式表示:
参考:http://wenku.baidu.com/view/826a796027d3240c8447ef20.html
这个矩阵乘法的计算如下:
具体到二维的仿射变换的计算如下:
几种典型的仿射变换如下:
平移变换 Translation
平移变换是一种“刚体变换”,rigid-body transformation,就是不会产生形变的理想物体。
效果:
缩放变换(Scale)
将每一点的横坐标放大(缩小)至sx倍,纵坐标放大(缩小)至sy倍,变换矩阵为:
变换效果如下:
剪切变换(Shear)
变换矩阵为:
相当于一个横向剪切与一个纵向剪切的复合
效果:
旋转变换(Rotation)
目标图形围绕原点顺时针旋转theta弧度,变换矩阵为:
效果:
组合
旋转变换,目标图形以(x, y)为轴心顺时针旋转theta弧度,变换矩阵为:
相当于两次平移变换与一次原点旋转变换的复合:
先移动到中心节点,然后旋转,然后再移动回去。
以上是关于【转】仿射变换及其变换矩阵的理解的主要内容,如果未能解决你的问题,请参考以下文章