数字图像基本处理——几何变换(geometry operation)
本节我们总结一下数字图像的几何变换,区别于前面几种操作(白平衡,灰度变换,空间滤波)针对于像素强度,几何变换主要针对像素的位置。 对空间的操作主要包括仿射(线性)变换(平移,旋转,伸缩,剪切)和投影变换。每种变换方法的具体细节不展开阐述,就是把对像素(变量)的操作提取出来作为变换矩阵(其实也就是线性代数中的线性变换,推荐B站从空间几何的角度理解线性代数: https://b23.tv/BV1ys411472E/p1 )。每个矩阵对应一种变换空间,如果进行多种叠加操作就是对应矩阵不断左乘,多个线性空间不断作用的结果。 仿射变换 平移,旋转,伸缩是严格的2D线性变换,是刚体变换(本身的形态不发生变换),剪切可以保证图中的平行线不变。2D线性变换中的变量有6个,也就是自由度DOF=6。 2D线性变换通项如下: 具体来说: (图中的旋转对应逆时针旋转) 投影变换 (投影变换中不保证平行线仍然平行)投影变换对应原来的线性变换再除以一个线性变换,投影变换矩阵中前两行对应线性变换中的参数,这样可以用该3 X 3的矩阵统一线性变换及投影变换,当最后一行为[0 0 1]时就是线性变换。 图像插值 由图像几何变换带来一个问题就是变换之后的像素值可能不是一个整数,而我们所使用的像素值一般是整数,所以需要近似来解决。插值的关键思想就是保证变换后的像素点和最近的邻居最相似,最远的邻居最不相似,考虑的邻居越多