前言

$egin{bmatrix} a_1&a_2\ a_3&a_4 end{bmatrix}$ 用来处理旋转和缩放，比如有个点是 $[2, 3]$ ，经过 $egin{bmatrix} 2&0\ 0&2 end{bmatrix}$ 矩阵变换后就成了 $[4, 6]$ 即被放大了四倍，而经过 $egin{bmatrix} 0&1\ 1&0 end{bmatrix}$ 就变成了 $[3, 2]$ 即从原来的 $[2, 3]$ 坐标点旋转到了 $[3, 2]$ 坐标点。
$egin{bmatrix} b_1\ b_2 end{bmatrix}$ 这个就显而易见是平移
$c_1,c_2]$ 是投影向量，因为点乘就是 $c_1x+c_2y$ ，刚好代表一个向量在另一个向量的投影

投影变换(projective transformation)展示的是当观察者视角变化以后，观察体的变化情况，通常用于产生透视畸变(perspective distortion)，有时候称为透视变换(perspective transformation)

仿射变换(affine transformation)用于缩放(scaling)、拉伸(skew)、旋转(rotation)

注意的点：

两个变换都是将直线投影到直线
两条平行直线通过仿射变换后依旧是两条平行的直线
两条平行直线通过透视变换后可以是两条相交的直线

在这里插入图片描述

从数学上来讲，它俩的区别在变换矩阵的最后一行 $c_1,c_2]$ 的值上，仿射变换是0值，而透视变换通常不是。所以这一点也能说明仿射变换是透视变换的子集。

但是有一个要求，变换矩阵一定不能是奇异矩阵，因为奇异矩阵会导致 $A X = b$ 有无穷解或者无解，也就是说会出现多个点变换到同一个点的情况。

变换公式

根据OpenCV中所述：

仿射变换的变换公式为:
$_{11} x + exttt{M} _{12} y + exttt{M} _{13}, exttt{M} _{21} x + exttt{M} _{22} y + exttt{M} _{23})$
透视变换变换公式为：

$frac{M_{11} x + M_{12} y + M_{13}}{M_{31} x + M_{32} y + M_{33}} , frac{M_{21} x + M_{22} y + M_{23}}{M_{31} x + M_{32} y + M_{33}} ight )$

代码实践

使用opencv测试效果

仿射变换

使用warpAffine函数，将图片旋转45度，同时向右平移300像素，向下平移100像素

#仿射变换
degree=np.deg2rad(45)
M1=np.array([
    [np.cos(degree),-np.sin(degree),300],
    [np.sin(degree),np.cos(degree),100]
])
dst1 = cv2.warpAffine(img,M1,(img.shape[1]*2,img.shape[0]*2))

plt.figure(figsize=(8,8))
plt.subplot(121)
plt.imshow(img)
plt.subplot(122)
plt.imshow(dst1)
1
2
3
4
5
6
7
8
9
10
11
12
13

在这里插入图片描述

透视变换

使用warpPerspective函数

如果将透视变换使用上面的仿射变换矩阵，补齐第三行，可以得到和仿射变换一样的结果

#透视变换
degree=np.deg2rad(45)
M2=np.array([
    [np.cos(degree),-np.sin(degree),300],
    [np.sin(degree),np.cos(degree),100],
    [0,0,1]
])
dst2 = cv2.warpPerspective(img,M2,(img.shape[1]*2,img.shape[0]*2))

plt.figure(figsize=(8,8))
plt.subplot(121)
plt.imshow(img)
plt.subplot(122)
plt.imshow(dst2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14

在这里插入图片描述

一旦稍微改变投影向量，也就是第三行的值，就会发生很大的变化

#透视变换
degree=np.deg2rad(45)
M2=np.array([
    [np.cos(degree),-np.sin(degree),300],
    [np.sin(degree),np.cos(degree),100],
    [0,-0.0015,1]
])
dst2 = cv2.warpPerspective(img,M2,(img.shape[1]*2,img.shape[0]*2))

plt.figure(figsize=(8,8))
plt.subplot(121)
plt.imshow(img)
plt.subplot(122)
plt.imshow(dst2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14

在这里插入图片描述

所以我们通常能够通过仿射变换矩阵思考出变换后的样子，但是透视变换却很难预测出变换后的样子。

理论扩展

上面说过仿射变换是特殊的透视变换，后者变换矩阵的第3行 $c_1,c_2$ 为0的时候就变成了前者。

为了让变换可控，我们可以预先构建某些点来规定变换矩阵的映射是什么样的，依据变换矩阵能看出参数量：透视变换的矩阵为8个参数，仿射变换矩阵为6个参数。

根据线性代数，如果需要

求解仿射变换矩阵：6个未知数需要6个方程，即需要3组对应点
求解透视变换矩阵：8个未知数需要8个方程，即需要4组对应点

所以比如想把原图变成平行四边形时，可以平行四边形上的三个点求解仿射变换：

#获取仿射变换矩阵
src_pts = np.float32([[0,0],[0,1],[1,1]])
dst_pts = np.float32([[0,0],[1,1],[2,1]])
M = cv2.getAffineTransform(src_pts,dst_pts)
dst1 = cv2.warpAffine(img,M,(img.shape[1]*2,img.shape[0]*2))

plt.figure(figsize=(8,8))
plt.subplot(121)
plt.imshow(img)
plt.subplot(122)
plt.imshow(dst1)
1
2
3
4
5
6
7
8
9
10
11

在这里插入图片描述

想把原图变成直角梯形时，可以使用直角梯形上的四个点求解透视变换

#获取透视变换矩阵
src_pts = np.float32([[0,0],[0,300],[400,300],[400,0]])
dst_pts = np.float32([[0,0],[0,300],[200,300],[400,0]])
M = cv2.getPerspectiveTransform(src_pts,dst_pts)
dst2 = cv2.warpPerspective(img,M,(img.shape[1]*2,img.shape[0]*2))

plt.figure(figsize=(8,8))
plt.subplot(121)
plt.imshow(img)
plt.subplot(122)
plt.imshow(dst2)
1
2
3
4
5
6
7
8
9
10
11

在这里插入图片描述

总结

其实就是对图像处理的一些基本知识补充，在之前写过的换脸博客1和博客2中有用到相关理论。

博客和公众号致力于图像、机器学习、运动捕捉方向的理论和代码实践，注重基础和实践，有兴趣可关注一波，代码通常公布在公众号中的github网址

在这里插入图片描述

文章知识点与官方知识档案匹配，可进一步学习相关知识

OpenCV技能树几何变换和图像特征仿射变换20473 人正在系统学习中

前言

理论

变换公式

代码实践

仿射变换

透视变换

理论扩展

总结

评论记录：