一、背景
1.1 概念定义
我们这里想要实现的图像拼接,既不是如题图 1 和 2 这样的
“图片艺术拼接”,也不是如图 3 这样的“显示拼接”,而是实
现类似“BaiDU 全景”这样的全部的或者部分的实际场景的重新
回放。
对于图像拼接的流程有很多定义方式,本教程中主要介绍实
现主流方法,总结梳理如下:
图像采集->投影变换->特征点匹配->拼接对准->融合->反
- 1 -
投影
图像采集不仅仅指的是普通的图像数据的获取。为了能够拼
接过程能够顺利进行、拼接结果能够满足要求,我们在采集图像
的时候就使用了一些方法、固化了一些参数;
投影变换为了采集的图像能够方便拼接,我们需要将各个图
片变换到统一的平面上去。而变换的依据就是在图像采集的设定
下来的采集方法。
特 征 点 匹 配 是 先 进 的 特 征 寻 找 方 法 , 一 般 是
SHIFT/SURF/ORB,简单介绍模板匹配。所谓“特征点”,就是
这样同样的一个点,在不同的图片上面都会显示为同样的特征。
那么如果掌握了足够的可信度高的特征点,就可以将图片中各个
物体变换到同意的平面上去。RANSAC 特征点提纯也是较为重
要的内容。
拼接对准是图像拼接的核心部分,就是根据前面寻找到的匹
配关系,将投影变换后的图片再次变换并合并成一张图片。需要
注意的是,当大量图片拼接的时候,会出现错误累积的情况,我
们采用“光束平差法”应对;同时还有插值计算的相关内容。
图像融合是用来消除由于几何校正、动态的场景或光照变化
引起的相邻图像间的强度或颜色不连续问题,也就是缝隙消除。
我们介绍一种复杂的方法和一种直接的方法,用于不同的情况。
反投影没有名字听起来那么玄乎,实际上就是将拼接的结果
重新生成的过程。一般还是生成图片,但是也可以变成其它的类
- 2 -
型。
1.2 国内外研究现状
关于图像拼接的方法国内外已有不少的论文发表,其算法大
致可分为基于模型的方法、基于变换域的方法、基于灰度相关的
方法和基于特征的方法,而如何提高图像拼接的效率,减少处理时
间和增强拼接系统的适应性一直是研究的重点。
(历史有兴趣可以看,不影响主要内容学习)1996 年,微软
研究院的瓦 chadrSezhski 提出了一种 ZD 空间八参数投影变换模
型,采用 Lvenebegr 一 Marquadrt 迭代非线性最小化方法(简称 L
一 M 算法)求出图像间的几何变换参数来进行图像配准。这种方
法在处理具有平移、旋转、仿射等多种变换的待拼接图像方面效
果好,收敛速度快,因此成为图像拼接领域的经典算法。
2000 年,shmuelPeleg 等人在瓦 chardszeliski 的基础上作了进
一步的改进,提出了自适应图像拼接模型,根据相机的不同运动而
自适应选择拼接模型,通过把图像分成狭条进行多重投影来完成
图像的拼接。这一研究成果推动了图像拼接技术的进一步的发展,
从此自适应问题成为图像拼接领域新的研究热点。匹兹堡大学的
SevketGumustekin 对消除在固定点旋转摄像机拍摄自然景物时
形成的透视变形和全景图像的拼接进行了研究。通过标定摄像机
来建立成像模型,根据成像模型将捕获到的图像投影到统一的高
斯球面上,从而得到拼接图像。这种方法拼接效果好、可靠性高,
但是要求对摄像机进行精确的标定,同时要求摄像机透镜本身的
- 3 -
畸变参数引起的图像变形可以忽略不计。
1975 年,Kuglni 和 Hines 提出了相位相关法,利用傅立叶变换
将两幅待配准的图像变换到频域,然后利用互功率谱直接计算出
两幅图像间的平移矢量。1987 年,DeCasrt 断口 Mornadi 提出了扩
展相位相关法,利用傅立叶变换的性质能够实现具有旋转和平移
变换的图像的配准。随着快速傅立叶变换算法的提出以及信号处
理领域对傅立叶变换的成熟应用,Rdedy 和 chatterji 提出了基于快
速傅立叶变换 F(FT 一 basde)的方法,利用极坐标变换和互功率谱,
对具有平移、旋转和缩放变换的图像都能够实现精确配准。相位
相关法计算简单精确,但要求待配准图像之间有较大重叠比例,同
时计算量和适用范围与图像的大小有很大关系。除了傅立叶变换
外,人们还选择更可靠、更符合人眼视觉生理特征的 Gbaor 变换
和小波变换进行图像匹配。基于灰度相关的方法是以两幅图像重
叠部分所对应在 RGB 或 CMY 颜色系统中灰度级的相似性为准
则寻找图像的配准位置。常用的算法有比值匹配法、块匹配法和
网格匹配法。比值匹配法是从一幅图像的重叠区域中部分相邻的
两列上取出部分像素,然后以它们的比值作为模板,在另一幅图像
中搜索最佳匹配,这种算法计算量较小,但精度低;块匹配法是以
一幅图像重叠区域中的一块作为模板,在另一幅图像中搜索与此
模板最相似的匹配块,这种算法精度较高,但计算量过大;网格匹
配法嗜先进行粗匹配,每次水平或垂直移动一个步长,记录最佳匹
配位置,然后再进行精确匹配,每次步长减半,循环此过程直至步
- 4 -
长减为 O,这种算法较前两种运算量有所减小,但如果粗匹配步长
过大会造成较大的误差。基于特征的方法首先从待匹配图像中提
取特征集,利用特征的对应关系进行匹配。基于特征的方法利用
了图像的显著特征,具有计算量小,速度快的特点,对与图像的畸
变、噪声、遮挡等具有一定的鲁棒性,但是它的匹配性能在很大
程度上取决于特征提取的质量。提出了一种轮廓的图像匹配方法,
采用 LOG 算子提取出两幅图像的特征轮廓,用链码来表示轮廓,
根据相同轮廓的链码差分值不变的特性找出对应轮廓,从而确定
图像间的变换关系。这种方法在特征轮廓的提取上容易受到噪声
的干扰,其计算量随着轮廓数量的增多而增长。使用 HarriS 检测
器提取兴趣点,通过计算归一化相关系数,沿极线寻找一幅图像中
兴趣点的对应点,然后使用第三幅图像来得到更准确的对应;Jnae
提出了基于小波变换的分层图像匹配算法,在分解后的每一层图
像中提取兴趣点进行匹配,用并行策略提高了计算速度。
图像匹配算法经过几十年的发展已经取得了很大的进展,但
由于拍摄环境复杂多变,现在还没有一种算法能够解决所有图像
的匹配问题。现有的几种方法各有其优缺点,如果能综合利用这
些方法的优点将会取得更好的匹配结果。
( 这 里 要 注 意 学 习 ) 软 件 方 面 , 以 微 软 研 究 院 “Image
Composite Editor”(下称 ICE)效果最好,我判断 ICE 的作者很可
能就是图像拼接相关论文的作者,或者至少是在其指导下完成
的。ICE 基本是将论文中的特性全部都体现出来了。
- 5 -
正是因为 ICE 的优良特性(和不开源性),我一般将其作为
图像拼接的“验证工具”来使用。
- 6 -
1.3 图像拼接技术的广泛运用
图像序列包含了实际场景在空间和时间上的信息,其中的每
一幅图像只反映了实际场景在空间、时间上的局部信息。由于它
们在空间和时间上具有很大的冗余,因此采用图像拼接技术可以
将一组图像序列转换为单个场景的表示,大大减小了场景表示的
数据量,最大程度上压缩了场景数据信息。因此,图像拼接技术
在摄影测量学、计算机图形学、图像处理、视频通信和计算机视
觉等科学领域得到了广泛的应用。具体应用有虚拟场景的构建和
虚拟漫游、医学图像分析、大型航空照片和卫星遥感图像的拼接、
环境监测等领域。
1)消费类 VR
虚拟现实技术(Virtual Reality)就是利用计算机构建一个逼
真的虚拟环境,即以仿真的方式给人们创造一个反映实体对象变
化及其相互作用的三维世界,使得人们能够通过使用专用设备,
- 7 -
就能像在自然环境中一样对虚拟环境中的实体进行观察与控制。
(TIP 注意,这里就是“反投影”的一个灵活使用。拼接
的结果最后不是以单幅图片显示出来的,而是处理以后,通过
VR 双屏幕显示出来的。所谓“反”指的就是逆过程)
2)遥感技术
随着航空航天技术的发展,侦察卫星或航空遥感器能够实时
获得目标的高清晰图像。为了扩大视野,提高分辨率,获得质量
更高、位置更精确的信息,需要将来自不同传感器的两幅或多幅
遥感图像拼接成一幅影像图。下图所示,是由多幅遥感图像拼接
成的月球表面拼接图像。
3)医学方面
在医学领域,从 CT 图像、X 光照片到人体的细胞照片,医
学对图像的质量和处理手段都有极高的要求,许多图像处理技术
- 8 -