图像拼接算法及实现(一)
来源:中国论文下载中心 [ 09-06-03 16:36:00 ] 作者:陈挺 编辑:studa090420
论文关键词:图像拼接 图像配准 图像融合 全景图
论文摘要:图像拼接(image mosaic)技术是将一组相互间重叠部分的图像序列进行空间
匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰
的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计
算机图形学等领域有着广泛的应用价值。 一般来说,图像拼接的过程由图像获取,图像配准,
图像合成三步骤组成,其中图像配准是整个图像拼接的基础。本文研究了两种图像配准算法:
基于特征和基于变换域的图像配准算法。 在基于特征的配准算法的基础上,提出一种稳健的
基于特征点的配准算法。首先改进 Harris 角点检测算法,有效提高所提取特征点的速度和精
度。然后利用相似测度 NCC(normalized cross correlation——归一化互相关),通过用双向最大
相关系数匹配的方法提取出初始特征点对,用随机采样法 RANSAC(Random Sample
Consensus)剔除伪特征点对,实现特征点对的精确匹配。最后用正确的特征点匹配对实现图像
的配准。本文提出的算法适应性较强,在重复性纹理、旋转角度比较大等较难自动匹配场合
下仍可以准确实现图像配准。
Abstract:Image mosaic is a technology that carries on the spatial matching to a series of
image which are overlapped with each other, and finally builds a seamless and high quality image
which has high resolution and big eyeshot. Image mosaic has widely applications in the fields of
photogrammetry, computer vision, remote sensing image processing, medical image analysis,
computer graphic and so on. 。In general, the process of image mosaic by the image acquisition,
image registration, image synthesis of three steps, one of image registration are the basis of the
entire image mosaic. In this paper, two image registration algorithm: Based on the characteristics
and transform domain-based image registration algorithm. In feature-based registration algorithm
based on a robust feature-based registration algorithm points. First of all, to improve the Harris
corner detection algorithm, effectively improve the extraction of feature points of the speed and
accuracy. And the use of a similar measure of NCC (normalized cross correlation - Normalized
cross-correlation), through the largest correlation coefficient with two-way matching to extract the
feature points out the initial right, using random sampling method RANSAC (Random Sample
Consensus) excluding pseudo-feature points right, feature points on the implementation of the
exact match. Finally with the correct feature point matching for image registration implementation.
In this paper, the algorithm adapted, in the repetitive texture, such as relatively large rotation more
difficult to automatically match occasions can still achieve an accurate image registration.
Key words: image mosaic, image registration, image fusion, panorama
第一章 绪论
1.1 图像拼接技术的研究背景及研究意义
图像拼接(image mosaic)是一个日益流行的研究领域,他已经成为照相绘图学、计算机
视觉、图像处理和计算机图形学研究中的热点。图像拼接解决的问题一般式,通过对齐一系
列空间重叠的图像,构成一个无缝的、高清晰的图像,它具有比单个图像更高的分辨率和更
大的视野。
早期的图像拼接研究一直用于照相绘图学,主要是对大量航拍或卫星的图像的整合。近
年来随着图像拼接技术的研究和发展,它使基于图像的绘制(IBR)成为结合两个互补领域
——计算机视觉和计算机图形学的坚决焦点,在计算机视觉领域中,图像拼接成为对可视化
场景描述(Visual Scene Representaions)的主要研究方法:在计算机形学中,现实世界的图
像过去一直用于环境贴图,即合成静态的背景和增加合成物体真实感的贴图,图像拼接可以
使 IBR 从一系列真是图像中快速绘制具有真实感的新视图。
在军事领域网的夜视成像技术中,无论夜视微光还是红外成像设备都会由于摄像器材的
限制而无法拍摄视野宽阔的图片,更不用说 360 度的环形图片了。但是在实际应用中,很
多时候需要将 360 度所拍摄的很多张图片合成一张图片,从而可以使观察者可以观察到周
围的全部情况。使用图像拼接技术,在根据拍摄设备和周围景物的情况进行分析后,就可以
将通过转动的拍摄器材拍摄的涵盖周围 360 度景物的多幅图像进行拼接,从而实时地得到
超大视角甚至是 360 度角的全景图像。这在红外预警中起到了很大的作用。
微小型履带式移动机器人项目中,单目视觉不能满足机器人的视觉导航需要,并且单目
视觉机器人的视野范围明显小于双目视觉机器人的视野。利用图像拼接技术,拼接机器人双
目采集的图像,可以增大机器人的视野,给机器人的视觉导航提供方便。在虚拟现实领域中,
人们可以利用图像拼接技术来得到宽视角的图像或 360 度全景图像,用来虚拟实际场景。
这种基于全景图的虚拟现实系统,通过全景图的深度信息抽取,恢复场景的三维信息,进而
建立三维模型。这个系统允许用户在虚拟环境中的一点作水平环视以及一定范围内的俯视和
仰视,同时允许在环视的过程中动态地改变焦距。这样的全景图像相当于人站在原地环顾四
周时看到的情形。在医学图像处理方面,显微镜或超声波的视野较小,医师无法通过一幅图
像进行诊视,同时对于大目标图像的数据测量也需要把不完整的图像拼接为一个整体。所以
把相邻的各幅图像拼接起来是实现远程数据测量和远程会诊的关键环节圆。在遥感技术领域
中,利用图像拼接技术中的图像配准技术可以对来自同一区域的两幅或多幅图像进行比较,
也可以利用图像拼接技术将遥感卫星拍摄到的有失真地面图像拼接成比较准确的完整图像,
作为进一步研究的依据。
从以上方面可以看出,图像拼接技术的应用前景十分广阔,深入研究图像拼接技术有着很重
要的意义
1.2 图像拼接算法的分类
图像拼接作为这些年来图像研究方面的重点之一,国内外研究人员也提出了很多拼接算
法。图像拼接的质量,主要依赖图像的配准程度,因此图像的配准是拼接算法的核心和关键。
根据图像匹配方法的不同仁阔,一般可以将图像拼接算法分为以下两个类型:
(1) 基于区域相关的拼接算法。
这是最为传统和最普遍的算法。基于区域的配准方法是从待拼接图像的灰度值出发,对
待配准图像中一块区域与参考图像中的相同尺寸的区域使用最小二乘法或者其它数学方法
计算其灰度值的差异,对此差异比较后来判断待拼接图像重叠区域的相似程度,由此得到待
拼接图像重叠区域的范围和位置,从而实现图像拼接。也可以通过 FFT 变换将图像由时域
变换到频域,然后再进行配准。对位移量比较大的图像,可以先校正图像的旋转,然后建立
两幅图像之间的映射关系。
当以两块区域像素点灰度值的差别作为判别标准时,最简单的一种方法是直接把各点灰度的
差值累计起来。这种办法效果不是很好,常常由于亮度、对比度的变化及其它原因导致拼接
失败。另一种方法是计算两块区域的对应像素点灰度值的相关系数,相关系数越大,则两块
图像的匹配程度越高。该方法的拼接效果要好一些,成功率有所提高。
(2) 基于特征相关的拼接算法。
基于特征的配准方法不是直接利用图像的像素值,而是通过像素导出图像的特征,然后
以图像特征为标准,对图像重叠部分的对应特征区域进行搜索匹配,该类拼接算法有比较高
的健壮性和鲁棒性。
基于特征的配准方法有两个过程:特征抽取和特征配准。首先从两幅图像中提取灰度变化明
显的点、线、区域等特征形成特征集冈。然后在两幅图像对应的特征集中利用特征匹配算法
尽可能地将存在对应关系的特征对选择出来。一系列的图像分割技术都被用到特征的抽取和
边界检测上。如 canny 算子、拉普拉斯高斯算子、区域生长。抽取出来的空间特征有闭合
的边界、开边界、交叉线以及其他特征。特征匹配的算法有:交叉相关、距离变换、动态编
程、结构匹配、链码相关等算法。
1.3 本文的主要工作和组织结构
本文的主要工作:
(1) 总结了前人在图像拼接方面的技术发展历程和研究成果。
(2) 学习和研究了前人的图像配准算法。
(3) 学习和研究了常用的图像融合算法。
(4) 用 matlab 实现本文中的图像拼接算法
(5) 总结了图像拼接中还存在的问题,对图像拼接的发展方向和应用前景进行展望。
本文的组织结构:
第一章主要对图像拼接技术作了整体的概述,介绍了图像拼接的研究背景和应用前景,
以及图像拼接技术的大致过程、图像拼接算法的分类和其技术难点。第二章主要介绍讨论了
图像预处理中的两个步骤,即图像的几何校正和噪声点的抑制。第三章主要介绍讨论了图像
配准的多种算法。第四章主要介绍讨论了图像融合的一些算法。第五章主要介绍图像拼接软
件实现本文的算法。第六章主要对图像拼接中还存在的问题进行总结,以及对图像拼接的发
展进行展望。
1.4 本章小结
本章主要对图像拼接技术作了整体的概述,介绍了图像拼接的研究背景和应用前景,以
图像拼接算法的分类和其技术难点,并且对全文研究内容进行了总体介绍。
第二章 图像拼接的基础理论及图像预处理
2.1 图像拼接
图像拼接技术主要有三个主要步骤:图像预处理、图像配准、图像融合与边界平滑,
如图。
图像拼接技术主要分为三个主要步骤:图像预处理、图像配准、图像融合与边界平滑,
图像预处理主要指对图像进行几何畸变校正和噪声点的抑制等,让参考图像和待拼接图像不
存在明显的几何畸变。在图像质量不理想的情况下进行图像拼接,如果不经过图像预处理,
很容易造成一些误匹配。图像预处理主要是为下一步图像配准做准备,让图像质量能够满足
图像配准的要求。图像配准主要指对参考图像和待拼接图像中的匹配信息进行提取,在提取
出的信息中寻找最佳的匹配,完成图像间的对齐。图像拼接的成功与否主要是图像的配准。
待拼接的图像之间,可能存在平移、旋转、缩放等多种变换或者大面积的同色区域等很难匹
配的情况,一个好的图像配准算法应该能够在各种情况下准确找到图像间的对应信息,将图
像对齐。图像融合指在完成图像匹配以后,对图像进行缝合,并对缝合的边界进行平滑处理,
让缝合自然过渡。由于任何两幅相邻图像在采集条件上都不可能做到完全相同,因此,对于
一些本应该相同的图像特性,如图像的光照特性等,在两幅图像中就不会表现的完全一样。
图像拼接缝隙就是从一幅图像的图像区域过渡到另一幅图像的图像区域时,由于图像中的某
些相关特性发生了跃变而产生的。图像融合就是为了让图像间的拼接缝隙不明显,拼接更自
然
2.2 图像的获取方式
图像拼接技术原理是根据图像重叠部分将多张衔接的图像拼合成一张高分辨率全景
图 。这些有重叠部分的图像一般由两种方法获得 : 一种是固定照相机的转轴 ,然后绕轴旋
转所拍摄的照片 ;另一种是固定照相机的光心 ,水平摇动镜头所拍摄的照片。其中 ,前者主
要用于远景或遥感图像的获取 ,后者主要用于显微图像的获取 ,它们共同的特点就是获得有
重叠的二维图像。
2.3 图像的预处理
2.3.1 图像的校正
当照相系统的镜头或者照相装置没有正对着待拍摄的景物时候,那么拍摄到的景物图像
就会产生一定的变形。这是几何畸变最常见的情况。另外,由于光学成像系统或电子扫描系
统的限制而产生的枕形或桶形失真,也是几何畸变的典型情况。几何畸变会给图像拼接造成
很大的问题,原本在两幅图像中相同的物体会因为畸变而变得不匹配,这会给图像的配准带
来很大的问题。因此,解决几何畸变的问题显得很重要。
图象校正的基本思路是,根据图像失真原因,建立相应的数学模型,从被污染或畸变的
图象信号中提取所需要的信息,沿着使图象失真的逆过程恢复图象本来面貌。实际的复原过
程是设计一个滤波器,使其能从失真图象中计算得到真实图象的估值,使其根据预先规定的
误差准则,最大程度地接近真实图象。
2.3.2 图像噪声的抑制
图像噪声可以理解为妨碍人的视觉感知,或妨碍系统传感器对所接受图像源信息进行理
解或分析的各种因素,也可以理解成真实信号与理想信号之间存在的偏差。一般来说,噪声
是不可预测的随机信号,通常采用概率统计的方法对其进行分析。噪声对图像处理十分重要,
它影响图像处理的各个环节,特别在图像的输入、采集中的噪声抑制是十分关键的问题。若
输入伴有较大的噪声,必然影响图像拼接的全过程及输出的结果。根据噪声的来源,大致可
以分为外部噪声和内部噪声;从统计数学的观点来定义噪声,可以分为平稳噪声和非平稳噪
声。各种类型的噪声反映在图像画面上,大致可以分为两种类型。一是噪声的幅值基本相同,
但是噪声出现的位置是随机的,一般称这类噪声为椒盐噪声。另一种是每一点都存在噪声,
但噪声的幅值是随机分布的,从噪声幅值大小的分布统计来看,其密度函数有高斯型、瑞利
型,分别成为高斯噪声和瑞利噪声,又如频谱均匀分布的噪声称为白噪声等。
1.均值滤波
所谓均值滤波实际上就是用均值替代原图像中的各个像素值。均值滤波的方法是,对将
处理的当前像素,选择一个模板,该模板为其邻近的若干像素组成,用模板中像素的均值来
替代原像素的值。如图 2.4 所示,序号为 0 是当前像素,序号为 1 至 8 是邻近像素。求模板
中所有像素的均值,再把该均值赋予当前像素点((x, y),作为处理后图像在该点上的灰度
g(x,y),即
g(x,y)=
(2-2-2-1)
其中,s 为模板,M 为该模板中包含像素的总个数。
图 2.2.2.1 模板示意图
2.中值滤波
中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术。它的核心
算法是将模板中的数据进行排序,这样,如果一个亮点(暗点)的噪声,就会在排序过程中
被排在数据序列的最右侧或者最左侧,因此,最终选择的数据序列中见位置上的值一般不是
噪声点值,由此便可以达到抑制噪声的目的。
取某种结构的二维滑动模板,将模板内像素按照像素值的大小进行排序,生成单调上升(或
下降)的二维数据序列。二维德中值滤波输出为
( 2-2-2-2 )
其中,f(x,y),g (x,y)分别为原图像和处理后的图像,w 二维模板,k ,l 为模板的长宽,Med 为
取中间值操作,模板通常为 3 3 、5 5 区域,也可以有不同形状,如线状、圆形、十字形、
圆环形。
2.4 本章小结
本章主要介绍了图像几何畸变校正和图像噪声抑制两种图像预处理.
第三章 图像配准算法
3.1 图像配准的概念
图像配准简而言之就是图像之间的对齐。图像配准定义为:对从不同传感器或不同时间或
不同角度所获得的两幅或多幅图像进行最佳匹配的处理过程。为了更清楚图像配准的任务,
我们将图像配准问题用更精确的数学语言描述出来。配准可以用描述为如下的问题:
给定同一景物的从不同的视角或在不同的时间获取的两个图像 I ,I 和两个图像间的相似度
量 S(I ,I ),找出 I ,I 中的同名点,确定图像间的最优变换 T,使得 S(T(I ),I )达到最大值。
图像配准总是相对于多幅图像来讲的,在实际工作中,通常取其中的一幅图像作为配准
的基准,称它为参考图,另一幅图像,为搜索图。图像配准的一般做法是,首先在参考图上选取
以某一目标点为中心的图像子块,并称它为图像配准的模板,然后让模板在搜索图上有秩序
地移动,每移到一个位置,把模板与搜索图中的对应部分进行相关比较,直到找到配准位置
为止。
如果在模板的范围内,同一目标的两幅图像完全相同,那么完成图像配准并不困难。然
而,实际上图像配准中所遇到的同一目标的两幅图像常常是在不同条件下获得的,如不同的
成像时间、不同的成像位置、甚至不同的成像系统等,再加上成像中各种噪声的影响,使同
一目标的两幅图像不可能完全相同,只能做到某种程度的相似,因此图像配准是一个相当复
杂的技术过程。
3.2 基于区域的配准
3.2.1 逐一比较法
设搜索图为 s 待配准模板为 T,如图 3.1 所示,S 大小为 M N,T 大小为 U V,如图所示。
图 3.1 搜索图 S 与模板 T 示意图
逐一比较法的配准思想是:
在搜索图 S 中以某点为基点(i,j),截取一个与模板 T 大小一样的分块图像,这样的基点有
(N-V+1)个分块图像中找一个与待配
(N-V+1)个,配准的目标就是在(M-U+1)
(M-U+1)
准图像最相似的图像,这样得到的基准点就是最佳配准点。
设模板 T 在搜索图 s 上移动,模板覆盖下的那块搜索图叫子图 S ,(i,j)为这块子图的左上角
点在 S 图中的坐标,叫做参考点。然后比较 T 和 S 的内容。若两者一致,则 T 和 S 之
差为零。在现实图像中,两幅图像完全一致是很少见的,一般的判断是在满足一定条件下,
T 和 S 之差最小。
根据以上原理,可采用下列两种测度之一来衡量 T 和 S 的相似程度。D(i,j)的值越小,则该
窗口越匹配。
D(i,j)=
[S
(m,n)-T(m,n)]
(3-1)
或
D(i,j)=
[S
(m,n)-T(m,n)
(3-2)
或者利用归一化相关函数。将式(3-1)展开可得:
D(i,j)=
[S (m,n)] -2
S (m,n)*T(m,n)+
[T(m,n)]
(3-3)
式中等号右边第三项表示模板总能量,是一常数,与(i,j)无关;第一项是与模板匹配区域的
能量,它随((i,j)的改变而改变,当 T 和 S 匹配时的取最大值。因此相
关函数为:
R(i,j)=
当 R(i,j)越大时,D(i,j)越小,归一化后为:
R(i,j)=
(3-4)
(3-5)
根据 Cauchy-Schwarz 不等式可知式(3-5)中 0
数时,R(i,j)取极大值。
R(i,j)
1,并且仅当值 S (m, n)/T (m, n)=常
该算法的优点:
(1)算法思路比较简单,容易理解,易于编程实现。