掌纹识别算法综述.pdf

发布时间：2022-05-29 发布人：admin 分类：说明书资料大小：4.14M 资料格式：pdf 举报版权申诉

weixin_43687366-11010317-4744302543292475097.pdf-第1页.png

第1页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第2页.png

第2页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第3页.png

第3页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第4页.png

第4页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第5页.png

第5页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第6页.png

第6页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第7页.png

第7页 / 共13页

weixin_43687366-11010317-4744302543292475097.pdf-第8页.png

第8页 / 共13页

文本预览

第 36 卷第 3 期 2010 年 3 月自动化学报 ACTA AUTOMATICA SINICA Vol. 36, No. 3 March, 2010 掌纹识别算法综述岳峰 1 左旺孟 1 张大鹏 2 摘要掌纹识别作为一种新兴的生物识别技术, 近年来得到了广泛的关注与研究. 与其他生物特征相比, 掌纹有许多独特的优势, 包括识别率高、采集设备价格低廉、用户可接受性好等. 这些优势使得掌纹识别成为一种有着广泛应用前景的生物识别方法. 本文首先介绍了掌纹的特点、掌纹的采集设备和预处理方法, 之后详细介绍了近几年来提出的各种掌纹识别方法. 根据特征提取以及匹配方法的不同, 本文将掌纹识别方法分为基于结构的、基于子空间的、基于编码的和基于统计的四类方法. 在回顾和比较了各种算法的特点之后, 对未来的掌纹识别方法的发展方向作了展望. 关键词生物识别, 掌纹识别, 低分辨率掌纹图像, 特征提取, 特征匹配 DOI 10.3724/SP.J.1004.2010.00353 Survey of Palmprint Recognition Algorithms YUE Feng1 ZUO Wang-Meng1 ZHANG Da-Peng2 Abstract As an emerging biometric technology, palmprint recognition has recently received considerable research interest. Because of its low-price capture device, fast execution speed, and high veriﬁcation accuracy, palmprint recognition is very competitive in biometric research and is expected to have a wide range of security applications. This paper ﬁrst introduces the characteristics of the palmprint, the acquisition and the preprocessing method for palmprint image, and then presents a survey of the palmprint recognition algorithms. According to diﬀerent feature extraction and matching approaches, we roughly group these algorithms into four categories: structure based, statistics based, subspace based and coding based methods. After surveying and comparing these algorithms in each category, we conclude this paper with a discussion of future trends. Key words Biometrics, palmprint recognition, low-resolution palmprint image, feature extraction, feature matching 随着社会和经济的不断发展, 人们对身份鉴别的准确性、安全性与实用性提出了越来越高的要求. 传统的身份鉴别方法, 如钥匙、密码以及智能卡等, 存在容易丢失、遗忘、被复制及盗用的隐患. 而通过辨识人的生理和行为特征进行身份认证的生物识别技术 (Biometrics) 为身份鉴别提供了一个方便可靠的解决方案. 生物识别技术是指根据人的生理特征 (如语音、指纹、掌纹、面部特征、虹膜等) 或行为特征 (如步态、签名、击键特征等) 进行身份鉴别的技术. 生物识别技术以人的生物特征为基础, 以信息处理技术为手段, 具有安全性、有效性和易用性等特点, 因此受到人们越来越多的重视. 收稿日期 2009-04-10 录用日期 2009-10-23 Manuscript received April 10, 2009; accepted October 23, 2009 国家高技术研究发展计划 (863 计划) (2006AA01Z308), 国家自然科学基金 (60872099, 60902099) 资助 Supported by National High Technology Research and De- velopment Program of China (863 Program) (2006AA01Z308) and National Natural Science Foundation of China (60872099, 60902099) 1. 哈尔滨工业大学计算机学院生物信息技术研究中心哈尔滨 150001 2. 香港理工大学计算学系生物识别技术研究中心香港 1. Biocomputing Research Center, School of Computer Sci- ence and Technology, Harbin Institute of Technology, Harbin 150001 2. Biometrics Research Center, Department of Com- puting, Hong Kong Polytechnic University, Hong Kong 掌纹识别是近些年来新兴的一种生物识别技术. 与其他用于识别的生物特征相比, 掌纹具有很多独特的优势. 相比于指纹, 掌纹拥有更大的面积以及更为丰富的纹理信息, 只需要较低分辨率的采集设备就可以构建高性能的掌纹识别系统; 相比于人脸识别, 掌纹识别能轻易地区分双胞胎; 相比于虹膜, 掌纹采集设备的价格更为低廉, 采集方式也更容易让用户接受; 相比于签名, 掌纹更加稳定可靠. 因此, 掌纹识别是一种有着广泛应用前景的生物识别方法, 近年来得到了研究人员的广泛关注. 掌纹中包含丰富的特征, 如主线、皱褶、三角点和细节点等, 如图 1 所示. 在高分辨率 (≥ 400 dpi) 的掌纹图像中可以提取到上述的全部特征; 而对于低分辨率 (≤ 100 dpi) 的掌纹图像, 只能提取到主线和皱褶特征 (统称为线特征), 如图 2 所示. 由于在低分辨率的掌纹图像上的识别精度对于一般的民用和商用已经足够, 而且相对于高分辨率图像, 获取和处理低分辨率掌纹图像可以节省大量时间和成本, 因此本文主要讨论针对低分辨率掌纹图像的识别方法. 本文的结构安排如下: 第 1 节讨论了掌纹图像的采集和预处理, 以及公开的掌纹图像数据库和评价指标; 第 2 节对各种掌纹识别算法作了分类, 并对每类算法进行详细的阐述和比较; 第 3 节讨论了当前

354 自动化学报 36 卷掌纹识别存在的问题和未来的发展方向; 最后在第 4 节对本文进行了总结. 早期的采用扫描方式的设备在采集速度上有很大提高. 图 1 掌纹中包含的各种特征 Fig. 1 Various kinds of features in palmprint 图 3 用墨水和扫描仪采集到的掌纹图像 Fig. 3 Palmprint image captured by ink and scanner 图 2 低分辨率掌纹图像中的主线和皱褶特征 Fig. 2 Principal lines and wrinkles in low-resolution palmprint image 1 掌纹图像的采集和预处理 1.1 掌纹图像的采集早期的掌纹采集方法是将手掌涂上墨水或油墨, 之后将手掌印在纸上, 最后用扫描仪将带有掌纹图像的纸扫描成数字图像[1−2]. 这种采集方法速度慢, 只能用于脱机掌纹识别. 而且, 由于手掌的生理结构, 手掌中心部分的掌纹信息经常是缺失或模糊的, 采集到的图像质量差, 如图 3 所示. Wong 等设计了一种用于联机掌纹识别的采集设备[3], 这种设备可以直接采集到数字化的掌纹图像, 如图 4 所示. 这种采集设备的分辨率为 75 dpi, 可以获得掌纹中清晰的主线和皱褶信息. 近来, PAPILLON 等公司推出了联机采集高分辨率掌纹图像的设备[4−6], 相比于图 4 Wong 等设计的联机掌纹采集设备采集到的掌纹图像 Fig. 4 Palmprint image collected by Wongs online capture device 1.2 掌纹图像预处理掌纹图像的预处理主要包括去噪、关键点定位、平移及旋转校正等. 早期的掌纹识别方法提取掌纹中的纹线端点和感兴趣点作为特征, 在匹配阶段采用自适应的方法匹配, 对于预处理的要求不是很严格. 随着掌纹识别技术的发展, 对匹配的速度和精度要求越来越高, 因此要求在预处理阶段完成掌纹图像的平移及旋转校正. 对于掌纹的定位, 大多数预处理算法都利用了食指与中指的缝隙以及无名指与小指的缝隙[7−10]. 在此基础上, Poon 等[8] 提出了一种划分掌纹中心区域的方法, 如图 5 (a) 所示. 他们将掌纹的中心区域划分为多个椭圆形半环, 每个椭圆形半环再分为多个小块, 对每个小块分别提取特征. 这样划分的优点是可以减小旋转产生的影响.

3 期岳峰等: 掌纹识别算法综述 355 由于 Wong 等设计的采集设备已带有用于定位的圆柱, 并且要求采集者的手指张开, 这就极大地方便了掌纹图像的预处理. Zhang 等针对此采集设备提出的预处理方法[7] 可以在很大程度上克服手掌的平移及旋转带来的影响, 已成为一种广泛使用的预处理方法[7, 10−16], 如图 5 (b) 所示. Hennings 等[10] 在此基础上又加入了形态学操作, 以改善预处理方法的鲁棒性. Liambas 等在文献 [17] 中提出了针对方向上任意放置的掌纹图像的预处理方法, 该方法通过在手掌区域中放置互不重叠的最大内切圆来定位手掌中心区域, 同时可以获得手掌的方向, 对噪声以及断指、并指等情况具有更好的鲁棒性. 一幅典型的手掌图像的处理结果如图 5 (c) 所示. 1.3 掌纹图像公开数据库掌纹识别技术提出后, 国内外很多大学和科研机构都陆续开展了这方面的研究. 为了推动掌纹识别技术的发展, 使各种掌纹识别方法有一个统一的比较平台, 香港理工大学、香港科技大学和中国科学院自动化研究所分别发布了公开的掌纹图像数据库, 如表 1 所示. 香港理工大学的掌纹数据库是利用文献 [3] 中的采集设备采集得到的, 版本 1 中包括来自 50 人、100 只手掌的 600 个掌纹图像样本. 所有图像分两次采集得到, 每次对每只手掌采集 3 幅图像. 版本 2 中包括 193 人、386 只手掌的 7 752 幅图像. 所有图像分两次采集得到, 每次对每只手掌采集约 10 幅图像. 在两次采集过程中, 研究人员更换了设备的光源并对其照明系统进行了改造, 因此部分掌纹在不同阶段采集的图像会有较为明显的亮度差异. 香港科技大学的数据库通过数码相机采集得到, 没有使用类似于文献 [3] 中设备上用于手掌定位的装置, 采集时也不是在封闭的环境中, 因此与香港理工大学的数据库相比, 掌纹图像间存在较大的平移和旋转, 且受光照影响更大. 中国科学院自动化研究所设计了一种掌纹采集设备, 并用该设备构建了包括 301 人、5 239 个图像样本的掌纹图像库, 所有图像都是通过一次采集得到. 由于该设备并没有用于定位的圆柱, 因此采集时手掌的位置更加灵活, 同一手掌的图像间差异也较大. 在这些数据库公开发布之后, 掌纹识别算法在这些数据库上的性能已成为衡量该算法的一个重要指标. 在第 2 节的算法分析中也列出了近来提出的掌纹识别算法在这些公开数据库上的性能参数. 1.4 评价指标掌纹识别方法的评价指标与其他生物识别方法相类似, 主要包括正确接受率 (Genuine accep- tance rate, GAR), 错误拒绝率 (False rejection rate, FRR), 错误接受率 (False acceptance rate, FAR), 等误率 (Equal error rate, EER), 判别指数 (Discriminating index, d) 等. 此外, 还包括提取的 (a) 文献 [8] 提出的方法 (a) The method proposed in [8] (b) 文献 [7] 提出的方法 (b) The method proposed in [7] (c) 文献 [17] 提出的方法 (c) The method proposed in [17] 图 5 掌纹图像预处理方法示意图 Fig. 5 The schematic diagrams of palmprint preprocessing methods

356 自动化学报 36 卷表 1 公开发布的掌纹图像数据库 Table 1 Public palmprint image databases 数据库名称人数掌纹图像数 Hong Kong PolyU (v1) Hong Kong PolyU (v2)[18] Hong Kong UST (v1)[19] CASIA (v1)[20] 100 193 270 301 600 7 752 5 400 5 239 图像大小 384 × 284 384 × 284 1 280 × 960 640 × 480 特征维数、特征大小、特征提取及匹配所需的时间等. 本文在第 2 节的算法分析中列出了某些具有代表性的掌纹识别算法的性能参数. 值得注意的是, 有些实验结果是在不同的掌纹数据库上得到的, 彼此间并不具有可比性. 2 掌纹特征提取和匹配高分辨率的掌纹图像大都用于脱机掌纹识别, 主要应用于刑侦、司法等领域. 与指纹识别类似, 对于高分辨率的掌纹图像主要利用乳突纹和细节点进行识别. 特征提取阶段通常包括方向场估计、图像增强、二值化、细化和细节点提取等[21]. 在此基础上, 文献 [22] 利用统计信息和结构信息给出一些规则, 用于去除伪细节点. 匹配时采用的是点集间的匹配, 每对细节点间的匹配通常要考虑细节点的位置、方向以及类型等信息. 最近提出的潜掌纹 (Latent palmprint) 识别方法[23] 针对部分掌纹与全部掌纹间匹配的特点, 提出了以细节点码 (Minutia code) 作为局部特征, 先进行局部匹配, 再进行全局匹配的方法. 对于低分辨率的掌纹图像, 主要是利用主线和皱褶信息实现掌纹识别. 根据掌纹中特征的表示以及匹配方法, 可大致将掌纹识别方法分为四个类别[24], 分别是基于结构的方法、基于统计的方法、基于子空间的方法和基于编码的方法. 此外, 我们还列出了一些不属于这些类别的方法. 2.1 基于结构的方法基于结构的方法主要是指利用掌纹中主线和皱褶的方向和位置信息实现掌纹识别的方法. 这一类的方法主要由两部分组成: 1) 提取掌纹中的纹线特征; 2) 纹线特征的有效表示和匹配. 线特征的有效表示主要是指便于匹配, 并且占用尽可能少的存储空间. 对于特征的提取, 较多使用的是各种线检测算子以及边缘检测算子; 对于特征的表示, 主要是采用直线段或特征点代替掌纹纹线; 而特征的匹配大多采用特征点之间的欧氏距离或 Hausdorﬀ 距离, 以及用于线段匹配的 Hausdorﬀ 距离等. Shu 等[25−26] 提出了一种掌纹线特征的提取和匹配方法. 该方法首先使用 12 个线检测算子检测各个方向下的掌纹纹线, 并用直线段近似表示, 之后通过后处理滤除较短的线段, 合并重合的线段, 得到代表该掌纹中纹线的全部直线段. 最后提取出直线段的端点、截距和倾角等作为该掌纹的特征. 对于直线段间的匹配, 采用的是端点的欧氏距离以及截距和倾角的差别, 对于小于指定阈值的则认为直线段匹配成功. 两个掌纹的匹配度定义为匹配的直线段数目与直线段总数之比. 该方法利用了掌纹纹线具有一定长度的特点, 对噪声不敏感. 匹配时考虑了纹线的长度和方向信息, 大大减少了仅依赖纹线端点造成的误匹配. Wu 等[27−28] 提出了一种利用高斯函数的导数提取掌纹主线特征的方法. 该方法采用四个不同的检测算子, 分别检测四个不同方向的纹线, 最后合并各个方向的检测结果. 为了克服非线性形变及旋转带来的影响, 文献 [28] 在匹配前对表示纹线的二值图像进行旋转和形态学膨胀, 之后再与其他掌纹匹配. 文献 [29] 中首先通过二值化获得掌纹的线特征, 之后提取掌纹中最大内切圆内部的若干条跨度最长的纹线, 匹配时采用的是类似 Hausdorﬀ 距离的双向匹配方法. Li 等[30−31] 提出首先利用通用的边缘算子检测出掌纹中的纹线, 之后用改进的线段 Hausdorﬀ 距离匹配. 由于 Hausdorﬀ 距离本身就具有对小的形变不敏感的特性, 因此以上两种方法都具有较好的鲁棒性. 注意到掌纹纹线 (尤其是主线) 并不是单像素宽的, 而经典的边缘检测算子只能检测到单像素宽的边缘 (称为单边响应, Unique edge response), Liu 等[32] 提出了一种宽线检测算子. 该方法利用圆形模板中与圆心灰度相似的区域的面积来判断圆心点是否属于纹线, 指出对于背景区域, 该面积达到最大值, 因此将最大值的一半作为阈值滤除背景, 从而得到纹线. 得到的掌纹纹线表示成一个二值矩阵, 采用异或操作匹配. 由于该方法不仅考虑了纹线的位置, 还考虑了纹线的宽度, 因此识别精度更高. 与采用直线段表示掌纹纹线的方法不同, 本类方法采用构成纹线的所有的点来表示掌纹, 匹配时采用的是点集间的匹配. 这类方法最大的优点是避免了用直线段近似掌纹纹线, 缺点是匹配时仅考虑了纹线的位置信息, 而丢弃了纹线的方向信息, 因此识别精度不高. 另一类的方法是利用特征点来表示掌纹纹线, 从而用特征点间的匹配代替纹线间的匹配. Duta 等[33] 首先通过二值化平滑后的掌纹图像来提取掌纹纹线, 之后通过形态学操作提取代表纹线的特征点, 最后用类似于指纹识别中的特征点匹配方法对特征点进行位置与方向上的比较. You 等在文献 [2] 中提出了一种类似的方法. 该方法首先用 Prewitt 算子提取掌纹纹线, 之后用 Plessey 算子[34] 提取代

3 期岳峰等: 掌纹识别算法综述 357 表点, 最后采用 Hausdorﬀ 距离实现掌纹间的匹配. 由于特征点的数目较多, 与基于线特征的掌纹识别方法相比, 这一类方法保存特征需要更大的空间, 匹配时速度也较慢. 在文献 [35] 中, Wu 等提出了一种不同的方法, 充分利用梯度图的方向和幅值信息提取掌纹的纹线特征. 在该方法中, 首先计算掌纹图像梯度图的方向和幅值, 之后对掌纹模糊分块, 分别提取每块的方向和幅值特征, 并连接为表示整个掌纹的特征矢量. 匹配时采用向量间的相关系数. 这种方法由于利用了统计量作为特征, 因此对质量差的掌纹图像具有更好的鲁棒性, 识别精度较高. 基于结构的方法是早期的用于掌纹识别的方法. 总的来说, 大部分基于结构的方法都是借鉴或移植自指纹识别中的方法, 简单直观. 但是这类方法用直线段或特征点近似地表示掌纹纹线, 丢失了大量信息, 因此识别率不高. 此外, 这类方法的识别性能在很大程度上依赖于边缘检测算子或宽线检测算子. 掌纹中一些比较细小模糊的线包含大量的判别信息, 但却无法被检测算子检测到. 大量的直线段和特征点也使匹配过程非常耗时. 表 2 对各种基于结构的方法作了比较. 2.2 基于统计的方法基于统计的方法是指利用掌纹图像的重心、均值、方差等统计量作为特征的识别方法, 可进一步分为基于局部统计量和全局统计量的方法. 其中基于局部统计量的方法需要将图像分成若干小块, 之后统计每块的均值和方差等统计信息, 最后连接为表示整个掌纹的特征向量; 而基于全局统计量的方法则直接计算整个图像的矩和重心等统计信息作为掌纹的特征. 匹配时, 一般采用矢量比较时常用的相关系数、一阶范数或欧氏距离. 对于基于局部统计量的方法, 在提取统计特征之前, 通常需要对图像做变换, 例如傅里叶变换、小波变换等. Li 等[36−37] 首先用傅里叶变换提取掌纹图像的频域信息, 之后分块并计算每块的幅值和相位的和作为特征. Zhang 等[38] 利用过完备小波变换的平移不变性和掌纹纹线方向的上下文相关性, 计算小波分解后每块的四类统计特征. 根据这四类特征可将掌纹分为若干个类别, 识别时仅在待测掌纹所属的类别内搜索即可. 文献 [39−42] 提出利用小波变换, 之后分块并提取每块的均值和方差作为特征. 各种方法的分块策略略有不同, 例如文献 [37] 将图像分为半径相等的同心圆, 文献 [42] 将小波分解后的各子图分为数量相同的小块, 而文献 [41] 则将小波分解后的各子图分为大小相同的小块. 当只进行一级小波分解时, 后两种分块的策略是相同的. 与基于结构的方法不同的是, 本类方法考虑了掌纹图像的频域 (傅里叶变换) 和多尺度 (小波变换) 特征, 而不是原始图像中纹线的位置、方向等特征, 能够有效地减小类内差别, 提升识别性能. 但是在该类方法中, 分块的大小以及分块的策略对最终的识别结果有很大影响, 而最优的分块方法通常需要实验确定. 基于全局统计量的方法主要是指利用图像不变矩的识别方法. 文献 [43−44] 分别利用 Hu 和 Zernike 矩提取掌纹特征, 而 Li 等在文献 [45−46] 中提出了一种利用平移不变的 Zernike 矩提取掌纹特征的方法. 根据所采用的不变矩具有的平移或旋转不变的特性, 该类方法对于掌纹图像也具有相应的特性, 可以有效地处理预处理带来的图像平移和旋转. 该类方法的缺点是特征维数太小, 丢失了大量的判别信息, 因此识别率不高. 基于统计的方法将掌纹图像看作是纹理图像, 并利用分析纹理图像的一些方法来分析掌纹图像. 与基于结构的方法相比, 傅里叶变换的方法可以提取掌纹的频域特征, 小波变换的多分辨率特性更加适表 2 基于结构的方法的比较 Table 2 Comparison of structure-based methods 平均特征大小匹配方法数据库识别率 (%) 等误率 (%) 93.3 94.3 97.5 95 1.0 1.0 算法名称线特征[26] 点特征[33] 宽线检测算子[32] 特征表示端点表示的直线段特征点的位置及方向表示纹线的二值数据 340 线匹配 60 幅图像约 1 800 特征点匹配 30 幅图像 2 056 逻辑异或 PolyU (v1) 线特征向量[35] 矢量 200 相关系数 3 200 幅图像 (1 920 幅训练, 1 280 幅测试) 多特征[2] 纹理能量和感兴趣点大于 2 048 能量差异和 Hausdorﬀ 距离 200 幅图像

358 自动化学报 36 卷合主线和皱褶不同粗细的特点, 而基于全局统计量的方法对图像平移和旋转更加鲁棒. 总的来说, 基于统计的方法比基于结构的方法有更高的准确率, 统计的本质也使得该类方法对噪声不敏感. 此外, 由于原始掌纹图像被有效地表示为若干个统计量, 因此特征所占的空间很小, 匹配速度也很快. 表 3 列出了几种基于统计的方法的性能比较. 2.3 基于子空间的方法子空间方法将掌纹图像看作是高维向量或矩阵, 通过投影或变换, 将其转化为低维向量或矩阵, 并在此低维空间下对掌纹表示和匹配. 根据投影或变换的性质, 子空间方法可以分为线性子空间方法和非线性子空间方法. 目前应用较为广泛的是线性子空间方法, 主要包括独立成分分析 (Independent component analysis, ICA)、主成分分析 (Principal component analysis, PCA)、线性判别分析 (Linear discriminant analysis, LDA) 等. 与前两类方法不同, 基于子空间的方法大都需要对每个类别的掌纹图像构造训练集, 在该训练集上计算最优的投影向量或矩阵, 并将投影后的向量或矩阵作为该类掌纹的特征. 在识别阶段, 首先对待测掌纹图像作相同投影或变换, 之后采用最近邻或最近特征线 (Nearest feature line, NFL) 分类器分类. 基于子空间的方法已成功地应用于人脸识别, 移植到掌纹识别后也取得了很好的效果. Lu 等[47] 提出了利用 PCA 进行降维的 Eigen- Palm 方法, 该方法首先将掌纹图像连接为高维向量, 并计算该向量的散度矩阵的特征值和特征向量, 之后保留若干较大的特征值对应的特征向量构成投影矩阵. 由于 PCA 主要考虑的是掌纹的表示 (Representation), 而不是掌纹的判别 (Discrimi- nance), Wu 等[48−49] 又提出了在 PCA 的基础上再进行 LDA 降维的 FisherPalm 方法. LDA 方法同时考虑类内散度和类间散度, 并通过最大化类间散度同时最小化类内散度 (即 Fisher 准则) 计算最优的投影矩阵. 此外, 文献 [50] 提出融合 PCA 和 LDA 特征, 文献 [51] 提出利用核线性判别分析 (Kernel Fisher discriminant analysis, KFDA) 方法, 都取得了比单独使用 PCA 或 LDA 更好的效果. 由于小样本 (Small sample size, SSS) 问题, PCA 易于对训练集产生过拟合 (Overﬁtting). 作为一维 PCA 的推广, Yang 等[52] 提出了 2DPCA 并应用于人脸识别. 在 2DPCA 中, 图像被看作是由若干个行向量组成, 并在此行向量上进行 PCA 降维, 这就有效地解决了小样本问题. 相比于 PCA, 该方法具有更好的泛化能力, 但缺点是特征维数较高. 在此基础上, Wang 等[53] 将 2DPCA 和 LDA 结合的方法应用于掌纹识别. 在文献 [54] 中, Lu 等指出, 先对掌纹图像做小波分解, 再应用 2DPCA, 可以得到比直接应用 2DPCA 更高的识别率. BDPCA (Bi-directional PCA) 由 Zuo 等提出, 并应用于人脸和掌纹识别[11, 55]. BDPCA 可以看作是 2DPCA 的一种推广, 通过分别计算行投影矩阵与列投影矩阵, 将掌纹图像最终变换为一个矩阵, 作为该掌纹的特征. 对于该特征矩阵, Zuo 等采用集成矩阵距离 (Assembled matrix distance, AMD) 的度量方式计算相似度. 相对于 PCA, BDPCA 具有更好的泛化能力, 可以减轻训练时带来的过拟合. 该方法还省去了 PCA 中的图像连接过程, 因此特征提取的效率更高. 此外, BDPCA 提取的特征维数要远小于 2DPCA, 因此保存特征所需的存储空间更小, 匹配速度更快. 在 BDPCA 的基础上, 文献 [56] 使用 BDPCA 和 LDA 相结合的方法, 文献 [57] 提出先用 BDPCA 提取特征再用一维 PCA 降维的方法, 都得到了比单独使用 BDPCA 更好的结果. 在文献 [58] 中, 接标等将 ICA 方法应用于掌纹识别. 在文献 [59] 中, Lu 等先将掌纹图像做小波分解, 之后应用 ICA 方法提取特征, 实验表明优于直接使用 ICA 的方法. 基于子空间的方法具有坚固的理论基础, 并且已广泛地应用于人脸识别中. 相对于基于结构的方法, 具有识别率高、特征小等优点, 较之基于统计的方法也有更高的识别率. 尤其是在 Zuo 等提出 BD- PCA 之后, 特征提取阶段的计算量也大大减少, 使得该类方法的优势更加明显. 但是该类方法通常对每个类别都需要多个训练样本, 且训练样本的选取对识别结果影响较大. 表 4 列出了几种主要的基于子表 3 基于统计的方法的比较 Table 3 Comparison of statistics-based methods 算法名称特征维数匹配方法数据库 8 + 8 一阶范数和相关系数 3 000 幅图像加权的一阶范数 200 幅图像傅里叶变换[37] 小波变换[38] Hu 矩[43] Zernike[44] 27 7 11 欧氏距离欧氏距离一阶范数 378 幅图像 FAR = 0.038 %, GAR = 98.1 % 300 幅图像识别率 95.48 % 98 % 等误率 (%) 6.44 5.56

3 期岳峰等: 掌纹识别算法综述 359 表 4 基于子空间的方法的比较 Table 4 Comparison of subspace-based methods 算法名称特征表示特征维数匹配方法 EigenPalm[47] FisherPalm[49] BDPCA[11] 矢量矢量矩阵 100 299 19 × 17 加权的欧氏距离欧氏距离集成矩阵距离训练集 382 × 4 300 × 6 100 × 3 测试集 382 × 4 300 × 4 100 × 3 识别率 (%) 99.149 99.75 98.67 空间的方法的识别性能. 2.4 基于编码的方法基于编码的方法是指先用滤波器对掌纹图像滤波, 之后根据某些规则将滤波后的结果进行编码的方法. 通常特征都按照比特码的形式存储, 对得到的特征码多采用二进制的 “与” 或者 “异或” 计算相似度. 该类方法主要包括三个核心部分: 滤波器的选择 (Gabor, 高斯, 高斯的导数), 编码规则 (最大值, 序数关系), 以及匹配方式 (点对点, 点对区域). 编码的方法首先由 Daugman 提出并应用于虹膜识别[60], 该方法使用 2D Gabor 滤波器对虹膜图像滤波, 之后根据滤波结果的实部和虚部的符号编码. 若为正则编码为 1, 否则编码为 0, 每个采样点被编码为 2 个比特. 文献 [7, 61] 直接将该方法用于掌纹识别中, 提取的特征码称为 PalmCode. 由于只使用了一个方向为 45◦ 的 Gabor 滤波器, 不同手掌滤波后的掌纹图像都非常相似 (表现为包含很多 45◦ 的条纹), 这无疑会降低掌纹的可分性, 从而影响掌纹识别系统的性能. 为了克服这个缺点, 在文献 [12, 62] 中, Kong 等提出了一种称为 FusionCode 的方法. 在用两个方向的 Gabor 滤波器对掌纹图像滤波之后, 对每个采样点, 编码幅值最大的方向的相位信息. 相位信息被量化到四个区间, 因此每个采样点同样被编码为 2 个比特. 相比于 PalmCode, Fu- sionCode 方法同时利用了幅值和相位信息, 因此获得了更好的识别性能. Wu 等[13] 提出利用高斯函数的导数作为滤波器, 在水平和垂直方向对图像滤波, 最后根据滤波结果的符号编码, 称作 DoGCode. 实验结果表明该方法优于 FusionCode 和 PalmCode. Kong 等在文献 [14] 中提出使用六个方向的实值 Gabor 滤波器对掌纹图像滤波, 并对幅值最小的方向编码, 称为竞争编码 (Competitive code). 在每个采样点被巧妙地编码为三个比特之后, 可以通过二进制的 “异或” 操作高效地计算出采样点间的角度距离. 为了克服预处理带来的平移对匹配产生的影响, 在匹配阶段需要在 [−2, +2] 的范围内进行竖直和水平方向上平移, 并取距离最小的匹配结果作为最终的距离. 由于竞争编码考察了掌纹图像的方向信息, 对光照强度不敏感, 而且对不同时期采集的掌纹有很好的稳定性, 因此获得了很高的识别精度. 简单的异或操作也使得匹配速度非常快, 因此该方法是一种非常有效的掌纹识别算法. Sun 等在文献 [15] 中提出了一种不同的编码方法, 称为序数编码 (Ordinal code). 该方法选择六个方向的 2D 高斯函数作为滤波器, 之后根据互相垂直的两个方向 (共有三组) 上滤波结果的大小关系编码. 因此与竞争编码相同, 该方法中每个采样点同样被编码为三个比特. 匹配时同样采用二进制的 “异或” 操作. 由于该方法考察的是不同方向滤波结果的大小关系, 而滤波是一个线性操作, 因此可以在对图像滤波之前先进行滤波器的组合: 对三组方向互相垂直的滤波器作差, 得到三个新的滤波器, 这样用得到的滤波器对图像滤波后只需考察结果的正负. 所以, 对每个采样点, 该方法只需进行三次滤波操作, 特征提取阶段的效率要高于竞争编码. 此外, 序数编码对于每个采样点共有 23 = 8 种编码方式, 而竞争编码只使用了其中的 6 种. 仔细分析竞争编码与序数编码方式可知, 这两种方法都将掌纹看作由有方向的纹线构成, 考虑了每个采样点在六个不同方向上的信息. 不同的是, 竞争编码选择最主要的方向作为特征, 而序数编码考虑了三组互相垂直的两个方向间的相互关系. 由于除少数交叉点外, 大多数掌纹纹线只有一个方向, 该方向上的滤波结果为各方向上的极值, 而在其他方向上滤波结果及其相互关系并不稳定, 易于受噪声的干扰. 因此与序数编码相比, 对于掌纹识别, 竞争编码提取的特征更加稳定, 因此识别精度更高[63]. 最近, Jia 等[16] 提出了一种鲁棒的线方向编码方法 (Robust line orientation code, RLOC). RLOC 是一种利用改进的有限 Radon 变换 (Finite Radon transform, FRAT) 来提取掌纹的线特征的识别方法. Radon 变换可以有效地提取图像中的线特征, 而有限 Radon 变换使得它可以处理有限长度的信号. 为了去除 FRAT 的环绕 (Wrap around) 效应, 改进的 FRAT 采用了通过中心的不同方向的线性模板. 在匹配过程中, 为了克服掌纹的非线性形变带来的误差, RLOC 采用了点对区域的匹配方式, 即待匹配图像中的一个点与模板中以该点位置为中心的一个区域中的所有点匹配, 匹配时采用的是二进制的 “与” 操作. 由于采用了整数值的模板, 这种方法在特征提取时速度非常快, 但点对区域的匹配

360 自动化学报 36 卷方式使得匹配时速度较慢. 对比 RLOC 与竞争编码, 我们发现两者都是通过竞争规则编码六个方向中的主方向, 而区别则是采用不同的滤波器 (Gabor 或改进的 FRAT) 以及不同的匹配方式 (点对点或点对区域). 由于文献 [16] 中的实验结果表明 RLOC 优于竞争编码, 因此有必要考察滤波器和匹配方式对性能产生的影响. 根据评测结果[63], 滤波器对算法的识别性能影响并不大, 因此可以推断, 性能的提升来自于点对区域的匹配方式, 而不是改进的 FRAT. 对竞争编码或序数编码提取的特征采用点对区域的匹配方式也会提升原方法的性能. 文献 [64] 最近提出了一种称为二值方向共生向量 (Binary orientation co-occurrence vector, BOCV) 的掌纹识别方法. 该方法同样利用六个不同方向的 Gabor 滤波器对掌纹图像滤波, 之后对结果的过零点信息进行编码, 每个点被编码为六个比特. 匹配时与竞争编码类似, 采用异或操作计算汉明 (Hamming) 距离. 实验结果表明该方法优于竞争编码和 RLOC. 由此可以看出, 不同方向的滤波结果都包含丰富的判别信息, 将其全部作为特征提取出来, 在识别性能上要优于提取主方向 (竞争编码) 或两两垂直的方向间的相互关系 (序数编码). 但这种方法的缺点是特征较大, 为竞争编码或序数编码的两倍. 基于编码的方法最初借鉴了虹膜识别的方法, 之后研究人员根据掌纹的特点提出了一些改进方案. 从利用幅值和相位信息, 到提取掌纹的方向信息; 从单个滤波器, 到使用不同方向的一组滤波器 (Filter bank), 实验结果表明这些改进是可行的和有效的. 相比于前几类方法, 这类方法具有识别率高、特征小、特征提取及匹配速度快、实现简单等特点, 因此最具有竞争力. 表 5 列出了几种基于编码的方法的性能比较. 2.5 各类方法的比较从以上的分析可以看出, 除少数通用的图像识别方法 (如子空间方法和图像不变矩方法) 之外, 大多数的掌纹识别方法都考虑了掌纹的特点. 例如, 在特征提取阶段, 考虑了掌纹纹线的位置、方向、粗细等信息, 而在特征匹配阶段, 通过加入平移、旋转以及点对区域的匹配方式, 克服手掌的位置改变以及手掌肌肉的伸缩带来的影响. 基于结构的方法是以掌纹中的纹线作为特征, 最为直观, 但由于掌纹中的纹线的灰度、宽度等变化较大, 无论经典的边缘检测算子还是宽线检测算子都无法一致地检测到所有纹线, 因此识别精度不高. 子空间方法并没有考虑掌纹的特点, 只是将训练集中掌纹图像作为一般的模式 (Pattern) 进行判别分析, 而且子空间方法需要训练得到包含众多参数的投影矩阵, 因此小样本问题是制约子空间方法的主要问题. 基于全局统计量的方法在减小类内差别的同时也极大地减小了类间差别, 过小的特征维数使其无法包含足够多的判别信息. 基于局部统计量的方法可以得到维数较大的特征, 但若同等对待全部特征通常效果并不理想, 因此需要通过特征选择保留包含判别信息的特征. 基于编码的方法对掌纹图像中的所有区域都相同对待, 不需要明确地提取掌纹纹线, 不仅实现简单, 而且对于模糊的纹线具有更好的鲁棒性. 总的来说, 基于结构的方法识别精度低, 特征所需的存储空间大, 而且匹配速度慢; 基于编码的方法识别精度高, 特征小, 而且匹配速度快, 是各类方法中最具有优势的一类; 而基于统计的方法和基于子空间的方法的识别精度和识别速度介于两者之间. 各类方法的比较见表 6. 表 6 各类掌纹识别方法的比较 Table 6 Comparison of various kinds of methods 方法类别识别精度特征大小速度基于结构的方法基于统计的方法基于子空间的方法基于编码的方法低中高高大小中小慢中快快表 5 基于编码的方法的比较 Table 5 Comparison of coding-based methods 算法名称特征大小数据库识别率等误率 (%) 判别指数 Palm code[7] Fusion code[12] DoG code[13] Competitive code[14] Ordinal code[15] RLOC[16] BOCV[64] 256 256 256 384 384 384 768 PolyU (v2) 11 074 幅图像 FAR = 0.0138 %, GAR = 96.33 % 7 605 幅图像 PolyU (v2) PolyU (v1) UST PolyU (v2) PolyU (v2) 0.6 0.6 0.19 0.40 0 0.22 0.16 0.019 6.49 4.77

分享到：

赞收藏

资料库

掌纹识别算法综述.pdf

相关推荐

开发技术

热门标签

最新资料