logo资料库

掌纹识别算法综述.pdf

第1页 / 共13页
第2页 / 共13页
第3页 / 共13页
第4页 / 共13页
第5页 / 共13页
第6页 / 共13页
第7页 / 共13页
第8页 / 共13页
资料共13页,剩余部分请下载后查看
第 36 卷 第 3 期 2010 年 3 月 自 动 化 学 报 ACTA AUTOMATICA SINICA Vol. 36, No. 3 March, 2010 掌纹识别算法综述 岳 峰 1 左旺孟 1 张大鹏 2 摘 要 掌纹识别作为一种新兴的生物识别技术, 近年来得到了广泛的关注与研究. 与其他生物特征相比, 掌纹有许多独特的 优势, 包括识别率高、采集设备价格低廉、用户可接受性好等. 这些优势使得掌纹识别成为一种有着广泛应用前景的生物识别 方法. 本文首先介绍了掌纹的特点、掌纹的采集设备和预处理方法, 之后详细介绍了近几年来提出的各种掌纹识别方法. 根据 特征提取以及匹配方法的不同, 本文将掌纹识别方法分为基于结构的、基于子空间的、基于编码的和基于统计的四类方法. 在 回顾和比较了各种算法的特点之后, 对未来的掌纹识别方法的发展方向作了展望. 关键词 生物识别, 掌纹识别, 低分辨率掌纹图像, 特征提取, 特征匹配 DOI 10.3724/SP.J.1004.2010.00353 Survey of Palmprint Recognition Algorithms YUE Feng1 ZUO Wang-Meng1 ZHANG Da-Peng2 Abstract As an emerging biometric technology, palmprint recognition has recently received considerable research interest. Because of its low-price capture device, fast execution speed, and high verification accuracy, palmprint recognition is very competitive in biometric research and is expected to have a wide range of security applications. This paper first introduces the characteristics of the palmprint, the acquisition and the preprocessing method for palmprint image, and then presents a survey of the palmprint recognition algorithms. According to different feature extraction and matching approaches, we roughly group these algorithms into four categories: structure based, statistics based, subspace based and coding based methods. After surveying and comparing these algorithms in each category, we conclude this paper with a discussion of future trends. Key words Biometrics, palmprint recognition, low-resolution palmprint image, feature extraction, feature matching 随着社会和经济的不断发展, 人们对身份鉴别 的准确性、安全性与实用性提出了越来越高的要求. 传统的身份鉴别方法, 如钥匙、密码以及智能卡等, 存在容易丢失、遗忘、被复制及盗用的隐患. 而通过 辨识人的生理和行为特征进行身份认证的生物识别 技术 (Biometrics) 为身份鉴别提供了一个方便可靠 的解决方案. 生物识别技术是指根据人的生理特征 (如语音、 指纹、掌纹、面部特征、虹膜等) 或行为特征 (如步 态、签名、击键特征等) 进行身份鉴别的技术. 生物 识别技术以人的生物特征为基础, 以信息处理技术 为手段, 具有安全性、有效性和易用性等特点, 因此 受到人们越来越多的重视. 收稿日期 2009-04-10 录用日期 2009-10-23 Manuscript received April 10, 2009; accepted October 23, 2009 国家高技术研究发展计划 (863 计划) (2006AA01Z308), 国家自然科 学基金 (60872099, 60902099) 资助 Supported by National High Technology Research and De- velopment Program of China (863 Program) (2006AA01Z308) and National Natural Science Foundation of China (60872099, 60902099) 1. 哈尔滨工业大学计算机学院生物信息技术研究中心 哈尔滨 150001 2. 香港理工大学计算学系生物识别技术研究中心 香港 1. Biocomputing Research Center, School of Computer Sci- ence and Technology, Harbin Institute of Technology, Harbin 150001 2. Biometrics Research Center, Department of Com- puting, Hong Kong Polytechnic University, Hong Kong 掌纹识别是近些年来新兴的一种生物识别技术. 与其他用于识别的生物特征相比, 掌纹具有很多独 特的优势. 相比于指纹, 掌纹拥有更大的面积以及 更为丰富的纹理信息, 只需要较低分辨率的采集设 备就可以构建高性能的掌纹识别系统; 相比于人脸 识别, 掌纹识别能轻易地区分双胞胎; 相比于虹膜, 掌纹采集设备的价格更为低廉, 采集方式也更容易 让用户接受; 相比于签名, 掌纹更加稳定可靠. 因此, 掌纹识别是一种有着广泛应用前景的生物识别方法, 近年来得到了研究人员的广泛关注. 掌纹中包含丰富的特征, 如主线、皱褶、三角点 和细节点等, 如图 1 所示. 在高分辨率 (≥ 400 dpi) 的掌纹图像中可以提取到上述的全部特征; 而对于 低分辨率 (≤ 100 dpi) 的掌纹图像, 只能提取到主线 和皱褶特征 (统称为线特征), 如图 2 所示. 由于在低 分辨率的掌纹图像上的识别精度对于一般的民用和 商用已经足够, 而且相对于高分辨率图像, 获取和处 理低分辨率掌纹图像可以节省大量时间和成本, 因 此本文主要讨论针对低分辨率掌纹图像的识别方法. 本文的结构安排如下: 第 1 节讨论了掌纹图像 的采集和预处理, 以及公开的掌纹图像数据库和评 价指标; 第 2 节对各种掌纹识别算法作了分类, 并对 每类算法进行详细的阐述和比较; 第 3 节讨论了当前
354 自 动 化 学 报 36 卷 掌纹识别存在的问题和未来的发展方向; 最后在第 4 节对本文进行了总结. 早期的采用扫描方式的设备在采集速度上有很大提 高. 图 1 掌纹中包含的各种特征 Fig. 1 Various kinds of features in palmprint 图 3 用墨水和扫描仪采集到的掌纹图像 Fig. 3 Palmprint image captured by ink and scanner 图 2 低分辨率掌纹图像中的主线和皱褶特征 Fig. 2 Principal lines and wrinkles in low-resolution palmprint image 1 掌纹图像的采集和预处理 1.1 掌纹图像的采集 早期的掌纹采集方法是将手掌涂上墨水或油墨, 之后将手掌印在纸上, 最后用扫描仪将带有掌纹图 像的纸扫描成数字图像[1−2]. 这种采集方法速度慢, 只能用于脱机掌纹识别. 而且, 由于手掌的生理结 构, 手掌中心部分的掌纹信息经常是缺失或模糊的, 采集到的图像质量差, 如图 3 所示. Wong 等设计了 一种用于联机掌纹识别的采集设备[3], 这种设备可 以直接采集到数字化的掌纹图像, 如图 4 所示. 这种 采集设备的分辨率为 75 dpi, 可以获得掌纹中清晰 的主线和皱褶信息. 近来, PAPILLON 等公司推出 了联机采集高分辨率掌纹图像的设备[4−6], 相比于 图 4 Wong 等设计的联机掌纹采集设备采集到的掌纹图像 Fig. 4 Palmprint image collected by Wongs online capture device 1.2 掌纹图像预处理 掌纹图像的预处理主要包括去噪、关键点定位、 平移及旋转校正等. 早期的掌纹识别方法提取掌纹 中的纹线端点和感兴趣点作为特征, 在匹配阶段采 用自适应的方法匹配, 对于预处理的要求不是很严 格. 随着掌纹识别技术的发展, 对匹配的速度和精度 要求越来越高, 因此要求在预处理阶段完成掌纹图 像的平移及旋转校正. 对于掌纹的定位, 大多数预 处理算法都利用了食指与中指的缝隙以及无名指与 小指的缝隙[7−10]. 在此基础上, Poon 等[8] 提出了 一种划分掌纹中心区域的方法, 如图 5 (a) 所示. 他 们将掌纹的中心区域划分为多个椭圆形半环, 每个 椭圆形半环再分为多个小块, 对每个小块分别提取 特征. 这样划分的优点是可以减小旋转产生的影响.
3 期 岳峰等: 掌纹识别算法综述 355 由于 Wong 等设计的采集设备已带有用于定位的圆 柱, 并且要求采集者的手指张开, 这就极大地方便了 掌纹图像的预处理. Zhang 等针对此采集设备提出 的预处理方法[7] 可以在很大程度上克服手掌的平移 及旋转带来的影响, 已成为一种广泛使用的预处理 方法[7, 10−16], 如图 5 (b) 所示. Hennings 等[10] 在此 基础上又加入了形态学操作, 以改善预处理方法的 鲁棒性. Liambas 等在文献 [17] 中提出了针对方向 上任意放置的掌纹图像的预处理方法, 该方法通过 在手掌区域中放置互不重叠的最大内切圆来定位手 掌中心区域, 同时可以获得手掌的方向, 对噪声以及 断指、并指等情况具有更好的鲁棒性. 一幅典型的 手掌图像的处理结果如图 5 (c) 所示. 1.3 掌纹图像公开数据库 掌纹识别技术提出后, 国内外很多大学和科研 机构都陆续开展了这方面的研究. 为了推动掌纹识 别技术的发展, 使各种掌纹识别方法有一个统一的 比较平台, 香港理工大学、香港科技大学和中国科学 院自动化研究所分别发布了公开的掌纹图像数据库, 如表 1 所示. 香港理工大学的掌纹数据库是利用文 献 [3] 中的采集设备采集得到的, 版本 1 中包括来 自 50 人、100 只手掌的 600 个掌纹图像样本. 所有 图像分两次采集得到, 每次对每只手掌采集 3 幅图 像. 版本 2 中包括 193 人、386 只手掌的 7 752 幅图 像. 所有图像分两次采集得到, 每次对每只手掌采集 约 10 幅图像. 在两次采集过程中, 研究人员更换了 设备的光源并对其照明系统进行了改造, 因此部分 掌纹在不同阶段采集的图像会有较为明显的亮度差 异. 香港科技大学的数据库通过数码相机采集得到, 没有使用类似于文献 [3] 中设备上用于手掌定位的 装置, 采集时也不是在封闭的环境中, 因此与香港理 工大学的数据库相比, 掌纹图像间存在较大的平移 和旋转, 且受光照影响更大. 中国科学院自动化研究 所设计了一种掌纹采集设备, 并用该设备构建了包 括 301 人、5 239 个图像样本的掌纹图像库, 所有图 像都是通过一次采集得到. 由于该设备并没有用于 定位的圆柱, 因此采集时手掌的位置更加灵活, 同一 手掌的图像间差异也较大. 在这些数据库公开发布 之后, 掌纹识别算法在这些数据库上的性能已成为 衡量该算法的一个重要指标. 在第 2 节的算法分析 中也列出了近来提出的掌纹识别算法在这些公开数 据库上的性能参数. 1.4 评价指标 掌纹识别方法的评价指标与其他生物识别方 法相类似, 主要包括正确接受率 (Genuine accep- tance rate, GAR), 错 误 拒 绝 率 (False rejection rate, FRR), 错误接受率 (False acceptance rate, FAR), 等误率 (Equal error rate, EER), 判别指数 (Discriminating index, d) 等. 此外, 还包括提取的 (a) 文献 [8] 提出的方法 (a) The method proposed in [8] (b) 文献 [7] 提出的方法 (b) The method proposed in [7] (c) 文献 [17] 提出的方法 (c) The method proposed in [17] 图 5 掌纹图像预处理方法示意图 Fig. 5 The schematic diagrams of palmprint preprocessing methods
356 自 动 化 学 报 36 卷 表 1 公开发布的掌纹图像数据库 Table 1 Public palmprint image databases 数据库名称 人数 掌纹图像数 Hong Kong PolyU (v1) Hong Kong PolyU (v2)[18] Hong Kong UST (v1)[19] CASIA (v1)[20] 100 193 270 301 600 7 752 5 400 5 239 图像大小 384 × 284 384 × 284 1 280 × 960 640 × 480 特征维数、特征大小、特征提取及匹配所需的时间 等. 本文在第 2 节的算法分析中列出了某些具有代 表性的掌纹识别算法的性能参数. 值得注意的是, 有 些实验结果是在不同的掌纹数据库上得到的, 彼此 间并不具有可比性. 2 掌纹特征提取和匹配 高分辨率的掌纹图像大都用于脱机掌纹识别, 主要应用于刑侦、司法等领域. 与指纹识别类似, 对 于高分辨率的掌纹图像主要利用乳突纹和细节点进 行识别. 特征提取阶段通常包括方向场估计、图像 增强、二值化、细化和细节点提取等[21]. 在此基础 上, 文献 [22] 利用统计信息和结构信息给出一些规 则, 用于去除伪细节点. 匹配时采用的是点集间的匹 配, 每对细节点间的匹配通常要考虑细节点的位置、 方向以及类型等信息. 最近提出的潜掌纹 (Latent palmprint) 识别方法[23] 针对部分掌纹与全部掌纹 间匹配的特点, 提出了以细节点码 (Minutia code) 作为局部特征, 先进行局部匹配, 再进行全局匹配的 方法. 对于低分辨率的掌纹图像, 主要是利用主线和 皱褶信息实现掌纹识别. 根据掌纹中特征的表示以 及匹配方法, 可大致将掌纹识别方法分为四个类 别[24], 分别是基于结构的方法、基于统计的方法、基 于子空间的方法和基于编码的方法. 此外, 我们还列 出了一些不属于这些类别的方法. 2.1 基于结构的方法 基于结构的方法主要是指利用掌纹中主线和皱 褶的方向和位置信息实现掌纹识别的方法. 这一类 的方法主要由两部分组成: 1) 提取掌纹中的纹线特 征; 2) 纹线特征的有效表示和匹配. 线特征的有效 表示主要是指便于匹配, 并且占用尽可能少的存储 空间. 对于特征的提取, 较多使用的是各种线检测算 子以及边缘检测算子; 对于特征的表示, 主要是采用 直线段或特征点代替掌纹纹线; 而特征的匹配大多 采用特征点之间的欧氏距离或 Hausdorff 距离, 以 及用于线段匹配的 Hausdorff 距离等. Shu 等[25−26] 提出了一种掌纹线特征的提取和 匹配方法. 该方法首先使用 12 个线检测算子检测各 个方向下的掌纹纹线, 并用直线段近似表示, 之后通 过后处理滤除较短的线段, 合并重合的线段, 得到代 表该掌纹中纹线的全部直线段. 最后提取出直线段 的端点、截距和倾角等作为该掌纹的特征. 对于直 线段间的匹配, 采用的是端点的欧氏距离以及截距 和倾角的差别, 对于小于指定阈值的则认为直线段 匹配成功. 两个掌纹的匹配度定义为匹配的直线段 数目与直线段总数之比. 该方法利用了掌纹纹线具 有一定长度的特点, 对噪声不敏感. 匹配时考虑了纹 线的长度和方向信息, 大大减少了仅依赖纹线端点 造成的误匹配. Wu 等[27−28] 提出了一种利用高斯函数的导数 提取掌纹主线特征的方法. 该方法采用四个不同的 检测算子, 分别检测四个不同方向的纹线, 最后合 并各个方向的检测结果. 为了克服非线性形变及旋 转带来的影响, 文献 [28] 在匹配前对表示纹线的二 值图像进行旋转和形态学膨胀, 之后再与其他掌纹 匹配. 文献 [29] 中首先通过二值化获得掌纹的线特 征, 之后提取掌纹中最大内切圆内部的若干条跨度 最长的纹线, 匹配时采用的是类似 Hausdorff 距离 的双向匹配方法. Li 等[30−31] 提出首先利用通用的 边缘算子检测出掌纹中的纹线, 之后用改进的线段 Hausdorff 距离匹配. 由于 Hausdorff 距离本身就具 有对小的形变不敏感的特性, 因此以上两种方法都 具有较好的鲁棒性. 注意到掌纹纹线 (尤其是主线) 并不是单像素宽的, 而经典的边缘检测算子只能检 测到单像素宽的边缘 (称为单边响应, Unique edge response), Liu 等[32] 提出了一种宽线检测算子. 该 方法利用圆形模板中与圆心灰度相似的区域的面积 来判断圆心点是否属于纹线, 指出对于背景区域, 该 面积达到最大值, 因此将最大值的一半作为阈值滤 除背景, 从而得到纹线. 得到的掌纹纹线表示成一个 二值矩阵, 采用异或操作匹配. 由于该方法不仅考虑 了纹线的位置, 还考虑了纹线的宽度, 因此识别精度 更高. 与采用直线段表示掌纹纹线的方法不同, 本类 方法采用构成纹线的所有的点来表示掌纹, 匹配时 采用的是点集间的匹配. 这类方法最大的优点是避 免了用直线段近似掌纹纹线, 缺点是匹配时仅考虑 了纹线的位置信息, 而丢弃了纹线的方向信息, 因此 识别精度不高. 另一类的方法是利用特征点来表示掌纹纹线, 从而用特征点间的匹配代替纹线间的匹配. Duta 等[33] 首先通过二值化平滑后的掌纹图像来提取掌 纹纹线, 之后通过形态学操作提取代表纹线的特征 点, 最后用类似于指纹识别中的特征点匹配方法对 特征点进行位置与方向上的比较. You 等在文献 [2] 中提出了一种类似的方法. 该方法首先用 Prewitt 算子提取掌纹纹线, 之后用 Plessey 算子[34] 提取代
3 期 岳峰等: 掌纹识别算法综述 357 表点, 最后采用 Hausdorff 距离实现掌纹间的匹配. 由于特征点的数目较多, 与基于线特征的掌纹识别 方法相比, 这一类方法保存特征需要更大的空间, 匹 配时速度也较慢. 在文献 [35] 中, Wu 等提出了一种不同的方法, 充分利用梯度图的方向和幅值信息提取掌纹的纹线 特征. 在该方法中, 首先计算掌纹图像梯度图的方向 和幅值, 之后对掌纹模糊分块, 分别提取每块的方向 和幅值特征, 并连接为表示整个掌纹的特征矢量. 匹 配时采用向量间的相关系数. 这种方法由于利用了 统计量作为特征, 因此对质量差的掌纹图像具有更 好的鲁棒性, 识别精度较高. 基于结构的方法是早期的用于掌纹识别的方法. 总的来说, 大部分基于结构的方法都是借鉴或移植 自指纹识别中的方法, 简单直观. 但是这类方法用 直线段或特征点近似地表示掌纹纹线, 丢失了大量 信息, 因此识别率不高. 此外, 这类方法的识别性能 在很大程度上依赖于边缘检测算子或宽线检测算子. 掌纹中一些比较细小模糊的线包含大量的判别信息, 但却无法被检测算子检测到. 大量的直线段和特征 点也使匹配过程非常耗时. 表 2 对各种基于结构的 方法作了比较. 2.2 基于统计的方法 基于统计的方法是指利用掌纹图像的重心、均 值、方差等统计量作为特征的识别方法, 可进一步分 为基于局部统计量和全局统计量的方法. 其中基于 局部统计量的方法需要将图像分成若干小块, 之后 统计每块的均值和方差等统计信息, 最后连接为表 示整个掌纹的特征向量; 而基于全局统计量的方法 则直接计算整个图像的矩和重心等统计信息作为掌 纹的特征. 匹配时, 一般采用矢量比较时常用的相关 系数、一阶范数或欧氏距离. 对于基于局部统计量的方法, 在提取统计特征 之前, 通常需要对图像做变换, 例如傅里叶变换、小 波变换等. Li 等[36−37] 首先用傅里叶变换提取掌纹 图像的频域信息, 之后分块并计算每块的幅值和相 位的和作为特征. Zhang 等[38] 利用过完备小波变换 的平移不变性和掌纹纹线方向的上下文相关性, 计 算小波分解后每块的四类统计特征. 根据这四类特 征可将掌纹分为若干个类别, 识别时仅在待测掌纹 所属的类别内搜索即可. 文献 [39−42] 提出利用小 波变换, 之后分块并提取每块的均值和方差作为特 征. 各种方法的分块策略略有不同, 例如文献 [37] 将图像分为半径相等的同心圆, 文献 [42] 将小波分 解后的各子图分为数量相同的小块, 而文献 [41] 则 将小波分解后的各子图分为大小相同的小块. 当只 进行一级小波分解时, 后两种分块的策略是相同的. 与基于结构的方法不同的是, 本类方法考虑了掌纹 图像的频域 (傅里叶变换) 和多尺度 (小波变换) 特 征, 而不是原始图像中纹线的位置、方向等特征, 能 够有效地减小类内差别, 提升识别性能. 但是在该类 方法中, 分块的大小以及分块的策略对最终的识别 结果有很大影响, 而最优的分块方法通常需要实验 确定. 基于全局统计量的方法主要是指利用图像不 变矩的识别方法. 文献 [43−44] 分别利用 Hu 和 Zernike 矩提取掌纹特征, 而 Li 等在文献 [45−46] 中提出了一种利用平移不变的 Zernike 矩提取掌纹 特征的方法. 根据所采用的不变矩具有的平移或旋 转不变的特性, 该类方法对于掌纹图像也具有相应 的特性, 可以有效地处理预处理带来的图像平移和 旋转. 该类方法的缺点是特征维数太小, 丢失了大量 的判别信息, 因此识别率不高. 基于统计的方法将掌纹图像看作是纹理图像, 并利用分析纹理图像的一些方法来分析掌纹图像. 与基于结构的方法相比, 傅里叶变换的方法可以提 取掌纹的频域特征, 小波变换的多分辨率特性更加适 表 2 基于结构的方法的比较 Table 2 Comparison of structure-based methods 平均特征大小 匹配方法 数据库 识别率 (%) 等误率 (%) 93.3 94.3 97.5 95 1.0 1.0 算法名称 线特征[26] 点特征[33] 宽线检测算子[32] 特征表示 端点表示 的直线段 特征点的 位置及方向 表示纹线 的二值数据 340 线匹配 60 幅图像 约 1 800 特征点匹配 30 幅图像 2 056 逻辑异或 PolyU (v1) 线特征向量[35] 矢量 200 相关系数 3 200 幅图像 (1 920 幅 训练, 1 280 幅测试) 多特征[2] 纹理能量 和感兴趣点 大于 2 048 能量差异和 Hausdorff 距离 200 幅图像
358 自 动 化 学 报 36 卷 合主线和皱褶不同粗细的特点, 而基于全局统计量 的方法对图像平移和旋转更加鲁棒. 总的来说, 基于 统计的方法比基于结构的方法有更高的准确率, 统 计的本质也使得该类方法对噪声不敏感. 此外, 由于 原始掌纹图像被有效地表示为若干个统计量, 因此 特征所占的空间很小, 匹配速度也很快. 表 3 列出了 几种基于统计的方法的性能比较. 2.3 基于子空间的方法 子空间方法将掌纹图像看作是高维向量或矩阵, 通过投影或变换, 将其转化为低维向量或矩阵, 并 在此低维空间下对掌纹表示和匹配. 根据投影或 变换的性质, 子空间方法可以分为线性子空间方法 和非线性子空间方法. 目前应用较为广泛的是线性 子空间方法, 主要包括独立成分分析 (Independent component analysis, ICA)、主成分分析 (Principal component analysis, PCA)、线性判别分析 (Linear discriminant analysis, LDA) 等. 与前两类方法不 同, 基于子空间的方法大都需要对每个类别的掌纹 图像构造训练集, 在该训练集上计算最优的投影向 量或矩阵, 并将投影后的向量或矩阵作为该类掌纹 的特征. 在识别阶段, 首先对待测掌纹图像作相同投 影或变换, 之后采用最近邻或最近特征线 (Nearest feature line, NFL) 分类器分类. 基于子空间的方法 已成功地应用于人脸识别, 移植到掌纹识别后也取 得了很好的效果. Lu 等[47] 提出了利用 PCA 进行降维的 Eigen- Palm 方法, 该方法首先将掌纹图像连接为高维向 量, 并计算该向量的散度矩阵的特征值和特征向 量, 之后保留若干较大的特征值对应的特征向量构 成投影矩阵. 由于 PCA 主要考虑的是掌纹的表 示 (Representation), 而不是掌纹的判别 (Discrimi- nance), Wu 等[48−49] 又提出了在 PCA 的基础上再 进行 LDA 降维的 FisherPalm 方法. LDA 方法同 时考虑类内散度和类间散度, 并通过最大化类间散 度同时最小化类内散度 (即 Fisher 准则) 计算最优 的投影矩阵. 此外, 文献 [50] 提出融合 PCA 和 LDA 特征, 文献 [51] 提出利用核线性判别分析 (Kernel Fisher discriminant analysis, KFDA) 方法, 都取 得了比单独使用 PCA 或 LDA 更好的效果. 由 于 小 样 本 (Small sample size, SSS) 问 题, PCA 易于对训练集产生过拟合 (Overfitting). 作为 一维 PCA 的推广, Yang 等[52] 提出了 2DPCA 并 应用于人脸识别. 在 2DPCA 中, 图像被看作是由若 干个行向量组成, 并在此行向量上进行 PCA 降维, 这就有效地解决了小样本问题. 相比于 PCA, 该方 法具有更好的泛化能力, 但缺点是特征维数较高. 在 此基础上, Wang 等[53] 将 2DPCA 和 LDA 结合的 方法应用于掌纹识别. 在文献 [54] 中, Lu 等指出, 先 对掌纹图像做小波分解, 再应用 2DPCA, 可以得到 比直接应用 2DPCA 更高的识别率. BDPCA (Bi-directional PCA) 由 Zuo 等提出, 并应用于人脸和掌纹识别[11, 55]. BDPCA 可以看作 是 2DPCA 的一种推广, 通过分别计算行投影矩阵 与列投影矩阵, 将掌纹图像最终变换为一个矩阵, 作 为该掌纹的特征. 对于该特征矩阵, Zuo 等采用集成 矩阵距离 (Assembled matrix distance, AMD) 的 度量方式计算相似度. 相对于 PCA, BDPCA 具有 更好的泛化能力, 可以减轻训练时带来的过拟合. 该 方法还省去了 PCA 中的图像连接过程, 因此特征提 取的效率更高. 此外, BDPCA 提取的特征维数要远 小于 2DPCA, 因此保存特征所需的存储空间更小, 匹配速度更快. 在 BDPCA 的基础上, 文献 [56] 使 用 BDPCA 和 LDA 相结合的方法, 文献 [57] 提出 先用 BDPCA 提取特征再用一维 PCA 降维的方法, 都得到了比单独使用 BDPCA 更好的结果. 在文献 [58] 中, 接标等将 ICA 方法应用于掌纹 识别. 在文献 [59] 中, Lu 等先将掌纹图像做小波分 解, 之后应用 ICA 方法提取特征, 实验表明优于直 接使用 ICA 的方法. 基于子空间的方法具有坚固的理论基础, 并且 已广泛地应用于人脸识别中. 相对于基于结构的方 法, 具有识别率高、特征小等优点, 较之基于统计的 方法也有更高的识别率. 尤其是在 Zuo 等提出 BD- PCA 之后, 特征提取阶段的计算量也大大减少, 使 得该类方法的优势更加明显. 但是该类方法通常对 每个类别都需要多个训练样本, 且训练样本的选取 对识别结果影响较大. 表 4 列出了几种主要的基于子 表 3 基于统计的方法的比较 Table 3 Comparison of statistics-based methods 算法名称 特征维数 匹配方法 数据库 8 + 8 一阶范数和相关系数 3 000 幅图像 加权的一阶范数 200 幅图像 傅里叶变换[37] 小波变换[38] Hu 矩[43] Zernike[44] 27 7 11 欧氏距离 欧氏距离 一阶范数 378 幅图像 FAR = 0.038 %, GAR = 98.1 % 300 幅图像 识别率 95.48 % 98 % 等误率 (%) 6.44 5.56
3 期 岳峰等: 掌纹识别算法综述 359 表 4 基于子空间的方法的比较 Table 4 Comparison of subspace-based methods 算法名称 特征表示 特征维数 匹配方法 EigenPalm[47] FisherPalm[49] BDPCA[11] 矢量 矢量 矩阵 100 299 19 × 17 加权的欧氏距离 欧氏距离 集成矩阵距离 训练集 382 × 4 300 × 6 100 × 3 测试集 382 × 4 300 × 4 100 × 3 识别率 (%) 99.149 99.75 98.67 空间的方法的识别性能. 2.4 基于编码的方法 基于编码的方法是指先用滤波器对掌纹图像滤 波, 之后根据某些规则将滤波后的结果进行编码的 方法. 通常特征都按照比特码的形式存储, 对得到的 特征码多采用二进制的 “与” 或者 “异或” 计算相似 度. 该类方法主要包括三个核心部分: 滤波器的选择 (Gabor, 高斯, 高斯的导数), 编码规则 (最大值, 序 数关系), 以及匹配方式 (点对点, 点对区域). 编码的方法首先由 Daugman 提出并应用于虹 膜识别[60], 该方法使用 2D Gabor 滤波器对虹膜图 像滤波, 之后根据滤波结果的实部和虚部的符号编 码. 若为正则编码为 1, 否则编码为 0, 每个采样点 被编码为 2 个比特. 文献 [7, 61] 直接将该方法用于 掌纹识别中, 提取的特征码称为 PalmCode. 由于 只使用了一个方向为 45◦ 的 Gabor 滤波器, 不同手 掌滤波后的掌纹图像都非常相似 (表现为包含很多 45◦ 的条纹), 这无疑会降低掌纹的可分性, 从而影 响掌纹识别系统的性能. 为了克服这个缺点, 在文献 [12, 62] 中, Kong 等提出了一种称为 FusionCode 的方法. 在用两个方向的 Gabor 滤波器对掌纹图像 滤波之后, 对每个采样点, 编码幅值最大的方向的相 位信息. 相位信息被量化到四个区间, 因此每个采样 点同样被编码为 2 个比特. 相比于 PalmCode, Fu- sionCode 方法同时利用了幅值和相位信息, 因此获 得了更好的识别性能. Wu 等[13] 提出利用高斯函数 的导数作为滤波器, 在水平和垂直方向对图像滤波, 最后根据滤波结果的符号编码, 称作 DoGCode. 实 验结果表明该方法优于 FusionCode 和 PalmCode. Kong 等在文献 [14] 中提出使用六个方向的实 值 Gabor 滤波器对掌纹图像滤波, 并对幅值最小的 方向编码, 称为竞争编码 (Competitive code). 在每 个采样点被巧妙地编码为三个比特之后, 可以通过 二进制的 “异或” 操作高效地计算出采样点间的角 度距离. 为了克服预处理带来的平移对匹配产生的 影响, 在匹配阶段需要在 [−2, +2] 的范围内进行竖 直和水平方向上平移, 并取距离最小的匹配结果作 为最终的距离. 由于竞争编码考察了掌纹图像的方 向信息, 对光照强度不敏感, 而且对不同时期采集的 掌纹有很好的稳定性, 因此获得了很高的识别精度. 简单的异或操作也使得匹配速度非常快, 因此该方 法是一种非常有效的掌纹识别算法. Sun 等在文献 [15] 中提出了一种不同的编码方 法, 称为序数编码 (Ordinal code). 该方法选择六个 方向的 2D 高斯函数作为滤波器, 之后根据互相垂 直的两个方向 (共有三组) 上滤波结果的大小关系编 码. 因此与竞争编码相同, 该方法中每个采样点同 样被编码为三个比特. 匹配时同样采用二进制的 “异 或” 操作. 由于该方法考察的是不同方向滤波结果的 大小关系, 而滤波是一个线性操作, 因此可以在对图 像滤波之前先进行滤波器的组合: 对三组方向互相 垂直的滤波器作差, 得到三个新的滤波器, 这样用得 到的滤波器对图像滤波后只需考察结果的正负. 所 以, 对每个采样点, 该方法只需进行三次滤波操作, 特征提取阶段的效率要高于竞争编码. 此外, 序数编 码对于每个采样点共有 23 = 8 种编码方式, 而竞争 编码只使用了其中的 6 种. 仔细分析竞争编码与序数编码方式可知, 这两 种方法都将掌纹看作由有方向的纹线构成, 考虑了 每个采样点在六个不同方向上的信息. 不同的是, 竞 争编码选择最主要的方向作为特征, 而序数编码考 虑了三组互相垂直的两个方向间的相互关系. 由于 除少数交叉点外, 大多数掌纹纹线只有一个方向, 该 方向上的滤波结果为各方向上的极值, 而在其他方 向上滤波结果及其相互关系并不稳定, 易于受噪声 的干扰. 因此与序数编码相比, 对于掌纹识别, 竞争 编码提取的特征更加稳定, 因此识别精度更高[63]. 最近, Jia 等[16] 提出了一种鲁棒的线方向编 码 方 法 (Robust line orientation code, RLOC). RLOC 是一种利用改进的有限 Radon 变换 (Finite Radon transform, FRAT) 来提取掌纹的线特征的 识别方法. Radon 变换可以有效地提取图像中的线 特征, 而有限 Radon 变换使得它可以处理有限长度 的信号. 为了去除 FRAT 的环绕 (Wrap around) 效 应, 改进的 FRAT 采用了通过中心的不同方向的线 性模板. 在匹配过程中, 为了克服掌纹的非线性形 变带来的误差, RLOC 采用了点对区域的匹配方式, 即待匹配图像中的一个点与模板中以该点位置为中 心的一个区域中的所有点匹配, 匹配时采用的是二 进制的 “与” 操作. 由于采用了整数值的模板, 这种 方法在特征提取时速度非常快, 但点对区域的匹配
360 自 动 化 学 报 36 卷 方式使得匹配时速度较慢. 对比 RLOC 与竞争编码, 我们发现两者都是通 过竞争规则编码六个方向中的主方向, 而区别则是 采用不同的滤波器 (Gabor 或改进的 FRAT) 以及 不同的匹配方式 (点对点或点对区域). 由于文献 [16] 中的实验结果表明 RLOC 优于竞争编码, 因此有必 要考察滤波器和匹配方式对性能产生的影响. 根据 评测结果[63], 滤波器对算法的识别性能影响并不大, 因此可以推断, 性能的提升来自于点对区域的匹配 方式, 而不是改进的 FRAT. 对竞争编码或序数编码 提取的特征采用点对区域的匹配方式也会提升原方 法的性能. 文 献 [64] 最 近 提 出 了 一 种 称 为 二 值 方 向 共 生向量 (Binary orientation co-occurrence vector, BOCV) 的掌纹识别方法. 该方法同样利用六个不 同方向的 Gabor 滤波器对掌纹图像滤波, 之后对结 果的过零点信息进行编码, 每个点被编码为六个比 特. 匹配时与竞争编码类似, 采用异或操作计算汉明 (Hamming) 距离. 实验结果表明该方法优于竞争编 码和 RLOC. 由此可以看出, 不同方向的滤波结果都 包含丰富的判别信息, 将其全部作为特征提取出来, 在识别性能上要优于提取主方向 (竞争编码) 或两两 垂直的方向间的相互关系 (序数编码). 但这种方法 的缺点是特征较大, 为竞争编码或序数编码的两倍. 基于编码的方法最初借鉴了虹膜识别的方法, 之后研究人员根据掌纹的特点提出了一些改进方案. 从利用幅值和相位信息, 到提取掌纹的方向信息; 从 单个滤波器, 到使用不同方向的一组滤波器 (Filter bank), 实验结果表明这些改进是可行的和有效的. 相比于前几类方法, 这类方法具有识别率高、特征 小、特征提取及匹配速度快、实现简单等特点, 因此 最具有竞争力. 表 5 列出了几种基于编码的方法的 性能比较. 2.5 各类方法的比较 从以上的分析可以看出, 除少数通用的图像识 别方法 (如子空间方法和图像不变矩方法) 之外, 大 多数的掌纹识别方法都考虑了掌纹的特点. 例如, 在 特征提取阶段, 考虑了掌纹纹线的位置、方向、粗细 等信息, 而在特征匹配阶段, 通过加入平移、旋转以 及点对区域的匹配方式, 克服手掌的位置改变以及 手掌肌肉的伸缩带来的影响. 基于结构的方法是以 掌纹中的纹线作为特征, 最为直观, 但由于掌纹中的 纹线的灰度、宽度等变化较大, 无论经典的边缘检 测算子还是宽线检测算子都无法一致地检测到所有 纹线, 因此识别精度不高. 子空间方法并没有考虑 掌纹的特点, 只是将训练集中掌纹图像作为一般的 模式 (Pattern) 进行判别分析, 而且子空间方法需要 训练得到包含众多参数的投影矩阵, 因此小样本问 题是制约子空间方法的主要问题. 基于全局统计量 的方法在减小类内差别的同时也极大地减小了类间 差别, 过小的特征维数使其无法包含足够多的判别 信息. 基于局部统计量的方法可以得到维数较大的 特征, 但若同等对待全部特征通常效果并不理想, 因 此需要通过特征选择保留包含判别信息的特征. 基 于编码的方法对掌纹图像中的所有区域都相同对待, 不需要明确地提取掌纹纹线, 不仅实现简单, 而且对 于模糊的纹线具有更好的鲁棒性. 总的来说, 基于结构的方法识别精度低, 特征所 需的存储空间大, 而且匹配速度慢; 基于编码的方 法识别精度高, 特征小, 而且匹配速度快, 是各类方 法中最具有优势的一类; 而基于统计的方法和基于 子空间的方法的识别精度和识别速度介于两者之间. 各类方法的比较见表 6. 表 6 各类掌纹识别方法的比较 Table 6 Comparison of various kinds of methods 方法类别 识别精度 特征大小 速度 基于结构的方法 基于统计的方法 基于子空间的方法 基于编码的方法 低 中 高 高 大 小 中 小 慢 中 快 快 表 5 基于编码的方法的比较 Table 5 Comparison of coding-based methods 算法名称 特征大小 数据库 识别率 等误率 (%) 判别指数 Palm code[7] Fusion code[12] DoG code[13] Competitive code[14] Ordinal code[15] RLOC[16] BOCV[64] 256 256 256 384 384 384 768 PolyU (v2) 11 074 幅图像 FAR = 0.0138 %, GAR = 96.33 % 7 605 幅图像 PolyU (v2) PolyU (v1) UST PolyU (v2) PolyU (v2) 0.6 0.6 0.19 0.40 0 0.22 0.16 0.019 6.49 4.77
分享到:
收藏