logo资料库

PCA人脸识别_毕设论文.doc

第1页 / 共52页
第2页 / 共52页
第3页 / 共52页
第4页 / 共52页
第5页 / 共52页
第6页 / 共52页
第7页 / 共52页
第8页 / 共52页
资料共52页,剩余部分请下载后查看
摘 要
ABSTRACT
摘 要 由于广泛的应用,比如用于监视和安全,身份鉴别,存取控制等,最近几年,人脸 识别引起了广泛的兴趣。最近的几十年,关于人脸识别人们已经提出了许许多多的方法。 在这些方法中,PCA 和 LDA 技术,已经被证明为是两种大有前途的方法。 我们要做的就是提高人脸识别的正确识别率,为了达到这个目的,我们从以下几个 方面下手:特征提取,分类器选择。 特征提取是模式识别中最基本的问题之一,在人脸识别中,抽取有效的鉴别特征是 解决问题的关键,主成分分析( Principal Component Analysis, PCA)和 Fisher 线性鉴别 分析是属于线性投影分析,是特征提取中最为经典和广泛使用的方法。该文就有关线性 投影分析的理论与算法进行了研究。最后,在 ORL 标准人脸数据库上进行了试验表明, PCA 方法在普通的最近邻分类器下最高达到了 95%的正确率,LDA 也达到了 92.5%的 正确率,而且识别结果十分稳定。 关键词:主元分析; Fisher 鉴别准则; 线性鉴别分析; 特征抽取;人脸识别
ABSTRACT Face recognition has been of great interest in recent years because its wide range of application such as surveillance and security ,identity authentication and access control ,etc. Numerous methods have been proposed for face recognition in the last decade. Among all these approaches , techniques based on PCA and LDA , have been proved to be two promising approach. In order to enhance the accuracy of the recognition, the main goal of our research, we deal with the problems as follow: feature extraction, classifier selection. Feature extraction is one of the most fundamental problems. In face recognition , to extract the valid discriminating feature plays the key role to solve the problems. PCA and fisher are both the most typical methods that are based on linear projection analysis and widely used. This text does a further research on theories and algorithms of linear projection analysis. Finally, the PCA algorithm was test on ORL face database, and a recognition rate of 97% was achieved by using a common nearest neighbor classifier, while LDA is 97.2%, and the classification result is very robust. Keywords:PCA(principal component analysis); Fisher criterion; linear discriminate analysis; feature extraction; face recognition
目 录 第一章 绪论 ................................................................ 1 1.1 课题研究的背景 ..................................................... 1 1.2 模式识别系统 ....................................................... 1 1.3 国内外生物特征技术的最新发展 ....................................... 3 1.4 我国生物特征技术的发展与应用概述 ................................... 4 1.5 本文主要研究的内容 ................................................. 4 第二章 人脸图像的有效鉴别特征抽取 .......................................... 5 2.1 引言 ............................................................... 5 2.2 人脸图像的代数特征 ................................................. 5 2.2.1 奇异值特征 ................................................... 5 2.2.2 最佳鉴别投影特征 ............................................. 6 2.2.3 特征脸(K-L 变换特征) ...................................... 8 2.3 本章小结 .......................................................... 10 第三章 主成分分析法(PCA) ................................................ 11 3.1 引言 .............................................................. 11 3.2 主元分析发展的相关介绍 ............................................ 11 3.3 主元分析(PCA)方法 ............................................... 12 3.3.1 PCA 思想与最优投影矩阵 ...................................... 12 3.3.2 特征抽取 .................................................... 13 3.3.3 分类 ........................................................ 13 3.4 主元分析(PCA)方法在人脸识别中的应用 ............................. 14 3.5 本章小节 .......................................................... 14 第四章 线性鉴别分析(LDA) ................................................ 15 4.1 引言 .............................................................. 15 4.2 线性鉴别分析方法的发展 ............................................ 15 4.3 线性鉴别分析的基本原理 ............................................ 16 4.4 Fisher 线性鉴别法 ..................................................17 4.5 线性鉴别分析在人脸识别中的应用 .................................... 17 4.6 分类 .............................................................. 18 4.7 本章小节 .......................................................... 18 第五章 实验结果 .......................................................... 19 5.1 实验数据库介绍 .................................................... 19 5.2 ORL 人脸库上的实验结果 .............................................20 5.2.1 得到的特征图像 .............................................. 20 5.2.2 不同训练样本下的识别率 ...................................... 20
5.2.3 两种算法运行时间的比较 ...................................... 21 5.2.4 不同方法的特征值分布情况 .................................... 21 5.3 眼睛数据库上的试验结果 ............................................ 22 5.3.1 得到的特征图像 .............................................. 22 5.3.2 不同训练样本下的识别率 ...................................... 23 5.3.3 两种算法运行时间的比较 ...................................... 24 5.3.4 不同方法的特征值分布情况 .................................... 24 5.4 实验结果分析 ....................................................... 25 5.5 本章小节 ........................................................... 26 结束语 ..................................................................... 27 参考文献 ................................................................... 28 致 谢 ..................................................................... 29 附录一 PCA 源程序 .......................................................... 30 附录二 LDA 源程序 .......................................................... 39
南京邮电大学 2007 届本科毕业论文 第一章 绪论 1.1 课题研究的背景 在高度信息化的现代社会,人们的身份鉴别已经渗透到日常生活的每一个方面。同 时, 由于交通、通讯和网络技术的飞速发展,人类的活动范围越来越大,身份鉴别的难 度和重要性也越来越突出。身份鉴别有着特别广泛的应用前景和重要的战略意义。金融、 安全、网络、电子商务等无一不需要可靠的身份鉴别。传统的利用密码等身份鉴别的方 法具有易遗忘、易假冒等缺点, 已不符合现代数字社会的需求。基于生物特征的身份鉴 别技术利用人本身所拥有的生物特征来判别人的身份, 这些生物特征具有“人各有异、 终生不变、随身携带”三个特点, 具有稳定、便捷、不易伪造等优点,近年来已成为身 份鉴别的热点。常用的生物特征包括指纹、掌纹、虹膜、脸像声音、签名和笔迹等。 近些年,生物特征识别领域有了很大的进步,比如说人脸识别、虹膜识别、人耳识 别等都是近些年发展比较迅速的技术。人脸识别在安全系统和人机交互等方面的巨大应 用前景,它已经成为当前模式识别和人工智能领域的一个研究热点。虹膜作为重要的身 份鉴别特征,具有唯一性、稳定性、可采集性、非侵犯性等优点。非侵犯性(或非接触式) 的生物特征识别是身份鉴别研究与应用发展的必然趋势, 与脸像、声音等非接触式的身 份鉴别方法相比, 虹膜具有更高的准确性。本文将着重从人脸识别来进行讨论,同时在 最后的实验验证中使用 ORL 人脸数据库和眼睛图像库。 在日常生活中,人们识别周围的人用的最多的就是通过看人脸来进行识别的,因而 人脸识别是一种最容易被接受的身份鉴定方法。由于人脸识别是非侵犯性的识别,具有 直接、友好、方便的特点,所以人脸识别是人们最容易接受的身份鉴别方式。但另一方 面,由于人脸之间存在很大的相似性以及人脸的高度变形性,也使得这个课题极富挑战 性。 在诸如人脸识别课题的研究中,特征提取是模式识别研究的关键问题,它的基本任 务是找出对分类最有效的特征[1]。通常需要一个定量的准则来衡量特征对分类的有效 性。主元分析(Principal Component Analysis,PCA)和线性鉴别分析(Linear Discriminant Analysis,LDA)特征提取中最为经典和广泛使用的方法之一。 1.2 模式识别系统 有两种基本的模式识别方法[2],即统计模式识别方法和结构(句法)模式识别方法, 与此相应的模式识别系统都由两个过程组成,即设计和和实现。设计是指用一定量的样 本(叫作训练集或学习集)进行分类器的设计。实现是指用所设计的分类器对待识别的 样本进行分类决策。基于统计方法的模式识别系统主要由 4 个部分组成: 1)数据获取 2)预处理 3)特征提取和选择 1
南京邮电大学 2007 届本科毕业论文 4)分类决策 下面给出一个模式识别系统,见图 1.1。 信息获取 预处理 特征提取和选择 训练过程 分类器设计 分类决策 图 1.1 模式识别系统 下面简单的对这几个部分作一些说明。 1.数据获取 为了使计算机能够对各种现象进行分类识别,要用计算机可以运算的符号来表示所 研究的对象。通常输入的信息有下面 3 种类型,即: 1)二维图像 如文字、指纹、地图、照片这类对象。 2)一维波形 如电脑、心电图、机械震动波形等。 3)物理参量和逻辑值 前者如在疾病诊断中病人的体温及各种化验数据等;后者如 对某参量正常与否的判断或对症状有无的描述,如疼与不疼,可用逻辑值 0 和 1 表示。 在引入模糊逻辑的系统中,这些值还可以包括模糊逻辑值,比如很大、大、比较大等。 通过测量、用采样和量化,可以矩阵或向量表示二维或一维波形。这就是数据获取 的过程。 2.预处理 预处理的目的是去除噪声,加强有用的信息,并对输入测量仪器或其他因素所造成 的退化现象进行复原。 3.特征提取和选择 由图像或波形所获得的数据量是相当大的。例如,一个文字图像可以有几千个数据, 一个心电图波形也可能有几千个数据,一个个卫星遥感图像的数据就更大。为了有效的 实现分类识别,就要对原是数据进行变换,得到最能反映分类本质的特征。这就是特征 提取和选择的过程,一般我们把原始数据组成的空间叫测量空间,把分类识别赖以进行 的空间叫特征空间,通过变换,可以把维数较高的测量空间中表示的模式变为在维数较 低的特征空间中表示的模式。在特征空间中的一个模式通常也叫做一个样本,它往往可 以表示为一个向量,即特征空间中的一个点。 4.分类决策 分类决策就是在特征空间中用统计方法把识对象归为某一类别。基本做法是在样本 训练集基础上确定某个判决规则,使按这种规则对被识别对象进行分类错误识别率最小 或引起的损失最小。 本文在下面的内容中将着重探讨特征提取的方法,同时并介绍一些分类决策的知识。 2
南京邮电大学 2007 届本科毕业论文 下面以人脸识别为例,给出具体的识别步骤图,见图 1.2 训练样本 图像预处理 训练样本特征 特征提取矩阵 分类器 结 果 测试样本 图像预处理 测试样本特征 图 1.2 人脸识别步骤 1.3 国内外生物特征技术的最新发展 近几年生物特征领域三大发展引人注目,第一生物特征的多样化发展;第二各项生 物技术的高速发展;第三是多生物特征融合技术的研究。 生物特征的多样化发展:提起生物特征,人们自然会想到指纹,指纹技术由于其技 术的稳定性一直在生物特征领域是“热门技术”,但是指纹技术自身的缺陷,也给其他生 物特征留下很大的发展空间。 让人们感到惊奇的是,以前大家不大关注的生物特征如虹膜、语音、步态等现在又 有了重大的技术突破。最有代表性的是拥有掌型技术、人指静脉纹技术、虹膜技术的厂 商在今年陆续推出了自己的最新产品,在例如手机等商业应用中经过对使用人群的简单 训练,这些产品的高识别率、可接受度等优秀品质受到众多使用人员的欢迎。 各项生物技术的高速发展:人脸识别技术以其非侵犯性、可接受性等众多优势,近 几年来一直是世界上生物识别公司及科研院所开发的热点,人脸识别技术在生物技术产 业中精确度方面的发展可能是最快的。FRVT2002 技术表明人面像识别技术的验证能力 可与 1998 年的基于指纹的商用系统相比(False Accept Rate 设为 0.01)。在仅一年后, 提供商声称改进的技术超出了这个水平。特别考虑到在不久的将来有更多的大规模的项 目指定该技术(电子生物护照指定人脸技术为必须的生物特征)。这一指标的提高是至关 重要的,大大缩小了与指纹技术的差距。在 2003 年人脸识别技术有一项重大突破:3D 技术的出现。该技术能够很好的解决 2D 中光照和姿势带来的困扰,虽然 3D 技术本身也 有一些问题,但其卓越的识别性能还是吸引了更多技术厂商和应用客户的眼光。 多生物特征融合技术的研究:在实际应用中,由于客观条件变化的不可估计性,单 生物特征识别技术往往会遇到难以克服的特例,譬如在使用指纹认证时,相当一部分人 不能采集到清晰的指纹。另外,在一些安全性要求极高的应用领域,单生物特征识别的 性能很难达到预期的需要。多生物特征认证技术利用了多个生物特征,结合数据融合技 术,不仅可以提高识别的准确性,而且可以扩大系统覆盖的范围,降低系统的风险,使 之更接近实用。 多生物特征认证系统比单生物特征认证系统具有更好的性能。国际上许多学者已致 力于多生物特征人的身份认证技术的研究,达到最新技术发展水平的指纹和人脸商业系 3
南京邮电大学 2007 届本科毕业论文 统进行结合,并在大规模人群上进行测试,取得令人满意的效果。因此,多生物特征融 合识别技术近年来己成为生物特征识别技术研究领域的一个热点,也是未来生物特征应 用领域的必然趋势。 1.4 我国生物特征技术的发展与应用概述 我国于上世纪 90 年代初,指纹信息识别产品和系统开始应用于公安业务和安全防范 领域。据不完全统计,目前生产生物特征识别产品的企业(主要是指纹、面像识别)近 百家,社会公共安全行业制定的相关标准约 30 余项。但这些标准都是以公安业务的刑事 侦察、证照管理或安全防范的视频监控系统、出入口控制系统的具有应用环境为基础而 制定的,未能从人体生物特征识别技术的高度建立相应的标准体系。 2002 年公安部第一研究所组织了国内第一次面像识别技术测试。在这次测试中,遵 从公平、公正、客观、科学的原则,建立了严谨的评测方案与流程,严格遵守商业规则 及保密承诺,以其独立方的性质、行业地位及测试方案的科学指导性赢得参评厂家的信 任和支持。通过此次工作,公安部第一研究所建立了相应的测试软硬件环境,是国内最 早开展人体生物特征技术评测及拥有实测经验的部门。 随着新技术的不断推出和行业应用的迫切需求,公安部第一研究所再次举行了人脸 识别技术测试,其中测试中最优人脸识别算法推荐到深圳罗湖自助通关中应用,经过几 个月的测试,人脸认证软件的旅客自助通道系统在深圳罗湖口岸正式投入使用,通过率 超过了 97%。 纵贯历史,人类对生物特征的认识和利用由来己久。展望未来,更加安全的国土、更 加和谐的社会、更加便捷的商务必将让生物识别技术大放光彩。 1.5 本文主要研究的内容 本文就经典的特征提取算法进行了研究,研究的基础是传统的 PCA 和 LDA 算法。 对两个算法进行研究后,并用 matlab 程序语言实现这两个算法。 本文总共分为四章进行讨论。 第一章 绪论,主要介绍了生物特征识别领域的现状,模式识别系统的相关知识。了 解模式识别系统的基本流程和组成的基本概念。 第二章 主要介绍人脸图像的有效鉴别特征抽取。这一章为我们下面几章的讨论提供 了一些理论基础。 第三章 主要内容是介绍主成分分析法的相关思想和实现步骤。 第四章 主要内容是介绍线性鉴别算法的相关原理和思想。 第五章 主要介绍了 PCA 和 LDA 两种算法在 ORL 人脸数据库和眼睛数据库上的试 验结果情况。同时对实验结果进行了分析。 4
分享到:
收藏