矩阵分解在人脸识别中的应用
摘要:矩阵分解方法有多种,本文首先对矩阵的分解方法做了简单的介绍,这些分解在数值
代数和最优化问题的解决中都有着十分重要的角色以及在其它领域方面也起着必不可少的
作用。人脸识别是指采用机器对人脸图像进行分析 ,进而提取有效的识别信息从而达到身份
辨认的目的 。近年来因其在安全、认证、人机交互、视频电话等方面的广泛应用前景而越
来越成为计算机模式识别领域的热点。本文在分析矩阵分解的原理后详细针对其在人脸识别
中的应用做了一些初步认识的总结。
关键词:三角分解 QR 分解 奇异值分解 人脸识别
矩阵是数学中最重要的基本概念之一,是代数学的一个主要研究对象,也是数学研究及
应用的一个重要工具。在近代数学、工程技术、信息处理、经济理论管理科学中,也大量涉
及到矩阵理论的知识,矩阵分解是指根据一定的原理用某种算法将一个矩阵分解成若干个矩
阵的乘积或者一些矩阵之和。这些分解式的特殊形式,一是能明显地反映出原矩阵的某些特
征;二是分解的方法与过程提供了某些有效的数值计算方法和理论分析依据。人脸识别是指
采用机器对人脸图像进行分析 ,进而提取有效的识别信息从而达到身份辨认的目的 。虽然
人类能轻松地识别出人脸,但人脸的自动机器识别却是一个难度极大的课题,它涉及到图像处
理、模式识别、计算机视觉和神经网络等学科,也和对人脑的认识程度紧密相关。现在矩阵
分解在人脸识别中应用很广泛,有不同的算法来实现,本文将对现有的算法做总结和比较。
1 矩阵的分解方法
矩阵分解 (Decomposition Factorization)是将矩阵拆解为数个矩阵的乘积,可分为三角分
解、满秩分解、QR 分解、 Jordan 分解和 SVD (奇异值)分解等,常见的有三种:1)三角
分解法 (Triangular Factorization),2)QR 分解法 (QR Factorization),3)奇异值分解法
(Singular Value Decomposition)。
1.1 矩阵的三角分解
A
LU
)
以 LU 分解为例,设 A =
( ija 是n阶可逆矩阵,即
,其中为 L 正线下三角矩阵,U 为酉矩阵。
nn
nCA
,则 A 可唯一分解为
0
0
1
0
1
2
n
u
11
u
21
u
1
n
u
u
12
1
n
u
u
22
2
u
u
nn
2
n
n
l
a
11
a
21
a
1
n
a
a
12
1
n
a
a
22
2
a
a
nn
2
n
n
1
l
l
21
1
n
1.2 矩阵的QR 分解
矩阵的QR 分解(正交三角分解)在解决最小二乘问题、特征值计算、广义逆矩阵的计
,
算方面,都是十分重要的。矩阵的QR 分解过程为:设 A 是n阶可逆实矩阵,即
则 A 可惟一分解为
nn
nRA
A
QR
其中,Q 为正交矩阵, R 是正线上三角矩阵。
1.3 矩阵的奇异值分解
奇异值分解在某些方面与对称矩阵或Hermite矩阵基于特征向量的对角化类似。然而这
两种矩阵分解尽管有其相关性,但还是有明显的不同。对称阵特征向量分解的基础是谱分析,
而奇异值分解则是谱分析理论在任意矩阵上的推广。奇异值分解( SVD )是另一种正交矩阵
分 解 法 ; SVD 是 最 可 靠 的 分解 法 , 但 是 它 比 QR 分 解 法 要 花 上近 十 倍 的 计 算 时 间 。
,
,其中U 和V 代表二个相互正交矩阵,而 S 代表一对角矩阵。和QR 分
VSU
解法相同者,原矩阵 A 不必为正方矩阵。使用 SVD 分解法的用途是解最小平方误差法和数
据压缩。矩阵的奇异值在最优化问题、特针织问题、最小二乘方向题、广义逆矩阵问题及统
svd
)
A
(
,
计学等方面都有重要的作用。
设
nm
rCA
,而
V ,使得
,2,1
(
ii
),
r
为A的正奇异值,则存在 m 阶酉矩阵U 和 n 阶酉矩阵
UA
OD
OO
V
其中
D
diag
(
r
,
,
,
2
1
)
,而
,2,1
(
ii
),
r
为是满足
i
i
(
i
,2,1
),
r
的
复数,以分解称为 A 的奇异值分解。
2 矩阵分解在人脸识别中的应用
2.1 矩阵分解应用于人脸识别的发展历史
人脸识别的研究可以追溯到 20 世纪 60 年代 ,近 20 年来得到了迅速发展 ,涌现出了
很多新的方法。这些方法的有效性很大程度上取决于它们所提取的人脸特征。目前可利用人
脸特征可分为四类:视觉特征 ,统计特征 ,变换系数特征和代数特征等。其中 ,代数特征被认
为是人脸的本质特征 ,表征了人脸图像的内在特性。目前典型的代数特征主要包括奇异值特
征和本征脸( Eigenfaces)特征等。本征脸( Eigenfaces)技术比较成熟 ,但其计算较为复杂 ,因
此国内关于代数特征的研究主要集中于奇异值特征上Hong在文献中首先提出了经典的基于
奇异值特征的人脸识别方法 ,把人脸图像视为一个矩阵 ,进行奇异值分解从而提取其奇异值
特征 ,并投影到Foley2Sammon 最佳鉴别平面进行识别 ,但在实验中误识率为42.67% ,Hong
认为是小样本对统计方法的影响。随后许多人提出了消除小样本统计方法的影响的方法,但
是这些方法均采用人脸的奇异值特征取代原始的人脸图像 。
然而最近的研究表明 ,这是远远不够的,后来的文献中有人发现人脸的奇异值特征只包
含了少数有用信息 ,更多的信息则包含在由两个正交矩阵组成的特征矩阵中 ,由此提出了在
识别时采用将待识别的人脸向每个已知人脸的特征矩阵投影 ,取投影后得到的系数矢量作
为特征同已知人脸的奇异值特征进行比较识别。该方法在ORL 人脸库上获得了92.50 %的识
别率。值得注意的是 ,投影后得到的系数矩阵一般为非对角矩阵 ,且非对角线上的系数包含
了许多关键的识别信息。
2.2 QR分解在人脸识别中的应用
针对维数压缩中的鉴别信息提取,对一种已有的解决小样本问题的直接线性鉴别分析方
法(direct linear discriminate analysis。 DIDA ),利用矩阵的 QR 分解实现数据的预处理,并
且在低维的空间内实现了特征提取,实现算法的实时处理。最后,在ORL 人脸数据库上的
实验结果验证方法的有效性。
维数压缩很重要的一个目的是为了实现样本分类,利用Fisher鉴别准则能在维数压缩过
程之中融入样本的鉴别信息,但是小样本问题是在利用Fisher鉴别准则时经常会遇到的问题,
直接线性鉴别分析方法是解决此类问题的一个有效鉴别维数压缩方法。在直接线性鉴别分析
方法中引入矩阵QR 分解的思想,为高维、小样本的有效鉴别信息提取提供了理论框架。QR
分解的引入,使得无需处理一个高维的原始样本矩阵。通过分析矩阵的QR 分解过程,可以
在一个相对低维的空间中实现目标函数的优化.在第一步实现矩阵的目标函数优化之后,可
以在一个较小的空间中实现特征提取过程.此时在新的空间之中,最佳鉴别矢量的计算只需
在一个最大为 1C ( C 为样本类别数)维空间中计算,有效降低了计算复杂度和对硬件存储性
能的要求。
2.3 奇异值分解在人脸识别中的应用
所有人脸识别方法的有效性都依赖于两方面:特征提取和特征匹配.特征提取,即寻找
有效的特征,是解决识别问题的关键所在.用于识别的图像特征有多种,包括视觉特征、统
计特征、变换系数特征以及代数特征等.其中,代数特征是由图像本身的灰度分布所确定的,
它描述了图像的内在信息,而这种内在信息对增强图像的识别能力是非常重要的.奇异值就
是一种很有效的代数特征,所以奇异值分解在数据压缩、信号处理和模式分析等许多方面都
获得广泛应用.在某种程度上,奇异值特征同时拥有代数与几何两方面的不变性,奇异值分
解是一个有着很明显的物理意义的一种方法,它可以将一个比较复杂的矩阵用更小更简单的
几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特性。就像是描述一个人一样,
给别人描述说这个人长得浓眉大眼,方脸,络腮胡,而且带个黑框的眼镜,这样寥寥的几个
特征,就让别人脑海里面就有一个较为清楚的认识,实际上,人脸上的特征是有着无数种的,
之所以能这么描述,是因为人天生就有着非常好的抽取重要特征的能力,让机器学会抽取重
要的特征, SVD 是一个重要的方法。
由于矩阵的奇异值分解可以看作,把一个秩为k的矩阵分解成一组秩为1的矩阵的加权
和,则这样一幅图像就可以表示成如下形式:
A
其中 i是奇异值, Ti
i 为图像的正交基。
k
i
T
i
i
i
1
尽管对于任何给定的实矩阵 A ,在
1
2
k
的限制下,它的奇异值分解式是唯一
的,但相同的奇异值矩阵却可以对应不同的人,也就是说奇异值矩阵与人脸图像并不是一一
对应的。
对于人脸的识别,仅仅利用奇异值是远远不够的,还要充分利用携带重要信息的正交矩
阵。根据 SVD 定理,这些正交矩阵的列,正好是奇异值对应于 AAT 和 ATA 的特征向量。
由于每一幅图像都有可能受到光照、姿势、表情等噪声的影响,所以对识别会造成很大干扰。
而原始数据矩阵的所有奇异值和特征向量中包含了该数据矩阵的全部信息(也包含了很多干
扰信息),同时对于那些有用的信息,每个奇异值和特征向量所包含的能量也是不同的,较
大的奇异值及其对应的特征向量包含了较多的能量.本文通过保留 SVD 中前面部分较大的
奇异值及其对应的特征向量,以剔除掉图像中由于光照、表隋、姿势等噪声影响所对应的高
频信息,来重构图像,并以之作为一类人的一个模板图像来进行识别。也就是说,首先对奇
异值从大到小,进行排列,然后取前m(m
3 结束语
上述内容主要介绍了几种矩阵的分解原理及其在人脸识别中的基本应用。罗列出矩阵分
解的定义、性质以及定理等。矩阵理论是数学的一个重要的分枝,而且已成为现代各科技领
域处理大量有线维空间形式与数量关系的强有力的工具。特别是在计算机的广泛应用,为矩
阵论的应用开辟了广阔的前景。虽然人类能轻松地识别出人脸,但人脸的自动机器识别却是
一个难度极大的课题,它涉及到图像处理、模式识别、计算机视觉和神经网络等学科,也和对
人脑的认识程度紧密相关。机器在基于矩阵分解原理下对人脸图像进行分析 ,提取有效的识
别信息从而达到身份辨认的目的。我们知道矩阵分解在人脸识别中应用广泛,本文通过对不
同的算法实现人脸识别的方法做了总结和比较,使读者可以对其有简单的了解。
参考文献:
[1]程云鹏,张凯院,徐仲.矩阵论[M].西安:西北工业大学出版社,1989.
[2]李新,何传江.矩阵理论及其应用[M].重庆:重庆大学出版社,2005:130-145.
[3]徐泰燕,郝玉龙.非负矩阵分解及其应用现状分析[J].武汉工业学院学报,2010(1):110—115.
[4] 杨 静 宇 , 郑 宇 杰 . 基 于 QR 分 解 的 鉴 别 维 数 压 缩 及 其 在 人 脸 识 别 中 的 应 用 [J]. 智 能 系 统 学
报,2007(12):49-53.
[5]何婧,冯国灿. 奇异值分解在人脸识别中的应用[J]. 广东教育学院学报,2006(6):93-96.