200
2007, 43( 34)
Computer Engineering and Applications 计算机工程与应用
基于 2DPCA 和 RBF 神经网络的人脸识别方法
白雪飞, 李 茹
BAI Xue- fei, LI Ru
山西大学 计算机与信息技术学院, 太原 030006
计算智能与中文信息处理省部共建教育部重点实验室, 太原 030006
School of Computer & Information Technology, Shanxi University, Taiyuan 030006, China
Key Laboratory of Ministry of Education for Computation Intelligence and Chinese Information Processing, Taiyuan 030006, China
E- mail: baixuefei@sxu.edu.cn
BAI Xue - fei, LI Ru .Face r ecognition method based on 2DPCA and RBF neutr al networ k.Computer Engineer ing and
Applications, 2007, 43( 34) : 200- 203.
Abstr act: A new approach for human face recognition based on 2DPCA and RBF neutral network is proposed.This method is
the combined method based on 2DPCA and
tested on the standard ORL face database.Experimental results demonstrate that
RBFNN can achieve a better performance in recognition accuracy than other method and this method cost
less computational
time.
Key wor ds:
two- dimensional principal component analysis; RBF neutral network; face recognition
摘 要: 采用 2DPCA 方法提取人脸图像的特征值, 通过 RBF 神经网络进行训练和识别, 提出一种基于 2DPCA 和 RBF 神经网络的
人脸识别方法, 并将此方法应用于 ORL 人脸库。实验结果表明, 该方法不仅具有较好的人脸图像识别能力, 而且能明显缩短识别
算法的运行时间。
关键词: 二维主成分分析; RBF 神经网络; 人脸识别
文章编号: 1002- 8331( 2007) 34- 0200- 04 文献标识码: A 中图分类号: TP391.41
20 世 纪 90 年 代 以 来 , 基 于 统 计 分 析 的 人 脸 识 别 方 法 [1]逐
渐 成 为 人 脸 识 别 的 主 流 方 法, 其 中, 特 征 脸 法 是 一 种 较 为 经 典
的统计人脸识别方法, 该方法基本思想是将二维人脸图像按行
或列向量转化为高维矢量, 然后采用主成分分析将高维人脸空
计算时间。综合以上特点, 2DPCA 在 图 像 处 理 领 域 备 受 关 注,
并 且 已 经 很 好 地 应 用 于 人 脸 识 别 等 图 像 领 域 。 基 于 ORL 与
Yale 人 脸 数 据 库 的 实 验 结 果 表 明 , 2DPCA 算 法 用 于 人 脸 识 别
的正确识 别 率 比 PCA 高 、特 征 提 取 比 PCA 算 法 更 有 效 且 速 度
间中的数据通过一个变换矩阵映射到低维的特征空间中, 从而
也更快[7]。
得到人脸图像的特征值。由于所选取的变换矩阵的每一列分别
对应于训练样本的协方差矩阵的一个特征矢量, 而人脸图像的
分辨率导致人脸空间的维数比较高, 因此求解训练样本的协方
在人脸识别的研究中, 神经网络技术得到了广泛地应用,
是一种优于非连接主义方法的较好的算法[3]。其中 RBF 神经网
络是一种性能优良的前馈型神经网络, 已经证明 RBF 网 络 可
差矩阵的计算量非常大。为了克服求解特征脸方法中存在的计
算量问 题 , 文 献[2]提 出 了 二 维 主 成 分 分 析 方 法, 有 效 地 解 决 了
传统 PCA 方法中的计算量问题, 并得到更高的识别率。
二维主成分分析( two- Dimension Principle Component An-
alysis, 2DPCA) 方法 是 近 几 年 来 发 展 起 来 的 一 种 新 方 法 。 它 是
在主成分分析的基础上提出的一种图像特征提取算法, 不需要
将图像矩阵变换为相同维数的行向量或列向量, 而是直接根据
原始图像矩阵构建图像总方差矩阵, 然后用该图像总方差矩阵
进行主成分分析。由于图像总方差矩阵的维数往往远小于原始
图像进行变化获得的矩阵, 故 2DPCA 方法比 PCA 方 法 更 节 省
以 逼 近 任 意 非 线 性 函 数, 且 具 有 全 局 逼 近 能 力, 从 根 本 上 解 决
了 BP 网 络 的 用 2DPCA 方 法 提 取 人 脸 图 像 的 特 征 向 量, 将 提
取到的特征向量作为 RBF 神经网络的输入进行神经网络 的 训
练, 从而得到人脸图像的类间判别信息, 最后进行人脸识别。实
验 证 明, 该 方 法 不 仅 具 有 良 好 的 识 别 能 力, 并 且 能 缩 短 算 法 的
运行时间。
本文第 1 章介绍 2DPCA 和 RBF 神经网络 的 基 本 原 理; 第
2 章提出基于 2DPCA 和 RBF 神经网络的人脸识 别 方 法; 第 3
章给出本文方法的一些实验结果; 第 4 章总结全文并介绍与本
文相关的一些工作。
基金项目: 山西省自然科学基金( the Natural Science Foundation of Shanxi Province of China under Grant No.2006011028。
作者简介: 白雪飞( 1980- ) , 女, 硕士研究生, 助教, 主要研究领域: 图形图像处理、模式识别; 李茹( 1963- ) , 女, 博士生, 教授, 主要研究方向: 人工智
能、计算机图形学与数据库技术。
白雪飞, 李 茹: 基于 2DPCA 和 RBF 神经网络的人脸识别方法
2007, 43( 34)
201
1 二维主成分分析和 RBF 神经网络
1.1
2DPCA 原理
主成分分析 PCA( Principal Component Analysis) 是一种 常
用 的 特 征 提 取 方 法, 它 依 据 特 征 值 的 大 小 选 择 特 征 向 量, 消 除
了特征向量间的相关性, 从一定意义上体现了特征向量中不同
维对识别结果贡献大小的不同。经典的主成分分析方法是基于
1 维向量, 在提取图像特征时都是将图像矩阵先转 换 成 一 维 图
像向量之后再进行 K- L 变换, 这样使得图像向 量 空 间 的 维 数
很 大, 并 且 如 果 训 练 样 本 太 少 的 话, 则 很 难 计 算 出 正 确 的 协 方
差矩阵[4, 5]。而 2DPCA 即二维主成分分析是直接针对二维图像
数 据 的 , 因 此 可 以 很 容 易 地 计 算 出 协 方 差 矩 阵, 同 时 由 于 维 数
小, 计算协方差矩阵的特征值及相应的特征向量所需的时间也
较少。
令 X 为 n 维单位列向量, A 为 m×n 大小的随机图像矩阵,
2DPCA 的 思 想 是 将 m×n 的 图 像 矩 阵 A 通 过 线 性 变 换 Y=AX
直接投影到 X 上, 得到一个 m 维列向量, 称之为图像 A 在 X
上的映射特征向量。
) , 其中, S
x
为了度量映射向量 X 的 判 别 力, 引 入 映 射 样 本 的 总 类 分
散度, 用映射特征向量的协方差矩阵的迹来描述。定义准则函
数: J( x) =tr( S
为训练样本的映射特征向量的协方差
x
矩阵, tr( S
的迹。假设共有 M 个训练样本, 将第 j 个样
x
本 记 作 m×n 维 矩 阵 A
( j=1, 2, …, M) , 将 所 有 样 本 的 均 值 记 作
j
E( A) , 其协方差矩阵 S
x
) 表示 S
x
定义为
S
x
= 1
M
M
j=1!( y
j
- E( y) )( y
j
- E( y) ) T=
1
M
M
j=1![( A
j
于是
- E( A) ) x][( A
j
- E( A) ) x]T
tr( S
x
) =xT 1
"
M
M
j=1![( A
j
- E( A) ) T( A
j
- E( A)
#) x
定义图像 A 的协方差矩阵 G
t
为:
( 1)
( 2)
( 3)
= 1
M
M
j=1!( A
j
- E( A) ) T( A
j
- E( A) )
G
t
G
t
又称为图像总方差矩阵, 从定义容易证明 G
是非负 的,
t
因此式 J( x) =tr( S
x
) 可改写为
J( x) =xTG
t
x
( 4)
opt
上式即为准则函数, 最大化上述准则的意义就是要找到最优映
射轴 x
, 使得将所有样本映射该方向后, 映射样本的总类分散
度最大。因此, 最优映射轴 x
是 G
t
对应最大特征值的向量。一般来说, 在样本类别数较多的
是最大化 J( x) 的单位向量, 也就
opt
情 况 下, 单 一 的 最 优 映 射 轴 是 不 够 的, 需 要 寻 找 一 组 满 足 标 准
正交条件且极大化准则函数的最优映射向量, 即选择映射轴向
的一个子集。通常, 最优映射向量组 x
的 d 个
1
最 大 特 征 值 所 对 应 的 标 准 正 交 的 特 征 向 量 。令 P=[x
1
x
d
定图像样本在最优映射矩阵上投影来获得图像的特征。
1.2 RBF 神经网络原理
, … ,
], P 称为最优映射矩阵。根据最优映射矩阵, 就可以通过将给
, …, x
d
t
, x
2
取 G
, x
2
由于神经网络具有大规模并行处理和分布式的信息存储、
良好的自适应性、自组织性、很强的学习功能等优点, 在图像处
理、模式识别及人工智能控制等领域得到了广泛地应用。尤其
是 BP 神 经 网 络 和 RBF 神 经 网 络 作 为 前 向 神 经 网 络 中 的 核 心
部分已成为整个神经网络体系中最常见的网络结构。相比较而
言, RBF 神经网络在训练速度、逼近能力等方面则更具优势[6]。
RBF 神经网络结构简单、学习收敛速度快、分类能力强、能够逼
近任意非线性函数, 且 RBF 神经网络不存在局部最优问题, 因
此 本 文 选 取 RBF 神 经 网 络 结 合 2DPCA 方 法 进 行 人 脸 图 像 的
识别。
RBF 神经网络是一种典型的三层前馈网络, 由输入层、隐
层 和 输 出 层 组 成, 其 中 输 入 层 节 点 传 递 输 入 信 号 到 隐 层 , 输 出
层作用函数通常为简单的线性函数, 而隐层作用函数一般采用
高斯函数:
( x) =exp( - ‖x- c
R
i
2!
2
i
2
i ‖
)
i=1, 2, …, m
高斯函数中 x 是 n 维输入向量; c
是第 i 个基函数的中心,
i
与 x 具有相同维数的向量, !i
函数围绕中心点的宽度; m 是感知单元的个数, ‖x- c
量 x- c
的范数, 表示 x 与 c
之间的距 离 。 输 出 层 实 现 从 R
是第 i 个 感 知 的 变 量, 决 定 了 基
i ‖是 向
( x)
i
i
i
到 y
k
的线性映射, 即
m
y
i
=
i=1!w
ik
R
( x) , k=1, 2, …, p, p 为输出节点数
i
对于基于特征的人脸图像的识别问题, RBF 网络输入层的
节点个数为提取到的图像特征向量的维数, 输出层的节点个数
即为待识别的人脸类别数。对于隐层节点, 实验中采用节点个
数可变的方法。实验开始时设置较多的隐层节点, 随着训练过
程的进行, 逐步修剪掉在网络训练中不起作用或作用较小的节
点。对于每一个神经元, 在训练过程中, 若其连接权值小于阈值
ε, 就 将 此 权 值 赋 零; 若 此 神 经 元 的 所 有 连 接 权 值 为 零, 则 从 网
络中删除此隐层节点。
2 基于 2DPCA 和 RBF 神经网络的人脸识别方法
2.1 人脸图像特征提取
利用最优映射向量提取图像特征, 对于一个给定的图像样
本 A, 令
k
y
k
=Ax
, k=1, 2, …, d
( 5)
所得到的一组映射特征向量称作图像样本 A 的主成分。2DP-
CA 的每个主成分是一个矢量, 利用获得的主成分可构成图像
样 本 A 的 特 征 矩 阵 B=[y
]=
1
AP。
2.2 RBF 神经网络分类
], 即 B=A[x
, … , y
, … , x
, y
, x
2
d
1
2
d
通过上一节的特征 提 取 过 程, 每 个 人 脸 图 像 A 对 应 一 个
特征矩阵 B=AP。对于待识别的人脸图像数据库, 利用 RBF 神
经 网 络 进 行 识 别, 识 别 过 程 分 为 两 个 阶 段, 即 神 经 网 络 结 构 的
训练和人脸图像的识别。
算法步骤:
( 1) 训练过程
①选 取 ORL 人 脸 图 像 库 中 200 幅 图 像 作 为 训 练 图 像 集 ,
其中每个人 5 幅图像, 共 40 个人;
②用式( 3) 计算训练集图像总方差 G
t
③用 式( 4) 计 算 与 前 d 个 最 大 特 征 值 对 应 的 特 征 向 量 , 并
;
由这 d 个特征向量构成子空间, 即映射矩阵;
④将 映 射 矩 阵 代 入 式( 5) , 来 计 算 训 练 集 中 每 张 人 脸 图 像
202
2007, 43( 34)
Computer Engineering and Applications 计算机工程与应用
的特征值, 得到人脸图像的类间判别信息;
⑤将 得 到 的 图 像 的 特 征 值 作 为 RBF 神 经 网 络 的 输 入 值 ,
进行神经网络的训练。
( 2) 识别过程
①选择 ORL 图像库中每个人的另 5 幅图像作为识别图像
集, 按训练过程中的步骤②③④计算识别图像集中每幅图像的
特征矩阵;
②将待识别的人脸图像的特征矩阵作为 RBF 神经网 络 的
输入, 进行图像的识别。
3 实验结果及分析
为验证算法的效果, 本文在 Matlab6.5 环境下实现算法, 并
在 CPU2.80 GHz、内存 256 MB 的微机上进行大量测试。实验采
用 ORL 标准人脸库, 此人脸库由 40 个人, 每人 10 幅分辨率为
112×92 的图像组成。这些人脸图像有些拍摄于不同时期, 具有
不同表情( 笑或不笑, 眼睛睁或闭等) 、不同姿势、不同旋转程度
( 不超过 20°) 、稍许遮掩( 如眼镜、胡子等) 以及不同光照。实验
中, 选 取 每 个 人 的 5 幅 图 像 作 为 训 练 样 本, 另 外 5 幅 图 像 作 为
测 试 样 本, 训 练 样 本 和 测 试 样 本 总 数 均 为 200 幅, 然 后 进 行 交
叉实验。图 1 是 ORL 人脸库中三个人的 5 幅图像。
分类器比常用的最近邻判别法在识别率上有较大的提高, 这是
由 于 神 经 网 络 优 越 的 自 适 应 性 、抗 噪 声 和 鲁 棒 性, 这 一 点 对 于
在 不 能 进 行 特 别 预 处 理 的 情 况 下 对 人 脸 图 像 进 行 识 别 而 获 得
较好的识别效果是很重要的。
由 于 人 脸 识 别 在 银 行 、安 检 、监 控 等 领 域 具 有 广 泛 的 应 用
前景, 识别算法的实时性就成为人脸识别系统实用化的需求。
算法处理的时间可分为两部分: 训练时间即人脸图像特征的提
取时间与给定样本的识别时间。PCA、2DPCA 都属于主成分线
性鉴别分析, 为了验证 2DPCA 在算法运行时间上的优越性, 表
1 对 PCA 和 2DPCA 在 ORL 人 脸 库 上 实 验 得 到 最 高 正 确 识 别
率时的特征提取时间( 单位: s) 、样本识别时间、正确识别率、误
识率、最佳特征维数进行了比较。
表 1 PCA、2DPCA 方法在 ORL 人脸库上实验结果比较
人脸库
方法
PCA
ORL
最佳特征
维数
90
最高正确
识别率/%
91.5
96.5
特征提取
样本识别
时间
18.20
5.09
时间
0.34
1.28
误识率/%
8.5
3.5
2DPCA
112×20
RBF 神 经 网 络 的 输 入 层 节 点 数 应 与 输 入 图 像 的 特 征 矩 阵
的 维 数 一 致, 若 实 验 中 取 k 个 投 影 轴, 则 人 脸 图 像 提 取 得 到 的
特 征 向 量 的 维 数 为 112×k, RBF 网 络 输 入 层 节 点 数 为 112×k,
而输出层节点数为人脸类别数 40。对应第 i 个人脸的输入特征
值, 训练时网络的期望输出为第 i 个输出节点为 1, 其余输出节
点均为 0, 而实际识别时神经网络的输出是围绕 期 望 值 上 下 浮
动的一个具体数值。实验中, 将输入样本的类别判定为 RBF 神
经网络的输出中具有最大值的输出节点所对应的类别。
识别率主要受训练样本数和特征维数的影响。实验选取每
个 人 的 5 幅 图 像 样 本 进 行 训 练, 另 外 5 幅 作 为 测 试 样 本, 并 在
此条件下搜索识别率最高时的特征维数。由于特征维数影响人
脸 的 正 确 识 别 率 , 实 验 中 探 讨 了 当 最 优 映 射 轴 发 生 变 化 时 ,
2DPCA 算法在 ORL 人脸库上正确识别率的变化情况。图 2 中
曲线上的点表示当特征维数 k 取不同值时的正确识别率, 从图
中可看出, RBF 神经网络识别时, 当 k≥10 时正确识别率达到
95%以上, 随着 k 的增加, 正确识别率逐步达到稳定, 最高可达
96.5%, 误 识 率 为 3.5%。 由 于 本 实 验 的 另 一 目 的 是 为 了 检 验
RBF 神经网络在人脸识别中的优越性, 图 2 还给出 RBF 神经
网络、BP 神经网络以及最近邻判别法在 ORL 人 脸 库 上 实 验 得
到的正确识别率。从图 2 中可以看出, 对于同样的人脸数据库,
当 特 征 维 数 k 相 同 时 , RBF 神 经 网 络 方 法 的 正 确 识 别 率 优 于
BP 神经网络方法, 而采用 BP 神经网络和 RBF 神经网络作为
表 1 中数据表明, 在 ORL 人脸数据库上实验, 2DPCA 方法
可以得到比 PCA 更高的正确识别率, 而在算法运行时间方面,
与经典 PCA 方法相比, 2DPCA 方法花费的时间明显偏少。对同
样 的 训 练 样 本 数 据, 2DPCA 方 法 特 征 提 取 速 度 是 PCA 方 法 的
3 倍以上, 整个识别过程 2DPCA 方法花费的时间不到 PCA 方
法的 1/3, 符合人脸识别系统实用性的要求。对 ORL 人脸库而
言 , PCA 方 法 得 到 最 优 识 别 率 时 所 提 取 的 特 征 维 数 为 90 维 ,
2DPCA 方法提取的特征维数为 2 240( 112×20) 维, 证明 2DPCA
算 法 可 以 在 不 降 低 人 脸 图 像 总 类 分 散 度 的 情 况 下 达 到 了 降 维
的效果。与经典的 PCA 算法相比, 2DPCA 算法有以下优点: 首
先, 2DPCA 算法以二维图像矩阵为分 析 对 象, 利 用 原 始 图 像 矩
阵 来 构 造 图 像 的 协 方 差 矩 阵, 因 此 在 人 脸 特 征 提 取 上 比 PCA
算法更直接有效。其次, 2DPCA 算法的正确识别率和识别速度
也优于 PCA 算法。此外, 实验中还发现, 当选择不同的训练 样
本和测试样本时, 2DPCA 算法的正确 识 别 率 有 较 明 显 的 差 别 。
因此如何选择训练样本和测试样本是值得进一步探讨的问题。
实验中 RBF 神经网络的可修改参数主要有基函数 中 心 值
c
i 、基函数的半径 !i
和 !i
采用无导师监督的 K 均值聚类方法学习, 权值 "i
则采用梯度下
降法。表 2 给出了对于不同学习系数和学习次数的识别结果。
表中的拒识率是指如果实验中 RBF 神经网络的输出节点 中 同
时存在多个最大值, 则认为网络拒绝识别该样本。由实验结果
可以看出: 实验中没有出现拒识现象, RBF 神经网络自学习能
力较强, 正确识别率高; 当网络的学习次数较小时, 增加学习次
数可以增强网络的学习能力, 提高正确识别率; 同样, 适当增加
, 以及输出单元的权值 "i 。实验中 c
i
白雪飞, 李 茹: 基于 2DPCA 和 RBF 神经网络的人脸识别方法
2007, 43( 34)
203
学习系数也可以提高正确识别率; 当学习系数和学习次数增 加
到一定数值时, 网络学习能力趋于饱和, 识别能力达到最高。
表 2 实验中采用不同学习系数和学习次数的识别结果
学习系数
学习次数
正确识别率/%
错识率/%
拒识率/%
0.25
0.25
0.50
0.50
0.90
0.90
1 000
5 000
5 000
10 000
10 000
50 000
87.0
89.5
91.5
93.5
95.0
96.5
13.0
10.5
8.5
6.5
5.0
3.5
0
0
0
0
0
0
4 结论
时较慢、先验参数较多且很多参数的确定只能凭经验而定等, 这
些也影响了算法运行的时间和识别率, 因此在这些方面仍需做
进一步地探索和实验。( 收稿日期: 2007 年 8 月)
参考文献:
[1] Turk M A, Pentland A P.Face recognition using eigenface[C]//Pro-
ceedings of Computer Vision and Pattern Recognition, 1991: 586-
591.
[2] Yang J, Zhang D, Frangia F.Two- dimensional PCA: a new approach
to appearance - based face representation and recognition [J].IEEE
Transactions
Intelligence,
2004, 26( 1) : 131- 137.
on Pattern Analysis
and Machine
本 文 提 出 一 种 基 于 2DPCA 和 RBF 神 经 网 络 的 人 脸 识 别
方法, 将 2DPCA 方法应用于人脸识别中, 在不降低人脸图像总
类分散度的情况下降维, 利用人脸图像直接构造图像总方差矩
阵, 并 在 此 基 础 上 提 取 人 脸 的 特 征 值, 避 免 了 高 维 人 脸 空 间 中
提取特征值时计算量大的问题, 很大程度上缩短了运算时间,
并结合 RBF 神经网络进行样本的训练与识别, 利用神经网 络
良好的自适应性和学习能力, 充分获取人脸图像的类间判别信
息, 得到了较好的识别效果。但训练样本和测试样本的选择以
及 RBF 神经网络本身存在的一些固有的缺陷, 如收敛速度 有
[3] Laurence S.Face recognition/detection by probabilistic decision- based
neural network[J].IEEE Trans NN, 1997( 8) : 98- 113.
[4] 王勇, 李建彬, 胡德文, 等.一种基于学习的视频字幕验证方法[J].中
国图象图形学报, 2006, 11( 11) : 1645- 1649.
[5] 陈伏兵, 陈秀宏, 高秀梅, 等.二维 主 成 分 分 析 的 推 广 及 其 在 人 脸 识
别中的应用[J].计算机应用, 2005, 25( 8) : 1767- 1770.
[6] 朱 树 先, 张 仁 杰.BP 和 RBF 神 经 网 络 在 人 脸 识 别 中 的 比 较[J].仪 器
仪表学报, 2007, 28( 2) : 375- 379.
[7] 何国辉, 甘俊英.二维主元分析在人脸识别中的应用研究[J], 计算机
工程与设计, 2006, 27( 24) : 4667- 4673.
( 上接 143 页)
[7] Girod L, Bychovskiy V, Elson J, et al.Locating tiny sensors in time
and space: a case study[C/OL]//Werner B.Proc of the 2002 IEEE
Int’l Conf on Computer Design: VLSI in Computers and Proces-
sors.Freiburg: IEEE Computer Society, 2002: 214 - 219.http: //lecs.cs.
ucla.edu/Publications/papers/iccd- 2002.pdf.
[8] Bulusu N, Heidemann J, Estrin D.GPS- less low cost outdoor local-
ization for very small devices[J].IEEE Personal Communications
Magazine, 2000, 7( 5) : 28- 34.
[9] Niculescu D, Nath B.DV based positioning in ad hoc networks[J].
Journal of Telecommunication Systems, 2003, 22( 1/4) : 267- 280.
[10] We T, Huang C, Blum B M, et al.Range- ree localization schemes
for large scale sensor networks[C]//Proceedings of the Ninth An-
nual International Conference on Mobile Computing and Network-
ing( MobiCom ZOOS) , San Diego, California, September 2003: 81- 95.
[11] Ahmed A A, Shi H, Shang Y.Sharp: a new approach to relative
localization in wireless sensor network[C]//25th IEEE International
Conference on Distributed Computing Systems Workshop, ICDC-
SW, 2005: 892- 898.
( 上接 149 页)
[10] Hsieh H Y, Sivakuma R.A hybrid network model
for cellular
wireless packet data networks[C]//Proceedings of IEEE Global
Telecommunications Conference, Taipei, 2002, 1: 961- 966.
[11] Douligeris C, Pereira I.An analytical hierarchy process approach
to the analysis of quality in telecommunication systems[C]//IEEE
GLOBECOM ’92, 1992, 3: 1684- 1688.
[12] 秦寿康.综合评价原理与应用[M].北京: 电子工业出版社, 2003.
[13] Gazis V, Alonistioti N, Merakos L.Toward a generic always best
connected capability in integrated WLAN/UMTS cellular mobile
networks( and beyond) [J].IEEE Wireless Communications, 2005, 12
( 3) : 20- 29.
[14] Balasubramaniam S, Indulska J.Vertical handover supporting per-
vasive computing in future wireless networks[J].Computer Commu-
nications, 2004, 27( 8) : 708- 719.
( 上接 176 页)
率, 与传统算法需要一个巨大的查询词库并依次提交查询词的
方 法 相 比 , 本 文 的 启 发 式 算 法 能 够 有 效 地 减 少 查 询 次 数, 提 高
Hidden Web 爬虫的抓取页面的效率。
( 收稿日期: 2007 年 8 月)
参考文献:
[1] Bergman M K.The deep Web: surfacing hidden value[EB/OL].http//
wwww.brightplanet.com.
ceedings of the 27th International Conference on Very Large Data
Bases.Italy: Rome, 2001: 129- 138.
[3] Barbosa L, Freire J.Siphoning hidden- Web data through keyword-
based interfaces[C]//SBBD, 2004.
[4] Ntoulas A, Zerfos P, Cho J.Downloading textual hidden Web content
through keyword queries[C]//JCDL, 2005: 100- 109.
[5] Wu Ping, Wen Ji- rong, Liu Huan, et al.Query selection techniques
for efficient structured Web source crawling[C]//The 22nd Interna-
tional Conference on Data Engineering ( ICDE 2006) , Atlanta, GA,
[2] Raghavan S, Garcia - Molina H.Crawling the hidden Web [C]//Pro-
April 3- 7, 2006.