科技资讯
2010 NO.06
SCIENCE & TECHNOLOGY INFORMATION
高 新 技 术
司机疲劳驾驶检测中人脸图像的快速人眼定位
( 电子科技大学通信与信息工程学院 成都 6 1 1 7 3 1 )
张小欢 彭启琮
摘 要:在司机疲劳驾驶检测中,对人眼的高效,实时准确检测是关键步骤之一。本文研究了司机人脸图像中的人眼检测方法。首先,将
得到驾驶员面部图像隐射到YCbCr空间,建立基于肤色的二维高斯分布模型,通过滤波,标记分割出肤色并得到人脸的区域;然后,利用人
眼的分布特点及自身特性,通过两次定位的方法实现了对司机人脸的人眼定位。
关键词:司机疲劳驾驶 YCbCr 空间 肤色分割 人眼检测
中 图 分 类 号 : T N 1 4 1
文章编号:1672-3791(2010)02(c)-0002-02
文 献 标 识 码 : A
疲劳驾驶是造成交通事故的主要原因之
一[1]。由于长时间驾驶,或缺少睡眠等原因,司
机会出现疲劳或困倦状态。在疲劳驾驶检测
中,对人眼高效,实时准确检测是关键步骤之
一。检测方法主要有神经网络、模板匹配、统
计方法等[2]。本文在深入研究国内外各种驾驶
疲劳检侧方法的原理、关健技术和难点后,在
现有的基础上进行了以下方面的研究。(1)人
脸定位:利用肤色在YCbCr颜色空间中的聚
类特性,通过高斯拟合肤色,得到肤色区域,
然后通过滤波,标记最大连通图的方法选定
人脸区域。(2)人眼定位:分析各种快速且有效
人眼定位算法,通过两次定位的方法实现了
对人脸的单眼定位。为叙述方便,本文以图1
(a)为例讲解整套算法流程。
1 人脸定位
1 . 1 人脸下采样
下 采 样 降 低 输 入 图 像 像 素 , 以 保 证 系 统 的
fx y
实 时 性 , 设 输 入 图 像 为 (, )
, 大 小 为
m n·
,下采样如公式(1)所示
g xy
(,)(,
(1)
s 为 采 样 尺 度 , 以 为 9s = 尺 度 采 样 后 ,
=
f
)
x y
s s
原图与下采样图如图1(a),(b)所示。
1.2 YCbCr 肤色模型
肤 色 是 人 脸 最 为 显 著 特 征 之 一 , 对 于
彩色图像, 肤色是图像中相对集中、稳定区
域。肤色信息可将人脸和背景区域分开。研
究表明,在除去亮度的色度空间中,不同人
脸肤色分布具有聚类性[3],因此采用肤色分
割 图 像 是 可 行 的 。
1.2.1 色 彩 空 间 的 选 取
根 据 计 算 机 色 彩 理 论 , 目 前 应 用 最 广
的 色 彩 空 间 有 R G B 格 式 、H I S 格 式 和 Y C b C r
格 式 。
人 脸 定 位 这 个 模 块 计 算 量 偏 大 , 通 过
综 合 考 虑 R G B 格 式 、H I S 格 式 以 及
Y C b C r 格 式 色 彩 空 间 不 同 特 点 , 选 用
Y C b C r 色 彩 空 间 来 建 立 肤 色 模 型 , 原 因 在
于 通 过 大 量 肤 色 聚 类 实 验 [ 3 ]发 现 在 Y C b C r
色 彩 空 间 下, 肤 色 的 亮 度 分 量 Y 与 Cb,Cr相
对 无 关 , 通 过 对 C b C r 的 二 维 子 空 间 操 作 ,
可 以 得 到 实 用 的 肤 色 聚 类 模 型 , 以 此 判 断
像 素 点 是 否 为 肤 色 像 素。相 对 于 传 统 的 肤
色 模 型 , 此 方 法 能 适 合 各 种 不 同 的 肤 色 特
征 , 受 光 照 影 响 更 小,具 有 更 强 鲁 棒 性 。
1.2.2 肤 色 相 似 度 建 模
以 图 像 中 人 脸 眼 睛 以 下 嘴 唇 以 上 的 狭
长 块 作 为 人 脸 肤 色 统 计 区 域 , 在 这 些 区 域
中 人 工 选 取 人 脸 肤 色 像 素 点 作 为 训 练 样
本 , 通 过 算 法 训 练 出 C b , C r 在 高 斯 模 型 中
的分布中心 [4]。然后根据待检测图像中所考
察的像素点离该中心的远近来得到一个相
对 于 肤 色 的 相 似 度 , 就 可 以 得 到 一 个 原 图
的相似度分布图。在这个过程中, 在训练高
斯 分 布 中 心 时 需 要 确 定 C b , C r 的 均 值 M 和
(a) 输入原图 (b) 下采样图 (c) 相似度图
图 1
(a) 二值化图 (b) 降噪(滤波)后图 (c) 人脸连通图标记 (d) 人脸获取
图 2
(a) 人脸区域 (b)EyeMap 图 (c)EyeMap 滤波图 (d) 搜索人眼在人脸的位置 (e) 人眼
图 3
2
科技资讯 S C I E N C E & T E C H N O L O G Y I N F O R M A T I O N
高 新 技 术
方 差 C 。高 斯 分 布 的 数 学 表 达 示 为:
XCbCr=
,
M=E(x)[
]
T
E=E((x-M)(x-M) )
(2)
其中行x 表示CbCr空间中一个像素。本
文 通 过 对 图 像 的 肤 色 统 计 , 得 到 的 训 练 样
本 为 :
m=(112,144)
T
=
C
7643
43252
(3)
其 中 , m 是 均 值 , C 是 协 方 差。这 样 由 均
值 m 和 协 方 差 C , 采 用 二 维 正 态 联 合 分 布
率,可以对图像进行相似度模型的建立,如
公式(4):
=-
T
1
,
T
)
(4)
,)exp[0.5()()]
PCbCrx MCx M
xCbCr
(
=
(
其 中 x 表 示 图 像 C b C r 空 间 中 的 一 个 像
素 , C 和 M 为 预 先 求 得 的 肤 色 训 练 样 本 的 协
方 差 和 均 值。在 得 到 被 检 测 图 像 中 的 像 素
点 的 C b , C r 值 后 , 就 可 以 得 到 该 像 素 点 为
皮 肤 点 的 概 率 , 得 到 一 个 相 对 与 肤 色 的 相
似度分布图,实验结果如图1(b)(c)所示。图
1(c)中颜色越接近自色的区域为肤色区域
的 可 能 性 就 越 大 。
1 . 3 图像二值化选择
为 了 得 到 更 精 确 的 肤 色 区 域 , 还 要 进
行二值化处理,以提取肤色区域,这一步的
关键是阀值选取。为得到最佳阀值, 本文采
用了区域增长算法[5]的自适应阀值处理,每
次 分 割 中 使 用 的 都 是 最 优 阀 值。区 域 增 长
的自适应阀值是根据逐步计算的结果得到
的 , 递 进 地 使 阀 值 减 小 可 以 看 到 分 割 区 域
的 增 大。但 每 次 增 长 的 变 化 量 是 逐 渐 地 减
少 的 , 而 使 区 域 增 长 最 小 的 阀 值 即 是 最 优
结 果 。
0.8
K =
具 体 实 现 步 骤 如 下 : 首 先 将 分 割 阀 值
起 始 值 设 为
, 通 过 这 个 值 将 图 像
进 行 二 值 化 , 得 到 一 个 二 值 图 像 , 然 后 再
以 0.05的步长减小K,再对相似度图进行二
值 处 理 , 并 计 算 出 相 邻 两 次 二 值 图 像 的 差
值 , 当 某 相 邻 两 次 二 值 图 像 的 差 值 最 小 时
所 得 到 的 阀 值 即 是 所 要 的 最 佳 阀 值。二 值
化效果如图2(a)所示。
1 . 4 降噪( 滤波)
考虑到图2(a)中 有 很 多 明 显 不 是 人 脸
区 域 的 噪 声 点 , 本 文 通 过 一 种 简 单 方 法 降
fx y 中 ,肤 色 点 为 1, 其余
噪。在 二 值 化 图 (, )
fx y 中 每 一 点 为 中 心 的 5 5·
点 为 0 , 统 计 (, )
区 域 中 肤 色 像 素 个 数 , 记 为 f_num , 通 过 如
下 公 式 计 算 :
=
fnumf i j
_(, )
4
4
=
j
0
i
0
=
当 _13
(5)
fnum > 时 , 该 点 保 留 为 肤 色 点 ,
否则视为噪声点去除,实验结果如图2(b)所
示 。
1 . 5 人脸区域标记
疲 劳 驾 驶 检 测 中 , 人 脸 区 域 应 为 图 片
肤 色 最 大 区 域。本 文 通 过 经 典 深 度 优 先 搜
索算法DFS(Depth-First Traversal) [6]进行
人脸区域标记。给定图G 的初态是所有顶点
均未访问过,在G中任选一个顶点vi为出发
点, 其 DFS 定 义 如 下: 首 先 , 访 问 出 发 点vi,
并将其标记为已访问;然后,依次从vi出发
搜索vi的每一个邻接点vj,若vj未访问过,
则以vj为新的出发点继续搜索。显然,这种
搜 索 法 是 递 归 的 , 其 特 点 是 尽 可 能 对 纵 深
方向搜索, 故称为深度优先搜索。标记后图
与人脸区域的选择如图2(c)(d)所示。
2 人眼定位
定 位 人 眼 采 取 由 粗 到 精 的 定 位 方 法 ,
即 先 定 位 人 眼 大 概 区 域 , 然 后 缩 小 范 围 精
确定位人眼。需要特别指出的是, 因为计算
量相对较小,我们还是采用图1(a)的原输入
图像做为处理图像。另 外, 考虑到眨眼是双
眼 同 时 闭 合 张 开 , 因 此 只 需 要 检 测 一 只 眼
睛。这样即缩小了检测面积, 提高了处理速
度 ; 又 可 以 解 决 驾 驶 时 头 部 倾 斜 而 引 起 眼
睛 位 于 不 同 水 平 面 的 问 题 ; 还 可 以 解 决 司
机 驾 驶 时 头 部 偏 转 , 一 只 眼 睛 在 侧 面 被 挡
住 的 难 题 。
2 . 1 眼睛粗略定位
准 确 定 位 人 脸 后 , 根 据 面 部 器 官 分 布 ,
人 眼 在 脸 部 的 上 半 部 , 可 以 很 简 单 的 确 定
一个大概区域,这个区域不要求很准确,只
要包含人眼即可。在这个区域内, 除了双眼
和 眉 毛 , 可 能 含 有 小 部 分 头 发 。
观 察 人 脸 图 片 , 发 现 眼 部 在 水 平 方 向
经过皮肤,左眼眼白,左眼瞳孔,左眼眼白,
皮 肤 , 右 眼 眼 白 , 右 眼 瞳 孔 , 右 眼 眼 白 , 皮
肤, 灰度变化较大。在灰度变化突变处进行
微 分 , 将 产 生 高 值 , 将 其 绝 对 值 累 加 , 则 灰
度变化越大的那一行, 累积值越大。在数学
上 可 用 灰 度 的 导 数 来 表 示 变 化 , 而 在 数 字
图 像 中 应 用 差 分 代 替 导 数 运 算。计 算 公 式
如 下 :
D=-
fxyfxyfx
(,)(,)(1,
)
y
h
x
=
2
Dfx y
h
|(,) |
h
x
1
(6)
2010 NO.06
SCIENCE & TECHNOLOGY INFORMATION
科技资讯
以去掉非眼部特征的干扰。实验结果如图3
(b)(c)所示。
得到如图3(c)的 EyeMap 滤波图后,结
合人眼粗定位结果,从左到右搜索,按比例
定 义 相 对 于 人 脸 区 域 一 定 大 小 的 框 , 当 框
进的 EyeMap 滤波图的值的和最大时,即为
人 眼 。
3 实验结果
在 C P U 为 T U R I O N T L 5 8 , 内 存 为 1 G 的
计算机上进行了验证。测试样本是200张输
入 为 640X480 的 含 人 脸 图 片。实 验 表 明, 该
算 法 具 有 较 快 的 速 度 和 准 确 率 , 一 副 图 像
的 处 理 速 度 平 均 仅 为 4 9 m s , 正 确 检 测 率 为
9 8 . 5 % 。
4 结语
人 眼 定 位 是 构 建 疲 劳 驾 驶 检 测 系 统 的
前 提 条 件 , 本 文 在 传 统 人 脸 识 别 Y C b C r 模
型基础上,进行了两次人眼定位,使得眼睛
定 位 的 计 算 速 度 大 幅 提 升 , 并 且 提 高 了 定
位的精度。实验表明, 该方法有较高的准确
率 , 可 以 应 用 实 际 。
参考文献
[1] 公 安 部 通 报 2 0 0 8年 全 国 道 路 交 通 安 全
情况[EB/OL].http://news.xinhuanet.
c o m .
[2] 唐琎,许海柱,王力炳.图像中人眼检测
技术综述[J].计算机应用研究,2008,25
(4):961~965.
[3] R.L.Hsu, M.Abdel-Mottaleb, A.K.
Jain. Face Detection in Color Images
[J]. IEEE Transactions on PAMI,2002,
24(5):696~706.
[4] 唐 立 峰 , 何 东 健 . 基 于 肤 色 分 割 的 人 脸
检测算法研究[J].计算机工程与设计,
2009,30(19):4461~4464.
[5] 王英,关宇东,李艳.一种融合区域生长
和边缘检测的彩色图像分割方法[J].计
算机应用,2008,26(16):85~87.
fx y 为得到的人脸区域的灰度图像,
(,
)
[6] 吴 伟 明 , 严 蔚 敏 . 数 据 结 构 ( C 语 言 版 )
它 与 R G B 色 彩 空 间 的 转 换 公 式 为 :
=·+·+
B
G
fR
0.2990.5870.114
(7)
通 过 大 量 实 验 发 现 , 在 眼 睛 处 导 数 变
化 值 和 的 绝 对 值 最 大 , 通 过 此 方 法 可 粗 略
判 断 人 眼 所 在 线 的 位 置 。
2 . 2 人眼精确定位
[M].北京:清华大学出版社,2009.
通 过 观 察 发 现 眼 睛 周 围 C b 值 较 高 , 而
Cr值较低,因此由以下公式[3]计算得到特征
图 , 以 突 出 眼 部 特 征 。
+
°2
EyeMapCbCrCbCr
{()()
(8)
2
/)}
(
1
=+
3
2
/
)
)Cb
(
其 中 EyeMap 是 眼 睛 特 征 图 ,
,
° 2
CbCr 都归一化到[0,255]之间, °Cr
)Cr , (
(
是由 Cr 求反得到 (255
。在得到EyeMap
图 后 , 设 定 阀 值 T , 将 EyeMap 图 小 于 阀 值 T
的值设为0,这一步可视为一个简单的滤波
)Cr
科技资讯 S C I E N C E & T E C H N O L O G Y I N F O R M A T I O N
3
Ł
ł
-
-
-
-
D
·
-