第
46
卷 第
期
4
Vol. 46
No. 4
河 南 科 技 学 院 学 报
(
自 然 科 学 版
)
Journal of Henan Institute of Science and Technology
(
Natural Science Edition
)
2018
年
月
8
Aug. 2018
doi:10.3969/j.issn.1008-7516.2018.04.010
基于深度卷积神经网络的图像分类算法
陈瑞瑞
(郑州工业应用技术学院 信息工程学院
河南 郑州
,
)
451100
引入了基于深度卷积神经网络的人脸图像识别算法
,
摘要:针对传统的图像分类算法忽略图像多个对象之间的关系
,
征表达之间的障碍等不足
的卷积神经网络分别从内部结构和网络框架上进行优化和改进
出图像高层语义特征
有效性和鲁棒性
关键词:深度学习;卷积神经网络;图像分类
文献标志码:
中图分类号:
A
继而提高图像分类的精确度
实验表明
TP391.4
,
.
,
.
同时存在人类感知高层语义信息和底层图像特
对经典
通过增加网络结构深度和优化训练模型提取
改进后的深度卷积神经网络分类算法具有良好的
该算法借助于深度学习
.
,
,
文章编号:
1008- 7516
2018
04- 0056- 05
(
)
Image classification algorithm based on deep convolutional neural
(
College of Information Engineering,Zhengzhou University of Industrial Technology,Zhengzhou
network
CHEN Ruirui
451100,China
)
Abstract:The traditional image classification algorithm ignores the relationship between multiple objects in the
image,at the same time,there is an obstacle between human perception of high -level semantic information and
underlying image feature expression.An image recognition algorithm based on deep convolutional neural network was
proposed,the algorithm uses deep learning to optimize and improve the classic convolutional neural network from the
internal structure and network framework respectively,by increasing the network structure depth and optimizing the
training model,the high-level semantic features of the image were extracted,which in turn improves the accuracy of
image classification.Experiments showed that
image classification algorithm based on deep convolutional neural
network had better classification effect.
Key words:deep learning
;
convolutional neural network
;
image classification
传统的图像分类算法过于依赖人的经验
将图像某种特征属性归类到预先设定的类别中是图像分类的主要依据
图像分类涉及到特征提取
但由于图像信息具有不可描述性和复杂
与分类算法两大块[1].
导致了传统算法的局限性[2].
以及人类感知的高层语义信息与图像的底层表达特征之间存在巨大落差
性
,
,
通过有监督学习
以卷积神经网络算法为核心的深度学习
合理地改变网络深度完成特征学习
继而更加精确地对图像进
行分类识别
.
1 深度卷积神经网络
不需要依赖人工经验进行手动设计特征提取
从而得到更加全面直接的图像类别信息
,
,
,
,
,
,
依靠人工经验提取样本的特征数据是浅层模型的思想所在
因此特征数据的提取决定了整个图像
,
2018-04-23
收稿日期:
基金项目:河南省科技攻关计划项目(
作者简介:陈瑞瑞(
1985—
)
女
,
河南新郑人
,
)
162102210119
讲师
.
硕士
,
,
主要从事计算机应用技术研究
.
56
陈瑞瑞
:
基于深度卷积神经网络的图像分类算法
第
4
期
,
这些算法为了对浅层模型进行研究
,
分类算法的复杂度和精确度[3].
等
入层和输出层之间只含有较低的模型层数
大
1.1 深度学习
具有不可扩展性[4].
,
比较典型的浅层机器学习有最大熵法
随机森林(
、
需要不断地人工对样本数据进行反复摸索
逻辑回归
、
)
、Boosting
同时由于浅层学习输
研究进度受人的主观因素影响
RF
,
不能很好地解决非线性问题
,
,
把浅层学习得到的底层特征进行更深层次的抽取
.
深度学习为了精确地表示数据特征
的不同
学习进行预训练
,
模型能够很好地通过底层特征来表达高层语义[5].
以第一层输入数据作为输入
,
,
,
进而得到高层特征是深度学习和浅层学习最大
利用其强大的无监督学习能力对大量无标签样本数据集中
这种
训练完成后的输出作为下一层的输入进行逐层训练
,
浅层学习模型和深层学习模型如图
所示
.
1
a
含有单个隐层的浅层学习模型
含有多个隐层的深度学习模型
图 1 浅层学习模型和深层学习模型
b
含有多个隐藏层和逐层对模型参数进行初始化是深度学习的两个最主要的特征[6].
Fig. 1 Shallow learning model and deep learning model
一方面
深度学
需要利用含有多个模型层数通过对浅层学习的底层特征进行组
深度学习可以利用较少的参数表达浅层网络需要大量参
深 度 学 习 可 以 通 过 多 层 简 单 结 构
计算量大
,
在训练样本不足的情况下深度网络拟合性不够;对样本数据训
深度学习同样具有需要改进的地方:由于含有多个隐层
log(cos(exp(sin ( ))))
x
,
,
,
,
3
进而得到更加抽象的高层特征;另一方面
如 传 统 复 杂 函 数
,
,
习为了发现特征数据的属性以及分布
合
数 表 达 的 复 杂函 数 [7].
sin( ),
过于依赖计算机硬件;需要大数据支撑
练时间过长等[8].
1.2 卷积神经网络
,cos( ),log( )
x
进行表示
,
x x e
x
.
3
x
,
卷积神经网络由卷积层和池化层交替叠加构成[9].
图构成了卷积层;对每个特征图进行尺度缩小即对特征图进行下采样就是池化 [10].
(
CNN
)如图
所示
2
.
由上层特征图和卷积核通过卷积运算得到的特征
卷积神经网络模型
图 2 卷积神经网络模型
Fig. 2 Convolutional neural network model
57
年
2018
中
图
,S1、S2
每个池化层前面都连接一个卷积层
为两个卷积层
,C1、C2
2
最终输出层(
.
征图
征数据进行下采样
则为图像分类结果
.
.
卷积层(
样本的特征像素值为
convolutions
,
示
为
和
式(
)中:变量
1
r
c
长度和宽度则由
{
(
=
k
,
当卷积核卷积输入特征图
piX -
( )l
jb
,
池化层(
表示
kx、ky
( 1)
l
(
pooling
后特征像素的数学公式表示为
)中特征图的像素值通过对前一层卷积的特征图下采样得到
)中的每个特征值由当前层卷积核和前一层特征图进行卷积得到
为当前特征像素的纵像素和横像素;第
=
y
pj
l
.
,
,
,
)
)
k
l
j
X
(
u
v
+
,
p
(
,
+
, f
<
k
u
v
)
∈
l M
2
N
(
u v
∈
)
k
f
(
b
( )
l
j
和
第
}
W
ij
;0x
( 1)
l
pi
0
Label
output
);第
个训练
+
,
c u r
层卷积核
u v
时
( )l
ijW
层第
自 然 科 学 版
的步长则由
)连接分类器
(
)
1
表
∑ ∑
概率最大对应的
河 南 科 技 学 院 学 报
个特征图的偏置则
输出不同类型分类的概率
l
∈
<
v
为当前层的激活函数
为两个池化层
黑白交替的方框则代表提取到的类型各异的特
卷积层通过对上一层输出图像进行卷积滤波;池化层则对特
( )
)l
l
1l
在充分考虑图像的统计特性和网络结构的基础上
多个卷积的组合构成了卷积层的单元输出结果
完整的卷
深度卷积神经
为了得到图像卷积特
则需要
全连接层以及分类层构成
、
则卷积层的训练和下采样层的训练
是一个多层神经网络[11].
,
在特征提取层
.
是一个多层神经网络通过监督学习调节网络参数
y
为输入映射进行卷积操作
因为下采样层紧跟在卷积层的后面
个训练样本池化
通过
,
用数
(
+
,
c u r
=
)
{
(
i
(
)
2
(
)
3
.
则为
因此
∑
∑
( )l
yS
( )l
xS
( 1)
pi
v
}
,Mj
S
第
s
( )
l
x
y
l
pj
与
s
( )
l
y
k
l
ij
⊗
;0
(
S
)
∈
(
u v
∈
)
S
b
l
j
.
+
v
∈
i M
x
j
l
x
i
( )
l
=
x
y
=
f
<
<
.
,
p
,u
v
+
)
x
.
,
.
,
,
,
.
,
然后将
具体的数学表示为:为了得到卷积神经网
,
式(
)中:第
2
l
层的下采样窗口为 与
0
u
为当前池化窗口的横向特征像素和纵向特征像素
N
S
j
,
,
2
c
,r
与
池化窗口的步长
2 基于深度卷积神经网络的图像分类
2.1 深度卷积神经网络训练
卷积神经网络是典型的深度学习框架
积神经网络由卷积层
下采样层
、
网络训练主要有两大部分组成
征
对下采样层进行训练[12].
,
,
卷积核对前一层得到的数据进行卷积处理
,
减少了链接数目和参数数量
局部链接
学公式表示为
权值共享
、
,
对图像进行多个卷积核的卷积运算是卷积层训练的主要目的;而为了得到稳定的空间结构
层的神经元
为了得到第
层的神经元的激活函数 分别与权值函数和梯度值相乘
.
需要首先得到
的神经元
l+1
l
,
,
l
ia
第
络的神经元
l
d
第一步需要对下采样层实施上采样
,
(
b
=
d
+
1
’
继而直接利用通过上采样的下采样层 来表示
,
)
⊗
)
)
d
,
l
j
l
j
z
+
1
(
d
up
(
f
)l
z
j
层的第个神经元和
.
l
j
l
j
(
l
l
f
ia
=
为第
l
jz
,
式(
)中: 为采样因子
5
、
式(
)
4
b
上采样层的下采样操作
对卷积层进行训练
.
,
容易出现过拟合现象
.
减少计算复杂度增加系统稳定性的目的
,
防止过拟合
下采样层的训练为
.
为下采样层的上采样操作
,up
,down
最大池化下采样层通过计算图像区域特征的最大值
(
)
4
(
)
5
为
达到
,
58
-
-
-
-
陈瑞瑞
:
基于深度卷积神经网络的图像分类算法
第
4
期
另一方面
也可以通过对第
,
l
(
l
j
f
l
j
x
b
=
(
down x
)
+
层的神经元的激活函数 与
l
ia
(
d
conv
⊗
(
)
=
d
z
l
j
f
1
’
l
j
)
b
.
d +
)
+
1
1l
j
.
l
j
l
j
l
j
进行卷积计算
得到下采样层
,
(
)
6
(
)
7
2.2 深度卷积神经网络模型
深度学习的模型可以分为混合型结构
ZF- Net、VGG、AlexNet
采用的数据集不同所对应的深度卷积网络模型亦不同
过拟合主要是由数据集的缺乏引起的
、
本文采用
人脸数据库
该数据库包含
,
生成性深度结构以及区分性深度结构[13].
、
和
GoogLeNet
它们的网络构成
等
,
当前顶级的深度卷
参数量和分类错误率如表
、
网络的复杂度主要取决于数据的复
但如果数据集过多则可能导致训练过程中
微
、
包括表情变化
张照片
每人
人
40
10
,
,
,
,
积神经网络模型有
同时
,
模型泛化性弱
所示
1
.
杂度[14].
模型难以拟合
小姿态变化
因此
.
、20%
,
ORL
以内的尺度变化
.
表 1 顶级深度神经网络的网络构成、参数量以及分类错误率
Tab. 1 Network composition,parameter amount and classification error rate of top deep neural networks
模型
AlexNet
VGG
ZF- Net
8
19
8
构成
层(
层(
层(
层(
5conv+3fc
)
)
16conv+3fc
)
)
5co nv+3fc
参数量
~60M
~144M
~60M
错误率
Top- 1
/%
Top- 5
错误率
/%
40.2
24.6
37.3
15.3
7.3
16.0
7.6
还需要考虑训练截止条件
,
验证周
、
GoogLeNet
12.5
模型参数的选择在选择好数据库以及网络深度的基础上
19conv+3fc
~68M
22
另外
批量大小
、
,
期
2.3 深度卷积神经网络框架优化和改进
权值衰减等参数
、
,
只有这样才能得到合适的深度卷积神经网络模型
.
在抽取高层语义信息的同时保持数据的旋转和平移不变性[15].
深度卷积神经网络能够有效处理信息
,
卷积层和下采样层的参数都
效应
”
过拟合问题:
依
运算量大
而且网络层数越多
“
距离越远的网络参数对图像分类的梯度因子影响力越弱;
②
导致过拟合;
③
但它仍然有需要优化和改进的地方:
①
在不断变化
,
越大
,
由于深层卷积网络自身参数多
,
赖电脑硬件的处理能力
进而使各层的参数受上一层参数的影响也在不断变化
在对深度卷积神经网络进行训练时
,
进而数据集过少
,
即伴随网络深度的加大
且网络层数越多
参数越多
,
梯度弥散
,
,
,
,
深度卷积神经网络框架的优化和改进方法主要有局部感知
.
提取图像特征后的像素大小为
权值共享
、
下采样;防止过拟合的方法
、
主要的
100*100,
主要有数据扩展
优化改进方法为:
、Dropout
本文采用
等
.
ORL
人脸数据库
,
(
)数据扩展防止过拟合现象发生
1
,
对特征图像进行上下左右翻转
,
则化
倍;在不改变图像特征的前提下
梯度弥散
对特征图像进行伸缩变换和对比度变换;
,
和各网络层的分布不均匀
”
(
)防止所谓的
2
“
把每层输出进行规范化
,
(
)对有网络层次聚类的目标区域进行预筛选
进一步降低计算复杂度
,
3
批次规则化算法步骤如下:
(
)单批次输入图像结构特征:
B
1
使其为同一分布;
学习参数: 为采样因子
{
=
x
1
}
b
x
m
,
,
,
使扩展后的图像数量是原有的
4
通过在每层输出后添加规范层
引入批次规
,
减少系统反应时间
,
.
与
c
, r
为当前池化窗口的
横向特征像素和纵向特征像素;
}
( )
;
xb
i
{
)输出:
(
y
2
i
(
)对均值进行批次化处理:
3
BN
=
r
,
)对方差进行批次化处理:
(
s
4
←
2
B
m ← ∑
B
1
m
1
m
;
m
1
ix
-∑
(
x
i
m
1
;
2
m
)
B
59
-
年
2018
河 南 科 技 学 院 学 报
自 然 科 学 版
(
)
∧
)对图像特征进行规范化:
(
x
5
-←
x
i
s
)最终对输出效果进行缩放平移:
(
y
6
i
i
B
;
m
+
b∧← +
e
g
x
i
2
B
≡
( )
xb
.
i
BN
r
,
3 结果与分析
搭建实验硬件平台:高性能计算机
NVIDIA TITAN- XGPU
行在线编程
.
采用
ORL
内的尺度变化
测试数据集包含
分别和单尺度
.
人脸数据库
,
为防止过拟合
,
幅图像
1 600
.
;采用的深度学习框架为
台
1
,32 GB
内存
为
网络框架
,CPU
酷睿处理器
主频为
i7
该框架具有编译接口
,
Caffe
,
4.0 GHz,GPU
可以通过
C++
,
为
进
该数据库包含
人
每人
40
,
对特征图像进行上下左右翻转
为了验证算法的有效性
10
,
张照片
包括表情变化
以
因此
,
将本文算法优化和改进后的深度卷积神经网络
使扩展后的图像数量是原有的
微小姿态变化
、
、20%
倍
4
,
,
,
多尺度卷积神经网络在测试集上进行验证对比
、
,
结果见表
2.
表 2 不同算法的测试集检测效果
Tab. 2 Different algorithms in the test set detection effect
检测器
单尺度卷积神经网络
多尺度卷积神经网络
优化和改进后的深度卷积神经网络
阈值
0
0.25
0.50
0
0.25
0.50
0
0.25
0.50
检测率
/%
错误率
/%
94.1
93.2
91.4
95.2
93.6
91.8
98.2
97.4
2.61
1.76
0.79
1.63
1.41
0.76
0.61
0.52
96.6
优化和改进后的深度卷积神经网络
0.41
通过不同算法在不同阈值数值下的检测率和错误率比较可知
,
对人脸的识别分类效果明显优于其他算法
,
4 小结
并具有一定的鲁棒性
.
,
本文通过深度学习
并结合经典的卷积神经网络卷积层和池化层的训练
梯度弥散
引入了数据扩展防止过拟合现象和批次规则化优化
“
优化和改进
,
神经网络具有良好的分类效果;另一方面
理有效地对特征数据进行组合以及对网络层次聚类的目标区域进行正确选择
,
”.
,
,
对深度卷积神经网络做出
实验结果证明了深度卷积
如何合
是下一步研究的重点
,
.
实验发现深度卷积神经网络仍存在需要改进的地方
参考文献:
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
,
卢宏涛
李岳云
李传朋
王海
刘智
王华利
彭天强
黄斌
张军
,
张勇
,
,
[10]
张秦川
,
.
许悦雷
,
,
秦品乐
,
,
深度卷积神经网络的显著性检测
深度卷积神经网络在计算机视觉中的应用研究综述
马时平
,
张晋京
.
等
等
.
基于深度卷积神经网络的图像去噪研究
基于深度卷积神经网络的场景自适应道路分割算法
.
[J].
[J].
[J].
计算机工程
中国图象图形学报
构建多尺度深度卷积神经网络行为识别模型
.
[J].
光学精密工程
蔡英凤
,
黄江涛
,
贾允毅
,
冯欣
等
张见
,
基于深度卷积神经网络的快速图像分类算法
.
邹俊忠
,
,
栗芳
,
.
等
卢金金
,
深度卷积神经网络的汽车车型识别方法
张婷
深度卷积神经网络在车牌和人脸检测领域的应用研究
.
[J].
基于深度卷积神经网络和二进制哈希学习的图像检索方法
王建华
,
等
,
基于深度卷积神经网络的物体识别算法
.
杨正瓴
,
[D].
[J].
计算机应用
[J].
传感器与微系统
郑州:郑州大学
[J].
.
数据采集与处理
(
):
1
1- 17.
,2016,21
53- 59.
,2016,31
(
):
1
(
):
3
253- 260.
[J].
,2017,43
电子与信息学报
(
):
3
计算机工程与应用
电子与信息学报
,2017,25
,2017,39
263- 269.
(
):
2
799- 805.
):
(
13
(
):
8
,2017,53
181- 188.
,2016,38
2068- 2075.
(
):
,2016,36
12
(
3333- 3340.
):
19- 22.
,2016,35
11
,2015.
60
(下转第 67 页)
王统昊等
:
基于大数据的超市进销存效益分析系统设计
第
4
期
参考文献:
人工智能在决策支持系统和专家系统中的作用
.
[J].
电脑知识与技术
(
):
,2009,5
18
4897- 4903.
企业销售决策支持系统
大型超市进销存管理系统的设计与实现
万春红
计算机教育
图的精细设计
[D].
沈阳:沈阳工业大学
[D].
.E- R
[J].
,2005.
哈尔滨:哈尔滨工业大学
,2012.
(
):
8
,2015
济南:山东大学
78- 81.
企业进销存管理系统的设计与实现
.
施进发
陆长德
基于
,
.
GIS
,2011.
的产品生命周期评价数据库设计研究
[D].
信阳师范学院学报(自然科学版)
,2013,23
(
):
3
[J].
.
舒荟萃
李红
侯超
邵超
王跃飞
刘芳
.
,
,
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
467- 469.
温池洪
乔冉冉
朱伟峰
企业信息化的维度和决策方法
毕新华
,
.
数据垂直分布的隐私保护数据挖掘算法研究
.
源远超市进销存管理系统设计与实现
.
[D].
[J].
企业研究
(
):
,2005
51- 53.
南京:南京邮电大学
12
[D].
成都:电子科技大学
,2015.
,2012.
(责任编辑:卢奇)
(上接第 60 页)
许强
李伟
,
魏中浩
李松
,PIERRE L.
张冰尘
深度卷积神经网络在
等
,
,
,
.
[11]
[12]
深度卷积神经网络在迁移学习模式下的
SAR
自动目标识别领域的应用综述
目标识别
[J].
电讯技术
(
):
1
,2018
106- 112.
中国科学院大学学报
SAR
[J].
,2018,35
(
):
1
75- 83.
杨帆
杨帅
吴尧
李建平
,
,
张有芬
,
,
邱卫根
,
.
[13]
[14]
[15]
,
基于多任务深度卷积神经网络的显著性对象检测算法
.
等
李鑫
等
李玉惠
,
基于改进的深度卷积神经网络的人脸识别
基于深度卷积神经网络的车标分类
[J].
计算机工程与设计
.
[J].
工业仪表与自动化装置
计算机应用
(
):
,2018
1
(
):
,2017
5
(
):
8
2246- 2250.
75- 78.
,2017,38
[J].
91- 96.
(责任编辑:卢奇)
67