学校代码:10406
分类号:TP389.1 学号: 130081203003
南昌航空大学
硕 士 学 位 论 文
(学术学位研究生)
深 度 神 经 网 络 的 研 究 及 其 在 植 物 叶 片
图 像 识 别 中 的 应 用
硕士研究生: 景辉芳
导 师: 杨词慧
申请学位级别:硕 士
学科、专业: 计算机应用技术
所在单位: 信息工程学院
答辩日期: 2016 年 6 月
授予学位单位:南昌航空大学
˝
•
‰
˚
A Study of Deep Neural Networks
with Application to Plant Leaves Image
Recognition
A Thesis
Submitted for the Degree of Master
On Computer Application Technology
by Huifang Jing
Under the Supervision of
Prof. Cihui Yang
School of Information Engineering
Nanchang Hangkong University, Nanchang, China
June, 2016
˝
•
‰
˚
摘要
植物在我们生活中无处不在,它对整个地球生态系统的保护有非常重要的意义,而
研究植物非常重要的一项内容就是精确分类。传统的识别方法需要人工对图片进行识别
和标注,主观性比较强,工作量极大,进而会导致标注的准确率大大降低。因此,如何
从植物叶片中自动提取图像特征并进行准确的分类已成为植物分类研究所需解决的问
题。近年来,深度学习的研究表明,深层神经网络可以直接从原始图片中提取抽象特征。
而且,像卷积神经网络本身还具备旋转和平移不变性,而这一特性在图像识别中显得尤
其重要。因此,本文重点研究如何将卷积神经网络应用于植物叶片图像识别上,并构建
一个全卷积神经网络模型。针对以往植物叶片识别方法识别率偏低的问题,本文提出的
具体研究内容如下:
(1)设计了一种全卷积深度神经网络的图像特征提取方法。首先对图片进行预处
理,包括图像切割、增强、旋转和透视等来减少一些计算量。然后,使用卷积神经网络
的算法自动提取图像特征。最后,用多层感知机来替换传统神经网络的线性滤波器,由
多层感知机组成的非线性卷积层把输入的局部数据通过非线性的激活函数进行映射,全
连接的网络非常容易过拟合,而非线性的卷积由于权值共享,本身就具备一定防止过拟
合的能力,这样得到的卷积神经网络能有效地从非线性可分的数据中抽象出所需的特
征。
(2)提出一种使用 PReLU 代替传统 ReLU 激活函数的深度神经网络方法。ReLU
(线性纠正函数)加快了训练过程的衔接,而且比传统的 S 形能更好地加速收敛。但在
植物叶片图像训练中会出现梯度弥散情况,所以本文使用 PReLU 的激活函数,它能够
自适应学习整流器的参数,并且提高准确率而可以忽略额外的计算成本。
(3)通过实验及实验结果最终验证了深度卷积神经网络在植物叶片图像识别问题
上是可行的。并且与其它一些神经网络算法相比较,本文改进的深度卷积神经网络在植
物叶片图像识别上的识别率更高。
关键词:图像处理,叶片识别,卷积神经网络,PReLU,深度学习
I
˝
•
‰
˚
Abstract
Plants are everywhere in our lives. They are the fundamental part of life on Earth. The
first step in botanical study is accurate classification of plants. However, current plant leaf
image classification still requires hand-crafted labeling, which is often very time consuming
and expensive to obtain, as they require the efforts and expertise of human annotators. Recent
advances in deep learning technique have made it possible to automatically extract high-level
features from raw sensory data without the help of features handcrafted by domain experts.
Therefore, this paper focuses on how convolution neural network on plant leaves image
recognition, and builds a full convolution network model. Concrete research content is as
follows.
Firstly, this paper presents a method for image feature extraction with full convolution
neural network. We first pre-process images, including image segmentation, enhancement,
rotation and perspective, so as to reduce the amount of computation. We extract features of
the images automatically by convolution neural network algorithm. Finally, we use the MLP
to replace traditional linear filters. Nonlinear convolution layer of a multilayer perceptron
composed of the local data input are mapped by a nonlinear activation function, fully
connected network is very easy to over-fitting rather than a linear convolution weights due
share itself with some ability to prevent over fitting. Thus we can effectively separable from
the nonlinear data.
This paper also presents PReLU replacing to ReLU depth instead of the traditional neural
network. ReLU(corrected linear function) speeds up the convergence of the training process,
which is better than traditional S-shaped in accelerating convergence. But training in plant
leaf images will appear in the case of diffusion gradient, so as used herein, activation function
PReLU, it can learn adaptive parameter rectifier, and improve the accuracy and negligible
extra computational cost.
Through experiments we finally verify the feasibility of the depth of convolutional
neural network image recognition in plant leaves of the problem. Comparing with other
existing neural network algorithm, we also analyze convolutional neural network performance
in real application problems.
Key words: Image process, Object recognition, Convolutional neural network, PReLU, Deep
learning
II
˝
•
‰
˚
南昌航空大学硕士学位论文 目录
目录
摘要 ........................................................................................................................... I
Abstract .................................................................................................................. II
目录 ........................................................................................................................ III
第 1 章 绪论 ............................................................................................................ 1
1.1 研究背景和意义 ....................................................................................... 1
1.2 国内外研究现状 ....................................................................................... 2
1.2.1 植物叶片图像识别领域现状 ............................................................ 2
1.2.2 深度学习在图像识别领域现状 ........................................................ 3
1.3 研究难点与本文主要工作 ....................................................................... 5
1.3.1 研究过程中的主要难点 .................................................................... 5
1.3.2 本文主要工作 .................................................................................... 7
第 2 章 卷积神经网络的结构及算法 .................................................................... 9
2.1 神经网络 ................................................................................................... 9
2.1.1 神经元 ................................................................................................ 9
2.1.2 神经网络 ........................................................................................... 11
2.1.3 反向传播算法 .................................................................................. 12
2.2 卷积神经网络 ......................................................................................... 14
2.2.1 稀疏连接 .......................................................................................... 14
2.2.2 权值共享 .......................................................................................... 14
2.3 卷积神经网络的训练方法 ..................................................................... 15
2.3.1 卷积层的训练 .................................................................................. 15
2.3.2 下采样层的训练 .............................................................................. 16
2.4 本章小结 ................................................................................................. 16
第 3 章 深度卷积神经网络的研究 ...................................................................... 17
3.1 深度卷积神经网络的训练问题 ............................................................. 17
3.1.1 梯度消失问题 .................................................................................. 17
3.1.2 ReLu 激活函数 ................................................................................. 18
3.1.3 Dropout .............................................................................................. 19
3.1.4 批量训练和在线训练的选择 .......................................................... 21
3.2 其他训练问题 ......................................................................................... 21
3.2.1 数据预处理与归一化 ...................................................................... 21
3.2.2 网络参数的初始化问题 .................................................................. 22
3.2.3 局部响应归一化 .............................................................................. 22
3.3 深度卷积神经网络模型 ......................................................................... 22
3.3.1 网络模型一 ...................................................................................... 22
3.3.2 网络模型二 ...................................................................................... 24
3.4 本章小结 ................................................................................................. 24
第 4 章 PReLU 代替传统 ReLU 的植物叶片识别方法 .................................... 25
4.1 植物叶片数据库介绍 ............................................................................. 25
4.2 图像预处理 ............................................................................................. 27
III
˝
•
‰
˚
南昌航空大学硕士学位论文 目录
4.3 PReLU 代替传统 ReLU 在植物叶片图像上的识别 ............................. 29
4.3.1 网络模型 .......................................................................................... 29
4.3.2 实验一 .............................................................................................. 32
4.3.3 实验二 .............................................................................................. 33
4.4 本章小结 ................................................................................................. 34
第 5 章 基于多层深度卷积神经网络的植物叶片识别 ...................................... 35
5.1 多层深度卷积神经网络——NIN .......................................................... 35
5.2 网络模型 ................................................................................................. 36
5.3 实验训练参数 ......................................................................................... 41
5.4 实验结果对比分析 ................................................................................. 42
5.5 本章小结 ................................................................................................. 44
第 6 章 总结与展望 .............................................................................................. 45
6.1 本文的主要工作总结 ............................................................................. 45
6.2 工作展望 ................................................................................................. 45
参考文献 ................................................................................................................ 47
攻读硕士期间发表的论文和参与的科研项目 .................................................... 51
致谢 ........................................................................................................................ 52
IV
˝
•
‰
˚
南昌航空大学硕士学位论文 第 1 章 绪论
第 1 章 绪论
1.1 研究背景和意义
地球上大致有几十万种植物,在农业生产中和植物学研究中,植物分类和物
种识别是一个重要的植物学研究和基础工作,植物是人类认识、进化的规律,实
地了解植物的基本特征和保护利用生态环境的重要依据。使用手动测量的传统植
物分类学一般需要手动收集样本来获取数据,它的主观性较强,因而会产生较大
的误差。随着机器学习、模式识别和数字图像处理等技术的飞速发展,人们可以
利用强大的计算能力,快速、准确地进行植物分类。近年来,图像处理和机器学
习技术已被广泛应用于农业和其他领域,如:农产品质量检测、自动识别杂草、
作物生长态势监测、植物病害、一般植物识别的自动检测等。
如今,我们身边围绕的都是各种数据,而这些数据是不可能通过一个人手工
处理的,机器学习的出现有效地解决了这个问题。例如,车牌识别的方法有助于
改善交通环境,纸币清分的识别方法在银行业中具有非常重要的意义等。图像识
别作为机器学习应用之一,在过去几十年里发展迅猛,神经网络作为机器学习中
一种重要的模型方法,在图像识别领域已被广泛研究。然而,长期以来,由于计
算机硬件的限制,大部分的网络结构简单,网络层数和每层的网络节点个数都比
较少,因此,难以构建复杂的网络模型。
近年来,随着计算机处理速度的提升,尤其是深度学习提出以后,科研人员
开始构建越来越复杂的深层神经网络模型来解决各种实际问题。深层神经网络以
Hinton 等人于 2006 年在 Science 上发表的著名论文[1]为标志,近年来得到了迅猛
的发展。作为机器学习领域的重要研究分支,神经网络具有其它机器学习方法不
具备的优势,即深层神经网络可以模拟非常复杂的模型,与人脑的工作过程更相
似。事实也证明,深层神经网络在图片识别、语音识别等领域已经实现了历史性
的巨大突破[2][3]。
在各种深度学习模型中,卷积神经网络可以保持输入数据的空间相对位置信
息,数据在计算过程中具有旋转和平移不变形,因此,它非常适合对图像这种具
有空间结构信息的数据进行建模。
我们已经在近几年的图像识别中取得了很大的进步,有了足够的时间,我们
可以精确地分类图像,但是我们通常没有足够的时间对它们进行分类。比如识别
一个简单的叶子,常见的图像识别系统会回答你“叶”,但是不能给你确切的分
1
˝
•
‰
˚
南昌航空大学硕士学位论文 第 1 章 绪论
类,但有时我们需要比“叶”更多的信息。有关植物叶片识别的方法,已有多位
研究者在此问题上做了大量基础性的工作,为本课题提供了大量经验和实验素材,
指明了研究方向和切入点。不过,早期研究者往往仅基于某一类叶片特征进行植
物叶片识别的方法设计,尽管取得了不错的成果,获得了较好的识别准确率,但
仍然存在很多问题,如:
(1)识别率不能进一步提升,仅徘徊在 85%左右,显然有很大提升空间;
(2)识别能力有限,现有植物叶片识别方法仅针对几种至几十种植物进行实
验,往往这些植物种类之间叶片形态差别很大,如果不同种类的植物叶片形状比
较相近,则现有方法往往无能为力,因此不具备使用价值。
针对上述问题,有研究者提出基于神经网络的植物叶片分类识别,并获得了
令人欣慰的结果,即基于神经网络的算法分类器能够提高识别准确率,但是这些
方法又引出了新的问题,如:
(1)识别率低,这些方法需要大量的计算,训练时间长,耗时严重;
(2)资源要求高,由于基于多种特征,需要大量计算,从而导致存储空间的
增加。
另外,人工识别植物存在许多不足,如:专业知识要求高、主观性较强、识
别准确率不高、识别效率低、处理能力有限,尤其是要手工的选取特征,但这是
非常费力且需要专业知识的方法,而且它的调节需要大量的时间。
因此,本文对传统神经网络研究的前提下,考虑到深度神经网络在图像识别
等领域的巨大应用,拟通过深度神经网络的方法来对植物叶片图像进行识别,从
而提高植物叶片图像识别的识别准确率、识别效率和处理速度等性能。
1.2 国内外研究现状
1.2.1 植物叶片图像识别领域现状
2001 年,Osikar[4]使用叶片的几项区域几何特征和矩特征,采用 BP 前馈神经
网络为分类器,对 15 种瑞典树木进行分类;Clark, J. Y 等人[5]利用神经网络和簇
分析实现了对椴树的无监督分类;Liu J、Zhang S 和 Deng S 等人[6]利用小波分析
和支持向量机的方法来进行植物的分类;傅弘等人[7]利用边缘梯度、局部对比度
和邻域统计特征等 10 个参数来描述像素的邻域特征,并作为神经网络的输入层,
训练后,神经网络能够准确地提取叶脉图像,为进一步的叶片识别奠定了基础。
2008 年,贺鹏等人[8]使用概率神经网络作为分类器对叶片进行识别,与 BP
神经网络相比,达到了较好的识别效果;杜吉祥等人 [9]提出了一种基于多尺度
2
˝
•
‰
˚