42
2019
第
8
卷第
年
4
期
月
长春理工大学学报 (自然科学版)
Journal of Changchun University of Science and Technology (Natural Science Edition)
Vol.42 No.4
Aug.2019
基于深度学习的SAR 图像目标识别算法
崔福彬,张茜,雷俞承志,尹伟石
(长春理工大学 理学院,长春 130022)
摘 要:合成孔径雷达 (SAR) 图像的解译具有重要的价值。针对传统的SAR 目标识别算法需要人为设置分类特征,以及
SAR 图像所包含大量的相干噪声对图像解译造成影响,因此提出一种基于改进的卷积神经网络的SAR 目标识别算法。首先
利用布斯沃特滤波算法对图像进行了滤波处理,减少相干噪声;并改进传统卷积神经网络的结构,引入改进的线性修正单
元作为激活函数,通过使用 Dropout 方法增强网络的泛化性,训练时采用 Adam 优化器更新模型参数。在实验中以公开的
MSATR 数据集进行目标识别检验,在三类目标 (含变体) 的实验测试中取得较好成果,综合识别准确率可达97.2%。
关键词:合成孔径雷达;卷积神经网络;目标识别
中图分类号: TP391.4
文献标识码:A
文章编号:1672-9870(2019)04-00033-04
Target Recoginition Algorithm for
SAR Image Based on Deep Learing
CUI Fubin,ZHANG Xi,LEI Yuchengzhi,YIN Weishi
(School of Science,Changchun University of Science and Technology,Changchun 130022)
Abstract:The interpretion of SAR images is of great importance. As the traditional SAR target recoginition algorithm
required artificial classification features and the mass noise of the image could affect the interpretation,a target recogni-
tion algorithm based on improved convolutional neural network was developed. Firstly,the Butterworth filters was used
to preprocess the images to reduce the noise; the convolutional neural network was improved by Leaky RELU and
Dropout,the generalization ability was increased. The parameters were updated by using the optimizier Adam. The al-
gorithm had been tested on the open data set MSATR,and performed well
in the experiment containing three kinds,
five types of objectives,the overall accuracy could reach 97.2percent.
Key words:synthetic aperture radar;convolutional neural network;target recoginition
合成孔径雷达(SAR)利用相干成像原理,具有
全天候、全天时的观测能力以及穿透地表植被和云
层的能力,是一种重要的观测设备。在军事侦查和
遥感领域有着重要的应用。近年来,随着合成孔径
雷达图像分辨率的逐渐提高,对合成孔径雷达图像
的解析成为了研究热点。
已经有一些较为传统的 SAR-ATR(合成孔径
雷达图像自动目标识别)系统被开发,例如美国陆军
实验室(ARL)的 SAR-ATR 系统。近年来,随着机
器学习算法的发展,一些机器学习的算法被应用于
SAR 图像识别的研究[1]。文献[2]提出了基于 Ga-
bor 滤波器以及局部纹理特征的算法,文献[3]提出
了基于多信息字典及稀疏表示的 SAR 图像识别方
法。以上算法提取的特征由人工设定,需要相当的
先验知识,而且识别效果不佳,泛化性较差。而基于
仿生学理论的的卷积神经网络(Convolutional neu-
ral network,CNN)则能够自动提取图像中的深层
特征,且与传统的深层神经网络相比,卷积神经网络
具有稀疏连接,权值共享等特点,有效地减少了模型
的复杂程度。文献[4]提出了一种应用卷积神经网
络的 SAR 图像识别算法,并将类别可分性度量引入
了神经网络的代价函数,提高了分类效率,神经网络
收稿日期:2018-11-12
基金项目:国家自然科学基金 (11671170)
作者简介:崔福彬 (1998-),男,本科,E-mail:932759807@qq.com
通讯作者:尹伟石 (1980-),男,博士,副教授,E-mail:yinweishi@foxmail.com
34
长春理工大学学报 (自然科学版)
2019
年
采用 Sigmoid 函数作为激活函数,而该函数在训练
时容易产生“梯度弥散”现象,另外没有对 SAR 图像
做任何预处理。针对上述特点,本文提出了一种基
于改进的卷积神经网络的 SAR 图像识别算法:首先
利用布特沃斯滤波算法对 SAR 图像进行滤波处理,
减少图像的相干噪声;然后构建多层卷积网络,并在
网络中采用改进的的线性修正单元[5],采取 Dropout
[6]增强网络的的泛化性,使用Adam 优化算法对网络
参数进行更新,以更高效地训练网络。
1 布特沃斯低通滤波器
合成孔径雷达作为一种高分辨率的对地成像观
测设备,因其基于相干成像的成像机理,图像不可避
免地会包含噪声,严重地影响到了对图像的解析。
因此对图像进行滤波预处理也就成为了 SAR 图像
预处理的关键步骤,滤波效果的好坏对后期图像
处理的影响很大。因此本文利用布特沃斯低通滤波
器来实现对 SAR 图像的滤波。截止频率位于距原
点 D0 处的 n 阶布特沃斯低通滤波器的传递函数定
义为:
H(u,v) =
1
2n
D(u,v)
1 +
|
D0
(1)
其中,D(u,v) 是频率域中点与频率矩形中心的距
离。即:
D(u,v) =[
u - 2
p
2
+(v - Q
2)2]
(2)
布特沃斯低通滤波器的通频带内频率响应曲线
十分平坦,起伏较小。作为一种频域滤波算法,布特
沃斯低通滤波滤波能提取本质特征。
本文利用美国国防部支持的MSTAR 计划所公
布的数据集进行了图像滤波实验,滤波算法的实际
处理效果如图1 所示。
标区域的对比度得到了增强,目标的边缘轮廓更加
的清晰,有利于下一步的图像处理。
2 卷积神经网络及改进
2.1 卷积神经网络原理概述
卷积神经网络是一种特殊的前馈网络。传统的
卷积神经网络一般由卷积层、池化层及全连接层组
成。卷积层和池化层交替连接以提取图像的深层特
征,再由分类器根据提取的特征进行分类。原始图
像经过多个卷积核卷积后形成多张特征图,特征图
的长与宽基本不变,但深度增加,随后经过下采样减
少特征数量。经过多次卷积与下采样后形成高维度
的特征图,再进入分类器进行分类。卷积核对图像
进行卷积运算的公式为:
∑
X (l - 1)
∗K l
X l
j = f
(3)
||
i ∈ Μj
i
ij + bl
j
i 表示第(l - 1)层
其中,‘*’代表着卷积操作,X l - 1
卷积层第 i 个卷积核。 k l
ij 表示卷积核的参数。 bl
j
表示偏置项,f 则表示激活函数,Mj 则表示输入的
图像,X l
i 则表示当前卷积层的输出。
随着数据量的增加,神经网络的深度也在不断
增大,以获取更好的分类能力。但神经网络加深后
就容易出现过拟合现象,也就是模型在训练中表现
较好,但在验证数据集上表现有所降低。为了避免
过拟合,提高卷积神经网络的泛化性。Hinton 提出
了Dropout 策略,即以一定的概率P 随机使某些神经
元失效,被失效的神经元可暂时认为不在网络的内
部,但其权重仍将保留,当该节点重新参与运算时将
继续更新参数。Dropout 方法可以理解为将一个大
的神经网络分成多个独立的子网进行训练,最后多
个网络进行平均。从而有效减小过拟合现象,提高
了网络的泛化性。
2.2 改进的线性修正单元
为了提高网络对抽象特征的提取能力。在卷积
与池化操作之后,需要引入激活函数。针对Sigmoid
函数会导致所谓的“梯度弥散”现象的缺点,可以采
用线性修正单元(RELU)作为激活函数。
f (x) ={x,x > 0
0,x < 0
(4)
(a)原始图
(b)处理后图像
图 1 布斯沃特滤波算法效果
由图 1 可以看出,经过滤波算法处理之后,图像
的质量得到了较大的提高,特征更加明显图片中目
RELU 函数相较于 Sigmoid 函数有以下的几个
优点。首先,使用 RELU 函数不会发生梯度弥散的
现象,而且 Sigmoid 函数包含了除法以及指数运算,
求微分较为复杂,增大了训练时的计算量,而RELU
4
期
第
崔福彬,等:基于深度学习的
SAR
图像目标识别算法
35
据集中包含了同一种类图像的不同变体。对应着不
同的目标状态(如天线是否展开等),训练时只采用
部分(在表格中标注)。训练后采用包含变体数据的
T72、BTR70、BMP2、三类目标数据进行测试。
3.2 实验模型与算法流程
本文首先对图片进行截取,获得其中央部分,随
后对图像进行滤波处理。滤波处理后的图像即可生
成训练数据集进行神经网络训练。网络共有五次卷
积层进行卷积运算,并在其中的第一、三、五卷积层
后添加池化层进行下采样操作。通过卷积运算提取
特征之后,构建一个三层的全连接神经网络。使用
softmax 分类器进行目标分类。
函数求导简单,并且由于 RELU 函数将小于零的输
入置零,在神经网络不断循环计算的条件下,可以理
解为RELU增强了数据的稀疏性,但这也体现了RE-
LU 函数的缺点,即输入小于零时神经元处于‘死亡’
状态。当学习率较大时,可能会导致大量的数据节
点不被激活,梯度也永远为零。所以,本文引入了
Leaky ReLU 函数:
f (x) ={x,x > 0
αx,x < 0
(5)
在输入值大于零时,Leaky ReLU 函数与RELU
函数相同,但修改了输入值小于零的部分,α 是一个
极小的常数。这样梯度便能继续传播。
2.3 Adam 优化器
Adam(Adaptive Momentum Estimation)本 质
上是带有动量项的 RMSprop,它利用梯度的一阶矩
估计和二阶矩估计动态调整每个参数的学习率。
Adam 的优点主要在于经过偏置校正后,每一次迭
代学习率都有个确定范围,使得参数比较平稳。公
式如下:
mt = u*mt - 1 +(1 - u)*gt
nt = v*nt - 1 +(1 - v)*gt
2
m^ t =
(6)
nt
1 - ut
nt
1 - vt
mt
^nt + ε
n^t =
Δθ
t = -
*φ
图 2 模型流程图
其中,mt 、nt 分别是梯度的一阶和二阶矩估计,
m^ t 、n^t 是对它们的校正。
Adam 优化器的特点是:能够针对不同的参数
调整学习率,同时对内存的占用较小。文献[7]表
明,在众多神经网络的优化算法中,Adam 优化器具
有较好的效果。
3 实验结果分析
3.1 实验数据
本文使用了美国国防高等研究计划署(DARPA)
支持的 MSTAR 计划所公布的实测 SAR 地面静止
目标数据进行试验。该数据大多是静止车辆的
SAR 切片图像,包含多种静止车辆目标在各个方位
角下获取到的目标图像。本文选取了数据集中 T72
(坦克)、BTR70(装甲运兵车)、BMP2(步兵战车)、
ZILI131(卡车)、ZSU234(自行防空炮)五类目标作
为训练数据集进行模型训练。其中 T72、BTR70 数
图 3 算法整体流程
各层具体参数如下:
(1)卷积层,96 个卷积核,卷积核大小为 11×11,
步长为4,激活函数为Leaky ReLU。
36
长春理工大学学报 (自然科学版)
2019
年
(2)池化层,窗口大小为2,步长为4。
(3)卷积层,256 个卷积核,卷积核大小为 5×5,
4 结论
步长为1。采用Leaky ReLU 函数进行激活。
(4)池化层,窗口大小为3,步长为1。
(5)卷积层,384 个卷积核,卷积核大小为 3×3,
步长为1。采用Leaky ReLU 函数进行激活。
(6)卷积层,384 个卷积核,卷积核大小为 3×3、
步长为1。采用Leaky ReLU 函数进行激活
(7)卷积层,256 个卷积核,卷积核大小为 3×3,
步长为1。采用Leaky ReLU 函数进行激活。
(8)池化层,窗口大小为3×3,步长为1。
(9)全连接层,4096 个神经元节点。
(10)全连接层,4096 个神经元节点。
(11)输出层,softmax进行分类,五个神经元节点。
3.3 实验结果
本 文 采 用 包 含 T72、BTR70、BMP2 ZILI131
ZSU23 五类目标的数据集进行训练,训练后用包含
变体数据的 T72、BMP2、BTR70 图片进行测试。结
果如表1 和表2 所示。
表 1 MSATR 数据集三类(含变体)目标的测试结果
测试结果
识别准确率
目标类别
BMP2
BTR70
T72
BMP2(9563)(训练时用)
BMP2(C21)
BMP2(9566)
T72(132)(训练时用)
T72(812)
T72(S7)
BTR70(训练时用)
综合识别准确率
192
188
184
1
3
5
0
3
4
5
0
2
5
194
0
2
7
197
193
188
2
97.2%
98.4%
96.9%
94.8%
99.4%
97.4%
94.9%
98.9%
表 2 平均识别率对比
相同实验数据集下平均识别率
Gabor 滤波+局部纹理特征(文献[3])
多信息字典学习及稀疏表示(文献[2])
本文算法
96.60%
92.90%
97.2%
从表 1-2 可以看出本文提出的算法具有较好的
识别效果,对于训练数据集中的同型目标识别率较
高,而对不同类型的目标的识别率略有降低。但总
体的识别率仍然较高,高于文献[3]的 96.60%,以及
文献[2]的92.90%。
卷积神经网络能够自动提取图像中的深层抽象
特征,从而避免了人工设置分类标准。为了能够更
好地进行 SAR 图像的目标识别,本文构建了基于改
进 的 卷 积 神 经 网 络 的 SAR 图 像 目 标 识 别 算 法 。
SAR 图像因其特殊的成像机理不可避免地会在图
像中引入相干噪声,对后续处理造成了不利影响,故
通过布特沃斯滤波算法滤除相干噪声。并在卷积神
经网络中引入了修正的线性修正单元以及 Dropout
方法,增加了网络的泛化能力。使用 Adam 优化器
对模型参数进行优化,取得了较好的训练结果。在
MSATR 数据集上的实验表明,通过对 SAR 图像进
行滤波处理,并且构建改进的卷积神经网络对 SAR
图像进行识别,实验取得了较好的效果,对同型目标
的识别率可达 98%-99%,对三类(含变体)目标的综
合识别率达到了97%以上。表明深度学习方法在图
像处理方面有着较强的特征提取能力和较好的应用
前景。
参考文献
[1] 熊伟,徐永力,姚力波,等.基于 SVM 的高分辨率 SAR
图像舰船目标检测算法[J].遥感技术与应用,2018,
(1):119-127.
[2] 王璐,张帆,李伟,等.基于 Gabor 滤波器和局部纹理特
征提取的 SAR 目标识别算法[J].雷达学报,2015,4
(6):658-665.
[3] 齐会娇,王英华,丁军,等.基于多信息字典学习及稀疏
表示的 SAR 目标识别[J].系统工程与电子技术,2015,
37(6):1280-1287.
[4] 田壮壮,占荣辉,胡杰民,等.基于卷积神经网络的 SAR
图像目标识别研究[J].雷达学报,2016,5(3):320-325.
[5] 蒋昂波,王维维.ReLU 激活函数优化研究[J].传感器与
微系统,2018,37(02):50-52.
[6] Hinton G E,Salakhutdinov R R. Reducing the Di-
mensionality of Data with Neural Networks[J].Science,
2006,313(5786):504-510.
[7] 张慧.深度学习中优化算法的研究与改进[D].北京:北
京邮电大学,2018.
[8] 郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,
2015,42(05):8-33.
[9] 张晨洁,王爽,郭滨,等.基于CNN 脑电信号伪迹检测与
去除的 EEMD 方法[J].长春理工大学学报:自然科学
版,2018,41(02):119-123,128.