第 28 卷第 3 期
2011 年 3 月
计 算 机 应 用 研 究
Application Research of Computers
Vol.28 No.3
Mar.2011
倡
SOM 神 经 网 络 改 进 及 在 遥 感 图 像 分 类 中 的 应 用
任军号, 吉沛琦, 耿 跃
(西北工业大学 自动化学院, 西安 710072)
摘 要: 针对自组织特征神经网络自身算法的特点和缺陷,采用遗传算法对网络进行改进,形成了基于遗传算
法的自组织特征神经网络,并从输入向量、竞争层神经元数量设置和初始权向量设定三方面,结合遥感图像的特
性对自组织特征映射网络遥感图像分类的方法进行了改进。 将该方法应用于选择西安地区的 ETM +卫星遥感
图像进行分类实验。 结果表明,基于遗传算法的自组织特征映射网络使得遥感图像的分类精度更高,且该算法
实现简单,具有一定的工程应用价值。
关键词: 分类; 自组织特征映射; 神经网络; 遗传算法; 遥感图像
中图分类号: TP391 文献标志码: A 文章编号: 1001唱3695(2011)03唱1170唱03
doi:10.3969/j.issn.1001唱3695.2011.03.107
Application and improvement of SOM network in
remote sensing image classification
(College of Automation, Northwestern Polytechnical University, Xi’an 710072, China)
REN Jun唱hao, JI Pei唱qi, GENG Yue
Abstract: Contrary to the characteristics and weak point of self唱organizing maps neural network, this paper shows a SOM
which is improved by genetic algorithm, and improves the method to classifying remote sensing image based on self唱organizing
mapping network through the input vector, selecting the number of competitive layer neurons and the initializing weight vector.
Finally, the method is used to classify an ETM +satellite remote sensing images of Xi’an.It is validated that through the im唱
proved self唱organizing feature map network based on genetic algorithm, classification of remote sensing image have higher accu唱
racy and efficiency than traditional self唱organizing feature map network.The SOM based on genetic algorithm is easy to be
achieved,and has practical value.
Key words: classification; self唱organizing maps(SOM); neural network; genetic algorithm(GA); remote sensing image
0 引言
的信息进行属性识别和分类
遥感图像的分类是指对地球表面及其环境在遥感图像上
[1]。 遥感影像分类是遥感技术的
重要应用领域之一,也是直接生动表现影像目标性质的一种方
式,但相对于层出不穷的遥感影像及特定应用而言,近似完美
的、精度和速度优异的分类算法还比较少。
自组织映射网络(SOM) 是由芬兰学者 Kohonen 教授在
1981 年提出的,也称做 Kohonen 网络
[2],可用于遥感图像的非
监督分类。 Kohonen 认为,处于空间中不同区域的神经元有不
同的分工,当一个神经网络接收外界输入模式时,将会分为不
同的反应区域,各区域对输入模式具有不同的相应特性,据此
提出了 SOM 启发式算法。 SOM 网络的这种特性就十分接近
人的识别特性,但是仍存在一些局限性:主要有训练时间长、训
[3];隐层神经元难以确定;聚类网络
的学习速率需要人为确定,学习终止需要人为控制;隐层的聚
类结果与初始权值有关。 SOM 网络的这些缺陷与其启发式训
练算法有密切关系。
练过程可能出现抖动现象
遗传算法(GA)是借鉴生物的自然选择和遗传进化机制而
产生的一种全局优化自适应概率搜索算法,目前已经在最优
化、机器学习和并行处理等领域得到了广泛的应用。 作为一种
全局优化搜索算法,为解决上述缺陷提供了一个有效的途径。
本文针对自组织映射网络模型存在的不足进行改进,并给
出了基于遗传算法的自组织映射网络的遥感影像分类方法,选
择典型研究区,以西安、咸阳地区的 Landsat ETM +数据为例,
进行了分类实验与分析。
1 SOM 网模型
1畅1 SOM 网络模型
SOM 网共有两层,输入层各神经元通过权向量将外界信
息汇集到输出层的各神经元。 输入层节点数与样本维数相等。
输出层也是竞争层,神经元的排列有多种形式,如一维线阵、二
维平面阵和三维栅格阵。 最常见的是二维平面阵,二维平面阵
组织是 SOM 网络最典型的组织方式,该组织方式更具有大脑
皮层的形象。 输出层的每个神经元同它周围的其他神经元侧
向连接,排列成棋盘状平面,结构如图1 所示。
收稿日期: 2010唱08唱24; 修回日期: 2010唱10唱09 基金项目: 国家自然科学基金资助项目(10702065)
作者简介:任军号(1963唱),男,陕西西安人,教授,博士研究生,工学博士,主要研究方向为城市系统工程、复杂系统建模仿真(alovercon@163.
com);吉沛琦(1985唱),男,陕西延安人,硕士研究生,主要研究方向为复杂系统建模仿真、城市系统工程;耿跃(1985唱),男,陕西西安人,硕士研究
生,主要研究方向为数据挖掘.
第 3 期
1畅2 SOM 网络的训练算法
任军号,等:SOM 神经网络改进及在遥感图像分类中的应用
D =E[p(x)]
i =1hcj(t)‖x -wj‖
p(x) =钞N
Ncj(t) =exp( -‖dc -dj‖2
2δ(t)2
执行在线聚类过程
应用 SOM 网络进行数据聚类时,SOM 网络在输入模式上
[4]。 经过训练的 SOM 网络,对其输入一个
模式,网络会通过特定的神经元将其自动归类。 当输入的模式
不属于网络训练时见过的任何模式时,SOM 网将其归入最接
近的模式类。 以下是 SOM 网络的训练过程。
a)初始化。 对输出层各权向量赋小随机数并进行归一化
处理,得到初始权向量 Wj,j =1,2,…;建立初始优胜邻域 NC
(0);学习率 η赋初始值。
b)接收输入。 从训练集中随机选取一个输入模式并进行
归一化处理,得到 Xp,p∈{1,2,…,P}。
c)寻找获胜神经元。 计算 Xp 与 Wj 的点积,从中选出点积
最大的获胜节点;如果输入未归一化,应计算其欧式距离,从中
找出距离最小的获胜节点。
d)定义优胜邻域 N(t),以获胜节点为中心确定 t 时刻的
权值调整域,一般初始邻域较大,训练过程中邻域 N(t) 随训练
时间逐渐收缩,如图2 所示。
!
e)调整 权 值。 对 优 胜 邻 域 内 所 有 节 点 按 照 下 式 调 整
权值:
ωij(t +1) =ωij(t) +η(t,N)[xi -ωij(t)] i =1,2,…,n;j∈N(t)
其中:η(t,N)是训练时间 t 和邻域内第 j 个神经元与获胜神经
元之间的拓扑距离 N 的函数,该函数一般有以下规律:t 增加
时 η减少,N 增加时 η减少。 有很多函数满足以上规律,如可
构造 η(t,N) =η(t)e -N,就满足这一条件。
f)结束检查。 SOM 网络的训练不存在类似 BP 网络中的
输出误差概念,训练何时结束是以学习率 η(t) 是否减少到零
或者某个预定的正小数或 t 达到某一设定值为条件,不满足条
件则回到步骤 b)循环。
这里要提出的是,SOM 网络算法的收敛性已经由 Hujun
等人于1998 年证明。
2 SOM 网络的改进
从 SOM 网络的工作原理可以看出,影响 SOM 网络训练速
度、精度的关键因素不仅与 SOM 启发式算法有密切的关系,而
且输入向量、竞争层拓扑结构、初始权值等也对 SOM 网络有很
大影响。 以下针对 SOM 启发式算法以及其他方面的不足,对
基于 SOM 网络的遥感图像分类方法进行改进。
2畅1 基于遗传算法的权值训练算法
由上文可知,SOM 网络的基本算法实际上是以局部权重
失真指数 D 如式(1) ~(3) 所示来反映网络质量的综合性质,
[5]。 从
并以该指数梯度的近似所得到的 Kohonen 启发式算法
另一角度理解,就是 SOM 网络的权值参数选取存在着缺陷。
而作为一种全局优化搜索算法,为解决上述缺陷提供了一个有
效的途径。 为解决这些缺陷,本文将用遗传算法直接对该指数
进行优化。
)
遥感影像主要是通过像元亮度值的差异或其空间梯度变
fitness =1/(1 +D)(D =E[p(x)])
·1711·
(1)
(2)
(3)
其中:E 表示数学期望;x 为输入向量;wj 为第 j 个神经元网络
权值;N 为神经元的个数;c 为相对于输入向量的获胜神经元;
Ncj(t)为邻域函数。 dc 是获胜神经元的位置;dj 是第 j 个神经
元的位置;δ(t)是随迭代次数的增加而减少的方差。
基于遗传算法对 SOM 进行优化的步骤如下:
a)种群初始化。 根据输入向量(维数 n)和神经元个数 m,
选择 n ×m 个作为初始网络权值,并组成一个染色体,反复执
行该步得到设定的染色体数量。
b)适应度计算。 由于要对获胜神经元邻域近似进行优
化,距离越小,染色体的适应度应该最大。 因此以式(4) 作为
适应度函数,并计算每条染色体的适应度。
(4)
c)以一定的交叉概率对种群中的个体进行交叉操作;对
d)计算新一代种群中每条染色体的适应度值,以适应度
e)检查终止条件。 达到最大迭代次数或网络权值收敛就
交叉后的染色体,以一定的变异概率进行变异操作。
最高的染色体对权值进行直接更新。
终止迭代并输出结果,否则回到步骤 c)。
2畅2 输入向量的优化
化来表示不同地物间的差异。 像元间亮度的差异反映了地物
的光谱信息差异,而空间变化的差异则反映了地物的空间信
息,这是遥感影像分类的物理依据。 因此,本文将使用符合人
眼感知特性的 HSI 颜色模型(包括色调、饱和度、亮度),各分
量与人眼能够感知的颜色特性一一对应,尤其适合用来表达不
同色彩间的差异,并且分量之间有更强的独立性,有助于对遥
感图像进行分类。
首先对遥感图像的三波段进行 RGB 三通道合成,再将所
得图像的 R、G、B 值以及与 HIS 颜色模式的关系转换为 H、S、I
[6],根据 HSI 颜
值;然后参考王涛对 HSV 颜色模式的处理方法
色模型的特性作如下特殊处理:a) 所有 i <15%的颜色均归入
黑色区域,令 h =0,s =0,i =0;b) 所有 s <10%且 v >80%的颜
色归入白色区域,令 h =0,s =0,i =1;c) 位于黑色区域和白色
区域以外的为彩色区域,其 h、s、i 值保持不变。 经过处理之
后,由于将与黑色、白色相近的颜色分别作为同一种颜色对待,
进一步提高了颜色模型的准确性。
2畅3 竞争层神经元数的确定
神经元数的确定与训练集样本多少类别有关。 如果神经
元数比类别数少,则不足以区分全部类别,相当于“ 粗分”;如
果神经元数多于类别数,有可能分类过细或出现某一神经元从
未获胜的情况。 传统的 SOM 网络竞争层神经元数的确定是根
据具体需要逐步实验得到的,本文采用式(5)[7]
来确定竞争层
神经元数。
(5)
其中:C 为输入样本的类别数( 聚类数);N0 为初始邻域,取为
输入样本的类别数;α为修正系数,0 <α<C。
2畅4 权向量的设定
M =C +0.7N0 +α
SOM 网络权向量的初始值以及之后的值直接影响网络训
计 算 机 应 用 研 究
第 28 卷
P
X =1
·2711·
练的速度和分类的精度。 传统方法是对输出层各权向量赋小
随机数,有一定的缺陷。 由于初始权向量与输入向量越接近,
权值调整范围越小,网络学习越快,权向量的初始值应该按照
样本集中的输入向量的分布来确定。
遥感图像中样本集的输入向量分布极不均匀,所以借助邻
域可以避免由于输入向量的不均匀性造成的分类不平衡。 因
此,将初始权向量取为均匀分布的随机值,且其值互不相等。
本文采取以下方法,先计算出全体样本的中心向量:
钞P
p =1Xp
(6)
其中:P 代表样本集的输入向量总数;Xp 代表第 p 个样本输入
向量,ⅩX 在该中心向量的基础上叠加小随机数作为权向量初始
值,也可将权向量的初始位置确定在样本群中。
3 基于改进 SOM 网络的遥感图像分类
本文以西安地区为例,利用 ENVI 工具获取遥感影响中所
需要的输入数据进行处理,借助 VC、MATLAB 编程平台创建改
进的 SOM 网络模型,并对西安地区2009 年的 ETM +遥感影像
进行分类并提取城市建成区。
3畅1 样本数据预处理
根据 ETM +遥感影像各波段的波普特征,第3 ~5 波段最
有利于城市建成区(即居民地)的提取。 因此,将第 3 ~5 波段
分别对应 B、G、R 三通道进行合成。 将该图像转换为 HSV 模
型的过程,可以通过 MATLAB 的 rgb2hsv 函数来实现,最后进
行上文提到的特殊处理。 经过 hsv 转换,输入向量均在 0 ~1
内,输入量的归一化步骤省去。 将数据导出以供 VC 作为输入
数据。
3畅2 仿真及结果分析
借助 VC 和 MATLAB 平台进行混合编程,创建基于遗传算
法的 SOM 网络遥感图像城市建成区提取模型。
通过 VC 建立并训练 SOM 网络,然后将训练所得的网络
导入 MATLAB 对数据进行分类。 由于样本数据的每一像素点
代表一个输入向量,输入节点即 n 设置为3,取值在[0,1]。 竞
争层根据土地使用类型以及西安地区的实际情况,确定土地利
用类别可分为水体、绿地、交通用地、城镇用地、耕地、山地等。
根据式(5),可确定竞争层为 5 ×5 的二维结构。 网络结构确
定后,开始进行网络的训练。 从样本集中选取具有代表性的7
块区域,总计7 912 个像素点作为训练点集合,根据式(6)对网
络的初始权向量进行设定,并开始训练,经过实验最终设置循
环次数为500 次。 为验证网络的分类精度,用独立选取的验证
集对网络进行验证,并计算分类精度。 网络训练结束,将验证
数据集合输入网络,计算网络的分类精度。 表1 给出了各个土
地类型的训练集合、验证集合以及 SOM 网络改进前后的分类
精度对比。
从验证结果对比可以看出,改进后的 SOM 网络分类方法
能很好地区分城镇用地与耕地、绿地以及水体等土地类型。 由
于遥感图像三波段合成图像在交通和城镇用地的差别较小,在
改进方法的分类结果中,交通用地和城镇用地的分类精度较之
其他用地的精度有所降低,但是与未改进 SOM 网络的交通、城
镇用地相比,分类精度仍有很大提高,超过了 92%,且整体精
度可以达到94%以上。 而未改进的 SOM 网络分类整体精度
是89.35%,明显低于改进网络。
训练数据
土地
耕地
交通用地
城镇用地
绿地
水体
其他
验证数据
表 1 训练、验证数据集合与分类结果
787
875
2 094
1 638
1 251
1 267
604
544
827
1 311
561
未改进%
90
.73
82
.90
88
.62
.15
91
91
.09
改进%
96
.36
92
.10
92
.30
.04
95
.61
96
正确分类的样本:3 698
整体精度:94
.43%
正确分类的样本:3 499
.35%
整体精度:89
改进
SOM
SOM
未改进
样本3 916
将分类结果中的城镇用地提取出之后即是西安市建成区。
如图3 所示,(a)是西安地区 ETM +遥感图像5、4、3 波段合成
图像,(b)是根据由改进 SOM 网络分类结果提取的西安市建
成区,(c)是使用未改进SOM 网络对西安市建成区的提取效果
作为对比。 通过计算,可得建成区面积为 644.94 km2,西安市
2009 年实际建成区面积约为600 km2,提取精度达到92畅51%,
与城镇用地分类精度基本相同,且对城市建成区面积的夸大程
度较之未改进方法有明显的降低。 从图中也可以直观地看出,
改进方法的提取效果明显优于未改进的 SOM 网络,所得到的
结果中,交通道路和建成区的区分效果比未改进之后的 SOM
网络好。
!
& !
"#$%
"#$%
4 结束语
SOM 网络可实现对大数据量进行有效分类,分类性能相
对稳定,是具有优势的一种分类技术,可以作为一种非常有效
的方法对遥感图像进行非监督分类。 文中针对 SOM 网络以及
遥感影像的特点,利用遗传算法对 SOM 网络算法本身进行了
改进优化,并将遥感影像进行 HSI 变换,使得其更加有利于分
类、优化 SOM 网络设置竞争层神经元数量以及初始权向量的
方法,从而使得利用 SOM 网络对遥感图像进行分类的效率和
精度更高。 最后以提取西安市建成区作为实验,验证结果表
明,利用改进 SOM 网络方法对遥感图像分类精度更高,而且分
类速度比传统 SOM 网络更快,网络仿真输出效果好。
当然这种基于 SOM 网络的遥感影像分类方法还存在需要
进一步研究的问题。 例如,算法基于光谱信息,对影像特征考
虑较少,因此,当 HSI 的值比较接近时,会影响分类精度,如图
像中的水体与山脉阴影的混分。 在分类信息的选取方面,如何
对植被物候学特征、生物物理特征、结构纹理特征等进行综合
评价,从而找出最佳的分类信息并应用。 在分类算法的设计中
还未有深入的研究,忽视了空间、纹理结构信息、地理事物地带
性差异知识等对于图像分类的重要作用。 自组织神经网络简
单实用,收敛速度快,在一定程度上消除了异物同谱的现象,很
好地提高了遥感图像的分类精度。 综上所述,探讨 SOM 分类
模型与其他模型的集成,拓展遥感影像处理中知识的应用,是
以后需要进行的主要工作之一。
( 下转第 1182 页)
计 算 机 应 用 研 究
·2811·
64。 在使用 Fault Formation 算法生成初始模型时,通过选取不
同的 max、min 以及迭代次数 n,可以得到不同形态的地形初始
模型。 图7 给出了不同 max、min 以及 n 所得到的各种地形初
始模型。 图7(a)中,max =64,min =0,n =16;(b)中,max =32,
min =0,n =32;(c)中,max =64,min =0,n =32。 如果地形区域
的面积较大,或者希望地形的起伏密度较大,可以选取较大的
迭代次数,反之取较小值。 如果希望地形高度差较大,可以选
取较大的 max 和较小的min,反之取较小的max 和较大的min。
第 28 卷
从图8 中可以看出,分形维数越大,细节越丰富,地形显得
越粗糙。 在生成较大面积地形或地形的高度差较大时,可以取
较大的分形维数值。
幅度系数 k 对生成的地形也有较大的影响。 图 8(d) 所
示,将 k 值从1.5 增大为2.0,地形对于图8(b)明显变得粗糙。
所以在使用分形技术产生地形的过程中,地形的粗糙程度由分
形维数和幅度系数共同决定,分形维数决定了两个层次间细节
的变化程度,而幅度系数描述了地形细节相对于初始地形高度
的比例关系。
4 结束语
本文给出了一种兼具自动性和可控性的地形生成方法,在
地形生成的第一个阶段,使用 Fault Formation 缺点形成算法来
构造初始地形模型,通过控制幅度和迭代次数,可以自动得到
形态各异的地形的特征轮廓。 在第二个阶段,使用中点位移法
对第一个阶段得到的初始模型进行迭代累加,通过设定不同的
控制参数可以生成任意层次的地形细节,最终生成真实感较强
的地形。 实践证明,这种将 Fault Formation 算法和分形技术累
加的方法所得到的地形比较真实。
参考文献:
[1] RABNOVICH B,GOTSMAN C.Visualization of large terrains in re唱
source唱limited computing environment[C] //Proc of the 8th Confe唱
rence on Visualization.Los Alomitos, CA: IEEE Computer Society
Press,1997:95唱102.
[2] SCHRODER F,ROBBACH P.Managing the complexity of digital ter唱
rain modes[J].Computer & Graphics,1994,18(6):775唱783.
[3] HOPPE H.Progressive Meshes[C] //Proc of the 23rd Annual Confe唱
rence on Computer Graphics and Interactive Techniques.New York:
ACM Press,1996:99唱108.
[4] GARDNER G Y.Simulation of natural scenes using textured quadric
surfaces[ J].ACM SIGGRAPH Computer Graphics,1984, 18
(3):11唱20.
[5] CHATURVEDI A K,PIEGL L A.Procedural method for terrain sur唱
face interpolation[J].Computer & Graphics,2007,20(4):541唱
566.
[6] MANDELBROT B B.The fractal geometry of nature[M].New York:
Freeman and Company,1983:495.
[7] FOURNIER A,FUSSELL D,CARPENTER L.Computer rendering of
stichastic models[J].Communications of the ACM,1982,25(6):
371唱384.
[8] MILLER G S P.The definition and rendering of terrain maps[J].
ACM SIGGRAPH Computer Graphics,1986,20(4):39唱48.
用[J].伊犁师范学院学报:自然科学版,2010,3(9):46唱48.
[6] 王涛,胡事明,孙家广.基于颜色—空间特征的图像检索[J].软件
学报,2002,13(10):45.
[7] 梁斌梅.自组织特征映射神经网络的改进及应用研究[J].计算机
工程与应用,2009,45(31):134.
[8] LICCIARDI G,PRATOLA C,FRATE F D.Completely automatic clas唱
sification of satellite multi唱spectral imagery for the production of land
cover maps[C] //Proc of IEEE International Geoscience and Remote
Sensing Symposium.2009:109唱112.
[9] DUQUENOY M,OVARLEZ J R,MORISSEAU C,et al.Supervised
classification by neural networks using polarimetric time唱frequency sig唱
natures[ C] //Proc of IEEE International Geoscience and Remote
Sensing Symposium.2009:438唱441.
$
%
!
!
!
!"
!#
&'
!&'
!#
&'
!"
!#
"
"
"
#$%&'
#$&'
#$&'
(
从图7 可以看出,使用 Fault Formation 算法产生的地形初
始模型已经可以描述地形的大致轮廓,并且64 ×64 的离散网
格所对应的存储数据量也很小。 接下来使用中点位移法对地
形的初始模型进行分形迭代处理,增加地形的多层次细节,从
初始模型相同而细节丰富的真实感很强的状态。
对初始模型进行分形迭代处理,使用分形维数 D 和幅度
系数 k 控制地形的细节。 图8 为通过取不同的参数 k 和 d 分
别对图7 的初始地形 A、B 和 C 迭代处理后得到结果。
而使得地形从一个简单而粗糙的状态转变为一个宏观轮廓与
!
"
!
表1 给出了使用本文方法生成地形的时间效率。 地形模
板网格划分方案为64 ×64,由于网格顶点数量比较少,因此初
始模型的生成速度很快,在迭代过程中,分形维数和幅度系数
的取值对时间效率的影响可以忽略不计,而迭代次数是影响时
间效率的主要因素。
表 1 地形生成的相关数据
迭代时间/s 渲染速度/fps
地形模板生成时间/s
0
0
.000 2
.000 4
143
.5
.3
86
.002
.024
0
0
地形模板网络
迭代 16 次
迭代 32 次
注:程 序 运 行 环 境 为 CPU P4唱2.8 G, 内 存 为 512 MB DDR2唱533, 显 卡 为
NVIDIA GetFore7300GT)。
( 上接第 1172 页)
参考文献:
[1] 毛建旭,王耀南.基 于 神 经 网 络 的 遥 感 图 像 分 类[J].测 控 技 术,
[2] 陈琴.基于 GA唱SOM 网 络 的 垃 圾 邮 件 的 特 征 提 取 的 研 究[J].计
[3] 张春炉,沈建京.基于 SOM 算法的文本聚类实现[J].计算机与现
[4] 马建文,李启青.遥感数据智能处理方法与程序设计[M].北京:
[5] 林玲,伊力亚尔.自组织映射神经网络(SOM) 在图像分类中的应
2001,20(5):29唱31.
算机技术与应用进展,2008,5(4):51.
代化,2010,1(9):29.
科学出版社,2005:241.