2
2
2
2
2
第 12卷 第 1期
2008年 1月
遥 感 学 报
JOURNAL OF REMOTE SENSING
Vol. 12, No. 1
Jan. , 2008
文章编号 : 1007
4619 (2008) 01
0046
08
利用 SVM 的全极化 、双极化与单极化
SAR图像分类性能的比较
吴永辉 , 计科峰 , 郁文贤
(国防科学技术大学 电子科学与工程学院 , 湖南 长沙 410073)
摘 要 : 支持向量机 ( SVM )以其在小训练样本时良好的分类性能 ,目前已广泛应用于多个领域 。本文在极化
SAR图像特征提取基础上 ,将 SVM 应用于极化 SAR图像分类 ,定性和定量地比较了全极化 、双极化和单极化 SAR
图像的分类性能 ,分析了不同的极化组合对分类结果的影响 ,并根据地物极化散射特性分析了分类精度差异的成
因 。实测极化 SAR数据的实验结果表明 ,全极化数据能获得最好的分类性能 ,双极化次之 ,单极化最低 ,且在某些
情况下 ,双极化与全极化分类性能接近 。
关键词 : 雷达极化 ; 合成孔径雷达 ; 分类
中图分类号 : TP751. 1 文献标识码 : A
1 引 言
近年来 ,随着多个实际系统应用于生物密度评
估 、植被探测 、地质勘探和海冰监测等领域 ,极化合
成孔径雷达 ( Synthetic Aperture Radar, SAR )逐渐成
为人们关注的热点 。极化描述了电场矢端的振动状
态 ,是电磁波的固有属性之一 。地物对不同极化入
射波的散射特性可用复散射矩阵表征 。具有 HH,
HV , VH和 VV 4种极化的全极化 SAR 的散射矩阵
包含了地物的全部散射信息 ,有利于深入分析地物
特性 。双极化包含了上述 4种极化中的两种 ,散射
信息少于全极化 ,但比单极化的信息更丰富 。
地物分类是极化 SAR图像的重要应用之一 ,分
类图直观地表明了地物的类别归属 ,有利于人们对
图像的理解及挖掘图像中的隐含信息 。根据处理方
法的不同 , SAR图像分类方法可分为监督和非监督
两类 。Vapnik等人提出的基于统计学习理论的支
持向量机 ( Support Vector Machine, SVM ) [ 1—3 ]是一
种有效的监督分类器 。该方法利用非线性变换将输
入空间中线性不可分的问题转化到高维空间 ,根据
间隔最大化准则构造最优分类超平面 。由于最优分
类面的求解过程和最终的判决函数都只用到内积运
算 ,因此只需要知道非线性变换后的高维空间的内
积运算 ,而不必知道变换的表达式 ,避免了高维空间
显式运算带来的维数灾难 。在有限训练样本情况
下 , SVM 利 用 结 构 风 险 最 小 化 ( Structural R isk
M inim ization, SRM )原则 ,在固定经验风险的同时得
到 VC维 (Vapnik
Chervonenkis D imension)最小的最
优分类面 ,避免了过学习 ,具有良好的泛化性能 ,对
解决小样本 、非线性及高维模式识别问题具有独特
的优势 。目前 , SVM 已成为机器学习领域新热点 ,
在人脸识别 [ 4 ] 、手写字体识别 [ 5 ]和自动目标识别 [ 6 ]
中得到了广泛应用 。国外已有学者尝试将其用于极
化 SAR图像分类 [ 7, 8 ] ,取得了较好的效果 。
与单极化 SAR相比 ,双极化和全极化能在多大
程度上提高分类性能 ,这是人们普遍关注的问题 。
本文在极化 SAR 特征提取的基础上 ,研究了 SVM
在极化 SAR 图像分类中的应用 。同时 ,以 SVM 为
分类器 ,利用实测数据比较了全极化 、双极化和单极
化 SAR 图像的分类性能 ,定性 、定量地分析了不同
极化组合对分类性能的影响 ,并从地物极化散射特
性和分类器工作机理的角度 ,解释了分类精度差异
的成因 ,得到了一些有意义的结论 。
文中第 2节介绍极化 SAR 和单极化 SAR 图像
分类特征 ,第 3 节简要阐述 SVM 原理与基于 SVM
收稿日期 : 2006
作者简介 :吴永辉 (1976— ) ,男 ,国防科学技术大学电子科学与工程学院博士研究生。主要研究方向为极化 SAR 信息处理 。已发表论
01;修订日期 : 2007
08
04
20
文 10余篇 。 E
mail: wuxiaowu76@126. com。
第 1期
吴永辉等 :利用 SVM 的全极化 、双极化与单极化 SAR图像分类性能的比较
47
3
3
3
3
3
3
3
3
3
3
3
3
3
3
的 SAR 图像分类方法 ,第 4节给出实测全极化 、双
极化和单极化 SAR图像的分类结果 ,并进行比较分
析 ,第 5节为结论 。
2 SAR图像分类特征
2. 1 全极化 SAR图像分类特征
全极化 SAR 测量得到的地物复散射矩阵可表
示为 :
S =
SHH
SVH
SHV
SVV
一般而言 ,单站雷达成像满足互易定理 ,此时
SHV = SVH ,散射矢量为 x = [ SHH 2SHV SVV ]T , 其
中 , 2是为了使散射矢量与散射矩阵的总功率相等 ,
上标“T”表示转置 。由散射矢量定义极化协方差矩
阵为 :
2
SHH
C = xxH =
2SHV S
HH
2SHH S
2 SHV
HV
2
SHH S
VV
2SHV S
VV
( 2)
SVV S
HH
2SVV S
HV
2
SVV
式中 ,上标“H”表示共轭转置 。通常情况下 , C 中元
素的功率值所含信息量远大于相位值的信息量 , 又
由于 C 为共轭对称阵 ,因此本文取其右上角 6个元
素的模作为分类特征 。
为更好地利用极化信息 ,根据特征值分解理论 ,
可提取出极化相关矩阵 T的 3个特征值 [ 9 ] :
T = kkH = ∑
λi u i uH
i
3
i = 1
( 3)
式中 , k =
1
2
[ SHH + SVV SHH - SVV 2SHV ]T 为 S 在
Pauli基 上 分 解 得 到 的 散 射 矢 量 的 另 一 种 形 式 ,
u i ( i = 1, 2, 3)为 T经 Schm idt正交化后的单位特征
矢量 ,λi ( i = 1, 2, 3)为 T 的 3个特征值 , 满足 λ1 ≥
λ2 ≥λ3。
根据式 (2)和 ( 3 ) , 即可得到全极化 SAR 图像
的分类特征矢量 :
ff = [ C11 , C22 , C33 , C12
, C13
, C23
,λ1 ,λ2 ,λ3 ]T
( 4)
2. 2 双极化 SAR图像分类特征
双极化 SAR 数据的散射矢量可直接写为 x =
[ S1 S2 ]T ,其极化协方差矩阵为 :
对于 3种不同组合的双极化 , 将各自的散射矩
阵 S 在 Pauli基上分解 ,可得到对应的散射矢量 k:
( 1) HH
( 2 ) HH
HV: k = [ SHH (SHV + jSHV ) / 2 ]T;
VV: k = [ ( SHH + SVV ) / 2 ( SHH -
SVV ) / 2 ]T;
( 3) HV
极化相关矩阵为 :
VV: k = [ SVV ( SHV + jSHV ) / 2 ]T。
T = kkH = ∑
λi u i uH
i
2
i = 1
( 1)
类似地 , 可得到双极化 SAR 图像的分类特征
矢量 :
fd = [ C11 , C22 , C12
,λ1 ,λ2 ]T
(6)
(7)
2. 3 单极化 SAR图像分类特征
对单极化 SAR数据 ,散射矢量为 x = [ S ],协方
差矩 阵 为 C = [ S 2 ], 分 类 特 征 矢 量 只 含 一 个
元素 :
fs = [ S 2 ]
(8)
3 基于 SVM 的 SAR图像分类方法
3. 1 SVM 原理简介
假定原始特征空间中的训练数据 { ( x1 , y1 ) , …,
( xl , yl ) } ( xi ∈Rn , yi ∈{ - 1, 1} , i = 1, 2, …, l)可被
超平面〈w, x〉+ b = 0 ( b∈R )线性划分为两类 , 超平
面必定满足 yi (〈w, xi 〉+ b) ≥1 ( i = 1, 2, …,
l) ,
〉表示矢量内积 。 SVM 所求的最优超平面要
〈
使得分类间隔最大 ,这等价于求解二次规划问题 :
,
Φ (w ) =
m in
w, b
1
〈w, w 〉
2
(9)
s. t. yi (〈w, xi 〉+ b) ≥ 1, i = 1, 2, …, l ( 10)
引入 Lagrange算子 αi ≥0 可得到该问题的惟一解
α
, xi 〉+
可得到基于
= [α
) - 1 ] = 0 ( i = 1, 2, …, l) 。利用 α
]T , 满足 α
1 ,α
2 , …,α
[ yi (〈w
b
最优分类超平面的判决函数为 :
l
i
, x〉+ b
)
f ( x) = sgn (〈w
= sgn ∑
i∈SV
yiα
i 〈xi , x〉+ b
( 11)
当原始特征空间中的训练数据线性不可分时 ,
引入松弛变量 ξi ≥0 ( i = 1, 2, …,
l) 和惩 罚因 子
C ( > 0) ,可得到形如式 ( 11)的基于广义最优分类超
平面的判决函数 。
C = xxH =
2
S1
S1 S
2
S2 S
1
2
S2
( 5)
为了在高维特征空间中寻求更优的解 , 可利用
核函数 K ( x, y)实现原始空间到高维空间的非线性
2
2
2
48
遥 感 学 报
映射 。在 SVM 中 ,采用不同的核函数可实现不同的
非线性映射 , 本文采用最为常用的径向基核函数
2 /σ2 }。原始的 SVM 是两
K ( x, xi ) = exp { -
类分类器 ,对于多类分类问题需进行扩展 。常用的
方法有一类对余类 [ 2 ]和一类对一类 [ 10 ] 。本文采用
后一种方法 。
x - xi
3. 2 分类流程
图 1所示 。
本文基于 SVM 的 SAR 图像分类方法流程如
图 1 基于 SVM 的 SAR图像分类流程图
Fig. 1 Flow chart of SAR images classification based on SVM
其具体步骤如下 :
( 1) 由原始散射数据得到协方差矩阵 C 和相
关矩阵 T;
( 2) 利用 m ×m的矩形窗对 C 和 T滤波 ,以减
弱相干斑的影响 ;
( 3) 求 RU (C ) 和 λi , 其中 RU ( ·)表示取矩
阵上三角中的元素 ;
( 4) 利用 RU ( C ) 和 λi 构造分类特征矢量 f,
并归一化 ,以均衡特征矢量各分量对 SVM 的影响 ,
对全极化 、双极化和单极化 SAR 图像 ,
f分别如式
(4) , (7)和 ( 8)所示 ;
( 5) 根据地物的先验知识或 span图像中的地
物分布 ,选择各类训练样本 ;
( 6) 训练 SVM,以获得分类器参数 ;
( 7) 以归一化的 f为输入特征矢量 , 利用训练
第 12卷
好的 SVM 对 SAR图像进行分类 ;
( 8) 输出分类结果图 。
4 实验结果及分析
4. 1 Flevoland全极化数据分类结果及分析
056
实验一所用数据是 NASA /JPL 实验室 A IRSAR
系统于 1989 年 8 月 16 日获取的 L 波段荷兰中部
Flevoland地区全极化 4 视数据的一部分 。该地区
为平坦的农田 ,完整场景大小为 750像素 ×1024像
素 ,场景编号为 Flevoland
1。图像上方为近雷
达端 ,下方为远雷达端 。像素的距离向 (垂直方向 )
分辨 率 为 6
7m , 方 位 向 (水 平 方 向 ) 分 辨 率 为
1m。实验数据从原始图像中截取 ,大小为 500
12
像素 ×600像素 ,其总功率图如图 2 ( a)所示 。为改
善视觉效果 ,图 2 ( a)经 3 ×3的矩形窗滤波 。在截
取的图像中包含 9种地物 ,除一块裸地和几块草地
外 ,其余地区覆盖的地物为大麦 、苜蓿 、豌豆等 7种
农作物 。成像同期由 JPL实验室组织对这一地区进
行了勘察 ,得到了真实的地物分布图 ,为评估分类精
度提供了依据 。图 2 ( b)标明了实验数据的真实地
物分布情况 。为获得可靠的训练数据和准确评估分
类精度 ,图 2 ( b)中去除了道路 、地物边界和地物类
别模糊的区域 ,并以白色表示 。图 2 ( c)给出了训练
数据的选取方式 ,图中每一类的训练数据均为 20像
素 ×20像素的矩形区域 。
在 SVM 中 ,核函数类型 、参数及惩罚因子 C 的
选择非常重要 。目前 ,这种选择尚无严格的理论依
据 ,对于不同的数据 ,一般根据实验来确定 。本文选
用径向基核 SVM 对全极化 、双极化和单极化 SAR
图像分类 ,输入分类特征分别由式 ( 4) , ( 7)和 ( 8 )
给出 ,特征经 3 ×3的矩形窗滤波以进一步减弱相干
图 2 L波段荷兰 Flevoland地区全极化数据
( b) 真实地物分布图 ;
( c) 训练数据选取
( a) 总功率图 ;
band 4
Fig. 2 L
look fully polarimetric data of Flevoland, The Netherlands
( a) Span image;
( b) Ground
truth map;
( c) Training data selection
2
2
2
2
第 1期
2
吴永辉等 :利用 SVM 的全极化 、双极化与单极化 SAR图像分类性能的比较
49
斑的影响 。为消除径向基核 SVM 的形状参数 σ和
惩罚因子 C对分类结果的影响 ,实验中取 σ = 0
01,
1, 1, 10, 100和 C = 1, 10, 102 , 103 , 104 , 105 ,并将这
0
两个参数的 30 种组合的分类精度 (定义为测试数
据正确分类像素个数与总像素个数之比 )平均 , 得
到的全极化 、双极化和单极化结果见表 1。表 2 给
出了 σ和 C 取上述值时的最佳分类结果 ———最高
总精度和对应的各类地物分类精度 。
由表 1和表 2可得到以下结论 。
(1) 将多个不同参数的 SVM 结果平均后 ,全极
7%。在取
化数据的 9 类地物总分类精度达到 72
7%。草地
合适的 SVM 参数值时 ,总精度可达 84
的分类正确率在两种情况下都较低 ,由分类混淆矩
阵 (文中未给出 )可知 ,平均有将近 50%的草地误分
为大麦 ,其原因是 ,在成像季节中 ,草地与大麦的植
株形态最为接近 ,极化散射特性非常相似 。
5% , 62
HV的 53
5%与 HV
VV的 64
VV 比 HH
(2) 表 1中 , HH
VV总分类正确率达到 69
7% ,
高于 HH
1% ,表 2中 ,
3种双极化总分类正确率分别为 84
4%和
8% ,相同极化组合的双极化数据的分类结果都
77
优于相同 —交叉极化组合 。当 SVM 参数选择合适
时 , HH
HV 的总分类正确率高 22%以
上 ,比 HV
VV高 6%以上 ,这说明对于农作物采用
相同极化组合的双极化 ,能得到优于相同 —交叉极
化组合的分类结果 。比较表 1 中全极化与 HH
VV
数据的总分类精度可以看出 , 后者的损失略大于
3% ,而在表 2中 ,两者的总精度相差小于 1% ,这表
明在农作物监测任务中 ,在由于费用 、搭载平台载荷
Table 1 Com par ison of average cla ssif ica tion accuracy ( %) using Flevoland da ta: full, dua l and single polar iza tion
表 1 Flevoland数据平均分类精度比较 ( %) :全极化 、双极化与单极化
地物类型
裸地
大麦
草地
紫花苜蓿
豌豆
马铃薯
油菜籽
甜菜
小麦
总精度
全极化
HH
HV
VV
96. 5716
79. 7973
39. 6638
72. 1931
68. 8920
92. 7697
71. 9312
72. 3659
60. 1993
72. 7093
HH
HV
97. 0643
70. 9847
10. 3428
27. 0419
42. 9147
88. 5690
38. 0124
59. 4581
47. 0515
53. 4933
双极化
HH
VV
99. 3215
69. 6336
39. 3869
63. 2086
72. 3335
86. 4506
69. 2843
67. 8540
59. 6860
69. 6843
HV
VV
71. 8511
78. 7108
28. 1141
45. 1703
71. 2119
88. 0628
60. 1504
75. 5655
58. 4100
64. 1385
HH
5. 2506
83. 9963
6. 7441
32. 0143
30. 6921
51. 8263
43. 2538
23. 0201
53. 7968
36. 7327
单极化
HV
97. 6006
59. 1003
0. 5722
14. 5140
26. 4443
83. 0943
28. 4912
41. 6836
47. 7693
44. 3633
VV
9. 9564
62. 6642
22. 5372
16. 8567
37. 6953
24. 7295
28. 4114
32. 6453
43. 5428
31. 0043
Table 2 Com par ison of h ighest cla ssif ica tion accuracy ( %) using Flevoland da ta: full, dua l and single polar iza tion
表 2 Flevoland数据最佳分类精度比较 ( %) :全极化 、双极化与单极化
全极化
地物类型
HH
HV
VV
HH
HV
双极化
HH
VV
HV
VV
HH
单极化
HV
VV
σ = 1, C = 104 σ = 10 - 1 , C = 102 σ = 10 - 1 , C = 104 σ = 10 - 1 , C = 103 σ = 10 - 1 , C = 104 σ = 10 - 2 , C = 1 σ = 10 - 2 , C = 104
裸地
大麦
草地
紫花苜蓿
豌豆
马铃薯
油菜籽
甜菜
小麦
总精度
99. 4088
79. 0627
58. 8489
84. 9291
90. 9313
95. 4250
90. 0334
86. 4657
77. 5739
84. 7421
94. 9113
78. 0802
20. 3350
37. 8453
53. 9227
96. 3684
58. 4236
66. 2873
55. 7158
62. 4322
99. 1554
77. 6288
61. 0715
85. 0607
90. 2463
96. 2670
90. 4242
83. 2667
77. 8011
84. 5468
96. 3682
73. 0882
50. 9206
61. 1460
85. 0922
95. 6989
80. 5553
86. 1581
70. 8268
77. 7616
8. 5093
79. 8194
5. 9711
48. 5017
50. 0571
68. 6042
49. 1247
27. 5146
54. 3524
43. 6061
96. 9172
69. 1450
0. 0000
7. 8936
38. 3950
98. 1538
40. 0782
52. 9991
54. 6146
50. 9107
5. 3421
53. 3590
27. 6497
30. 1856
50. 8563
25. 7152
33. 6862
36. 6195
51. 5557
34. 9966
1
1
1
1
50
遥 感 学 报
第 12卷
4%和 50
及数据量等因素限制而无法应用全极化 SAR 时 ,
HH
VV双极化 SAR是一种性能可接受的替代 。
(3) 单极化的分类正确率低于全极化和双极
化 。表 1和表 2中 HV的正确率均高于 HH和 VV ,
但仅分别达到 44
9%。由表 1 和表 2 可
知 ,对于相同极化而言 , HH的分类正确率高于 VV ,
这表明若使用相同极化的发射接收设备 ,选择 HH
单极化 SAR 能在简化设备的同时获得优于 VV 单
极化 SAR的分类性能 。在单极化时 ,由于仅利用功
率进行分类 ,因此若不同地物的散射特性相近 ,则会
导致较为严重的误分 :表 1中 , HH和 VV的裸地 ,其
平均分类正确率低于 10% ; HH 和 HV 的草地 ,平均
正确率低于 7% ,误分严重时甚至全部被分入其他
类别 ,如表 2所示 ; HV 的紫花苜蓿的平均正确率也
很低 ,不超过 15%。
HV和 HV
以上分析说明 ,对于农作物监测 ,利用全极化数
据能得到最好的分类结果 ,各类地物的分类正确率
及总精度都较高 。双极化的结果稍差 , 但 HH
VV
分类性能的下降小于 HH
VV。在无法应
用全极化 SAR 的情况下 , HH
VV 双极化 SAR 是一
种可行的选择 。单极化的分类精度比全极化和双极
化低得多 ,极端情况下会出现部分类别的完全误分 ,
其原因是单极化信息难以充分揭示不同地物散射之
间的差别 。对于 HH, HV 和 VV 3 种单极化 ,选择
HH可在简化设备的同时获得高于 VV的分类精度 。
需要注意的是 ,虽然在 3种单极化中 , HV 的分
类精度最高 ,但当它与两种相同极化组合成双极化
HV 和 HV
VV 时 , 得 到 的 分 类 精 度 却 低 于
HH
VV ,这与文献 [ 11 ]中 L 波段 Flevoland数据的
HH
实验结果一致 。虽然本文只截取了完整场景的一部
分 ,并且训练数据 、真实地物分布参考图 、分类方法
与文献 [ 11 ]不尽相同 ,但该结果仍然是有意义的 。
它表明 ,双极化的分类能力与组成它的两种单极化
各自的分类能力不相关 ,而取决于双极化特征空间
对地物的区分能力 ,反之亦然 。
4. 2 国内某地区双极化数据分类结果及分析
实验二用到的是国内某地区 HH
HV 双极化
SAR数据 。为抑制相干斑 ,原始图像经 8视处理 ,即
在方位向进行 8 像素平均 。所截取的图像大小为
500像素 ×400像素 ,大致包括水面 、裸地 、岸滩和建
筑 4类地物 。由于缺少该地区精确的地物分布图 ,
无法准确评估分类正确率 ,因而采用目视评测法 。
图 3 ( a)为该数据的总功率图 ,它经 3 ×3的矩形窗
滤波以利于目视评测 。图中 ,水面对应于最暗的像
素 ,如图 3 ( a)下半部分水平贯穿图像的大块不规则
黑色区域和图像上部和中部条状黑色地物 ;建筑对
应于图像中上部偏左侧排列较为整齐的块状高亮区
域 ;岸滩对应于图像下部亮度稍次于建筑的区域 ;其
余区域为裸地 ,其亮度介于岸滩和水面之间 ,为深灰
色至浅灰色 ,是图像上分布最广的地物 。4 类地物
的训练数据参照总功率图选取 ,均为 9像素 ×17像
素的矩形区域 ,如图 3 ( b)所示 。
01, 0
仍选用径向基核 SVM 分类 , HH
HV 双极化和
HH与 HV两种单极化数据的输入分类特征 ,分别由
式 (7)和式 (8)给出 ,特征经 3 ×3的矩形窗滤波以进
一步减弱相干斑的影响。大量实验表明 ,当 SVM 参
数取值为 σ = 0
1, 1, 10, 100 和 C = 1, 10, 102 ,
103 , 104 , 105 , 106 , 107 时 , 双极化和单极化数据各自
的分类结果图虽然有所变化 , 但与总功率图的相对
吻合程度与 σ = 1 和 C = 107 的实验结果类似 。限
于篇幅 ,此处仅给出 σ = 1和 C = 107 时 HH
HV , HH
及 HV的分类结果如图 3 ( d) , 3 ( e)和 3 ( f)所示 ,其
余略去 。图 3 ( c)为分类结果图的类别颜色标定 。
虽然由于缺少该地区精确的地物分布而无法准
确计算分类正确率 ,但根据总功率图对分类结果图
进行目视评测仍可得到一些有意义的结论 。比较
图 3 ( d)与 3 ( a)可以看出 ,双极化数据的分类结果
令人满意 , 4类地物都得到了有效的区分 。其中 ,水
面和建筑的区分度很高 ,属于这两类的像素基本未
误分为其他类别 ;裸地和岸滩的区分度稍低 ,图像的
中下部偏右处少数属于裸地的像素与图像最下方少
数属于岸滩的像素误分为建筑 ,一些零散的裸地像
素因散射特性与岸滩较为接近而误分为岸滩 。
将图 3 ( e) , 3 ( f)与图 3 ( d)对比可以看出 , HH
和 HV两种单极化的分类效果相差很大 ,前者的分
类性能仅稍逊于双极化 , 而后者的分类结果则较
差 ———地物类别严重混淆 ,导致分类图模糊不清 。
相对于图 3 ( d)而言 ,图 3 ( e)中有更多的裸地像素
误分为岸滩 ,而且左上角的水平条带状水面中有部
分像素误分为裸地 。图 3 ( f)中 ,裸地 、岸滩和建筑
混淆严重 ,裸地和水面也互有混淆 。
为分 析 HH 和 HV 分 类 性 能 差 异 的 成 因 ,
图 4 ( a)和 4 ( b)给出了该数据 HH 和 HV 对数功率
图 ,其动态范围分别为 [ - 16
6,
5 ] (单位 : dB ) ,两种单极化的最大值 、最小值均
27
分别出现于建筑和水面 。由于二面角的去极化作用
很弱 ,因此建筑区域的 HV 散射强度远弱于 HH ,两
4 ]和 [ - 5
5, 36
第 1期
吴永辉等 :利用 SVM 的全极化 、双极化与单极化 SAR图像分类性能的比较
51
图 3 国内某地区双极化 SAR数据及其分类图 :双极化与单极化
( a) 总功率图 ;
( b) 训练数据选取 ;
( c) 类别颜色标定 ;
( d) HH
HV分类图 ;
( e) HH分类图 ;
( f) HV分类图
Fig. 3 Dual
polarization SAR data of a certain area in China and classification map s: dual
coded class label;
( b) Training data selection;
( a) Span image;
( c) Color
and single
polarization
( d) HH
HV classification map;
( e) HH classification map;
( f) HV classification map
( a)
( b)
( c)
( d)
( a) HH对数功率图 ;
( b) HV对数功率图 ;
( c) HH对数功率图中 A 与 B 的直方图 ;
( d) HV对数功率图中 A 与 B 的直方图
图 4 国内某地区数据 HH和 HV对数功率图及直方图分析
Fig. 4 HH and HV logarithm ic power map of a certain area in China and histogram analysis
( a) HH log power map;
( b) HV log power map;
( d) H istogram of A and B in HV log power map
( c) H istogram of A and B in HH log power map;
者相差接近 9dB。相比之下 , HV 图像中建筑与岸
滩 、裸地的交迭较多 , HH 图像中建筑与后两者的区
分度更好 ,因此 ,图 3 ( f)中三者混淆严重 ,而在图 3
( e)中则得到了很好的区分 。
图 4 ( a)和 4 ( b)以 A 和 B 标出了图中方框圈定
的水面和裸地 ,图 4 ( c)和 4 ( d)用直方图分别描绘
了 HH和 HV的对数功率图中区域 A 和 B 的灰度分
布 。容易看出 ,图 4 ( c)中水面和裸地的直方图交迭
极少 ,其交界处的凹口高度接近于零 ;而图 4 ( d)中
裸地和水面的直方图交迭区域较大 ,其凹口高度位
于 250左右 ,表明这两类地物在 HV 功率图上的灰
度值存在部分重叠 。虽然 SVM 能将输入特征空间
2
52
遥 感 学 报
第 12卷
致 谢 :感谢电子科技集团第 38所张长耀主任
提供国内双极化 SAR数据 。
的数据映射到高维空间以改善分类效果 ,但数据在
原始输入空间中的混叠仍会影响最终分类结果 ,从
而直接导致了 HV分类结果变差 。
4. 3 Flevoland与国内某地区数据单极化分类结果的
对比分析
对比 Flevoland与国内某地区数据在单极化时
的分类结果 ,可以发现一个有趣的现象 :对于前者 ,
HV优于 HH,而后者得到的结论刚好相反 。这种看
似矛盾的现象可用极化散射理论加以解释 。
实验一用于统计分类精度的数据中只包含裸
地 、草地和 7种农作物 ,这些作物在成像期间正处于
生长旺季 。由于各类作物植株形态差异较大 ,去极
化能力各不相同 ,而裸地和草地的去极化能力又与
作物不同 ———除草地与大麦之外 ,使得 HV 功率图
上各类地物的整体差异大于 HH ,因而前者能得到
更好的分类结果 。
实验二所用的国内某地区数据包含了建筑 ,由
建筑形成的二面角去极化效应较弱 ,其在交叉极化
的散射功率远弱于在 HH 极化的功率 ,使得 HV 对
数功率图上建筑 、岸滩和裸地的灰度值相互混叠 。
另外 , HV的裸地和水面功率交迭比 HH 严重得多 。
这两个原因导致国内数据的 HH分类结果优于 HV。
5 结 论
本文以 SVM 为分类器 ,利用实测极化数据 ,定
量和定性地比较了全极化 、双极化和单极化 SAR 图
像的分类性能 。由实验结果可得到以下结论 :
(1) 全极化 SAR 图像能获得最高的分类正确
率 ,双极化次之 ,单极化最低 ;
(2) 对于农作物分类 , HH
VV 优于其他两种双
极化 ,且与全极化性能接近 ,在因条件限制无法应用
全极化 SAR时 , HH
VV 双极化 SAR 是一种性能可
接受的替代 ;
(3) 双极化的分类能力与组成它的两种单极化
各自的分类能力不相关 ,而取决于双极化特征空间
对地物的区分能力 ,反之亦然 ;
(4) 农作物的去极化能力较强 ,使得各类数据
在 HV极化图像中可分性更好 ,因此 HV 的分类效
果优于其他两种单极化 ;而对于两种相同极化 , HH
性能优于 VV ,若使用相同极化的发射接收设备 , HH
是更好的选择 ;
(5) 由于建筑所形成的二面角的去极化效应很
弱 ,其 HV的散射强度与岸滩 、裸地混叠较为严重 ,
导致 HV的分类结果差于 HH。
与单极化相比 ,极化 SAR提供了更多的地物散
射信息 。如何充分利用这些信息获得更好的分类效
果 ,是极化 SAR 图像分类领域极具挑战性的课题 ,
也是本文进一步的研究方向 。
参 考 文 献 ( References)
[ 1 ] Vapnik V N, WR ITING, Zhang X G, TRANSLATING. The
Nature of Statistical Learning Theory [ M ]. Beijing: Tsinghua
University Press, 2000. [Vapnik V N著 , 张学工译. 统计学习
理论的本质 [M ]. 北京 : 清华大学出版社 , 2000. ]
[ 2 ] Vapnik V N, WR ITING, Xu J H, Zhang X G, TRANSLATING.
Statistical Learning Theory [ M ]. Beijing: Publishing House of
Electronics Industry, 2004. [Vapnik V N 著 , 许建华 , 张学工
译. 统计学习理论 [M ]. 北京 : 电子工业出版社 , 2004. ]
[ 3 ] Cristianini N, Taylor J S, WR ITING, L i G Z, W angM , Zeng H
J, TRANSLATING. An Introduction to Support Vector Machines
and O ther Kernel
based Learning Methods [ M ]. Beijing:
Publishing House of Electronics Industry, 2005. [ Cristianini N,
Taylor J S著 , 李国正 , 王猛 , 曾华军译. 支持向量机导论
[M ]. 北京 : 电子工业出版社 , 2005. ]
[ 4 ] O suna E, Freund R, Girosit F.
Training Support Vector
Machines: an App lication to Face Detection [ A ]. Proc.
IEEE
Computer Society Conference on Computer V ision and Pattern
Recognition[ C ]. 1997: 130—136.
[ 5 ] Cortes C, Vapnik V N. Support Vector Networks[ J ]. M ach ine
L earning, 1995, 20 (3) : 273—297.
[ 6 ] Zhao Q, Principe J. Support VectorMachines for SAR Automatic
IEEE T rans. on A erospace and E lectronic
Target Recognition[ J ].
System s, 2001, 37 (2) : 643—654.
[ 7 ] Fukuda S, H irosawa H. Support VectorMachine Classification of
Land Cover: App lication to Polarimetric SAR Data [ A ]. Proc.
IEEE International Geoscience and Remote Sensing Symposium
[ C ]. 2001.
[ 8 ] Fukuda S, Katagiri R, H irosawa H. Unsupervised App roach for
Polarimetric SAR Image Classification U sing Support Vector
Machines[A ]. Proc.
IEEE International Geoscience and Remote
Sensing Symposium [ C ]. 2002.
[ 9 ] Cloude S R, Pottier E. An Entropy Based Classification Scheme
IEEE Trans. on
for Land App lications of Polarimetric SAR [ J ].
Geoscience and R em ote S ensing, 1997, 35 (1) : 68—78.
[ 10 ] H su C W , L in C J. A Comparison of Methods for Multi - class
IEEE Trans. on N eu ra l N etw orks,
Support Vector Machines[ J ].
2002, 13 (2) : 415—425.
[ 11 ] Lee J S, Grunes M R, Pottier E. Quantitative Comparison of
Classification Capability: Fully Polarimetric Versus Dual and
Single
R em ote S ensing, 2001, 39 (11) : 2343—2351.
polarization SAR [ J ].
IEEE Trans.
on Geoscience and
2
2
2
2
吴永辉等 :利用 SVM 的全极化 、双极化与单极化 SAR图像分类性能的比较
2
2
53
2
第 1期
Com par ison of C la ssif ica tion Performance of Full
, D ua l
and
S ingle
Polar iza tion SAR Images Using SVM
( College of E lectronics Science and Eng ineering, N ationa l U niversity of D efense Technology, Hunan Changsha 410073, Ch ina)
WU Yong
hui, J I Ke
feng, YU W en
xian
Abstract: Classification is an important p rocess in interp retation of SAR images.
as amp litude, phase and texture,
shows directly classes of terrains, which is helpful to understand image.
the information, such
is used to arrange all p ixels in an image into different classes. A classification map
In classification,
Classification methods of SAR images can be divided into supervised and unsupervised. Support vector machine
It is used
writing identification, and automatic target recognition for good classification performance
It has been a new focus in the field of machine learning. Several researchers have tried to
( SVM ) based on statistical learning theory, p roposed by Vapnik et al. ,
widely in face recognition, hand
with small training data sets.
use SVM for classifying polarimetric SAR images, and obtained p rom ising results.
is an effective supervised classifier.
A s an advanced instrument for remote sensing, polarimetric synthetic aperture radar ( SAR) has been app lied widely
in many fields, such as ecology, environmental monitoring, geological exp loration, vegetation investigation, and so on.
Compared with single
polarization and fully polarimetric SAR s can imp rove in
classifieation is important. Classification performance of full polarization versus dual and single polarization is compared
qualitatively and quantitatively with SVM taken as the classifier in this paper.
to what extent dual
polarization SAR,
For fully polarimetric SAR data,
six power values, extracted from the covariance matrix, and three eigenvalues,
obtained by eigenvalue analysis technique using the coherency matrix, are contained in an input feature vector. For dual
there are only three power values and two eigenvalues. And only one power value is used as an input
polarization data,
feature for single
polarization data.
In order to equilibrate effect of each element in an input feature vector on classification
results, all features are normalized. According to the ground truth or a span image,
training samp les are selected to train
SVM to obtain classifier parameters. Lastly, full
polarization SAR images are classified by the trained
SVM , and the classification accuracy is calculated if the ground truth is available.
, and single
, dual
In the first experiment, an L
polarization SAR, and it is lowest for single
is used to analyze quantitatively the classification accuracy of full
band fully polarimetric image of Flevoland, Netherlands, acquired by the NASA /JPL
, and
A IRSAR sensor on August 16, 1989,
polarization SAR data. The results show that the classification accuracy of fully polarimetric SAR is highest,
single
the accuracy of HH
followed by dual
If fully polarimetric
VV SAR is greater than other two dual
SAR is unavailable, HH
VV SAR is a p roper substitute with accep table performance. Because of stronger depolarization
capability, separability of each terrain in HV data is better than that in the other two cases. Consequently, classification
accuracy of HV SAR is better than other two single
polarization SAR s, performance of
HH SAR is better than another.
polarization SAR. For crop app lication,
polarization SAR s, comparable with fully polarimetric SAR.
polarization transm itter and receiver are used, HH is more p roper.
polarization SAR s. For the two co
If the co
, dual
In the second experiment, an HH
is used to analyze qualitatively
classification performance of dual
polarization SAR s. The experimental results show that scattering power of
building is badly confused with that of bank and bare soil due to weak depolarization of building. Thus the classification
result of HV SAR is worse than HH SAR.
polarization image, obtained in China,
and single
HV dual
Lastly, using detailed results of the above two experiments, classification performance difference of full
, and
polarization SAR s is exp lained from the point of view of scattering characteristics of terrains and operational
, dual
single
mechanism of the classifier, SVM.
Key words: radar polarimetry; synthetic aperture radar( SAR) ; classification