中国科技论文在线
http://www.paper.edu.cn
基于 MOD13A2 数据的长三角区域土地覆
盖类型变化研究
邓力琛,刘寿东,赵小艳
(南京信息工程大学大气环境中心,南京 210044)
摘要:本研究利用 MOD13A2 产品的 NDVI 数据,构建决策树分类方法,获得长三角地区
2003—2013 年的土地利用/土地覆盖(LULC)分类图,在此基础上分析了长三角地区近 11
年 LULC 的时空变化特征。结果表明:1)通过分析各 LULC 类型的年变化特征构建的决策
树分类模型,能较高精度完成研究区的 LULC 分类,基于 2003 年 Landsat ETM+数据分类结
果验证,总分类精度达 86.09%,Kappa 系数为 0.75。2)2003—2013 年长三角地区耕地、林
地、水体和建设用地面积占比分别在 47.08%~54.2%、28.9%~32.45%、4.82%~4.91%、
11.64%~15.67%之间变化;其中,林地面积年平均增长 1.35%,建设用地年平均增长 3.35%,
耕地面积年平均减少 1.45%,水体面积变化较小。3)各 LULC 类型面积的年变化率与统计
年鉴数据相比,林地高估,其它 LULC 类型相差不大,这也进一步揭示该分类方法在长三
角区域进行 LULC 变化监测具有可行性。
关键词:土地利用/土地覆盖;NDVI;MOD13A2;决策树分类
中图分类号:X87 文献标志码:A
Study on the change in land cover of Yangtze River Delta
based on MOD13A2 data
(Yale-NUIST center on Atmospheric Environment, Nanjing University of Information Science &
Deng Lichen, Liu Shoudong, Zhao Xiaoyan
Technology, Nanjing 210044, China)
Abstract: In this paper, the Land-Use and Land-Cover (LULC) in Yangtze River Delta from 2003 to
2013 were examined by building the classification decision tree and using the NDVI data of
MOD13A2. The results indicated that the Landsat ETM+ data in 2003 was used to evaluate the
accuracy of the classification methods. The overall classification accuracy of the decision tree was
86.09%, and Kappa coefficient was 0.75. The areas of farmland, forest land, water, and construction
land changed in 47.08% ~ 54.2%, 28.9% ~ 32.45%, 4.82% ~ 4.91%, and 11.64% ~ 15.67%,
respectively, from 2003 to 2013. The growth rates of forest land area and construction land area were
1.35 and 3.35%/a, respectively, while farmland area decreased markedly and water area was almost
similar. By comparing the classification image and statistics data, it was found that forest land was
overvalued and the other LULC types were similar, which proved that the classification method used
for LULC monitoring is feasible.
Key words: LUCC; NDVI; Yangtze River Delta; decision tree classification
全球环境变化问题中,土地利用/土地覆盖(LULC)变化是自然与人文过程交叉最为密切
的问题之一。研究LULC变化,可以反演气候与人类活动等驱动因子的影响程度;同样,研
究LULC变化对气候变化的反馈作用有助于提高预测全球变化对陆地生态系统的影响能力
[1-2]。不同尺度的LULC变化研究在分析人类活动对于生态环境的作用及自然界的反馈作用方
面具有重要的意义。
20世纪90年代末,卫星遥感技术在全球和区域尺度的LULC研究中取得了重大进展,产
生了一系列全球土地覆被产品。但由于早期常用的大尺度范围遥感LULC分类系统主要是基
于全球范围多种土地覆盖的分类,其分类结果在区域性研究中存在空间分辨率低、误分较多
基金项目:南京信息工程大学大学生实践创新训练计划项目(201410300106)
作者简介:邓力琛(1988—),男,硕士研究生,主要研究方向为资源遥感
通信联系人:刘寿东,教授,主要研究方向为城市气象、生态环境气象,lsd@nuist.edu.cn
-1-
中国科技论文在线
http://www.paper.edu.cn
的问题[3]。研究者在研究区域LULC变化时,需结合区域特点利用不同方法进行重新分类[4]。
目前常用的LULC分类方法有监督分类和非监督分类2种,监督分类由于系统考虑了已
知训练样本,分类精度一般高于非监督分类。监督分类中的决策树方法,因其具有直观、灵
活、思路清晰、运算效率高等特点,在LULC分类中占有绝对优势,被广泛应用。本研究选
用决策树分类方法,基于滤波后的NDVI数据对长江三角洲三省一市(江苏省、安徽省、浙
江省、上海市)近10年LULC的时空演变特征进行分析,希望能生成该区域较为精确的LULC
产品,为进一步研究LULC变化对区域气候、环境等的影响奠定基础。
1 研究区域
长江三角洲是我国经济最发达区域之一,根据国务院2010年批准的《长江三角洲地区区
域规划》,长江三角洲包括上海市、江苏省和浙江省。考虑到安徽省与长江三角洲地区自然
地理及气候条件相似,且正以“井喷”式的经济发展加速融入长江三角洲经济区[5],故参考
2006年住建部在《长江三角洲城镇群规划中》中对长三角区域的定义,本文将江苏省、安徽
省、浙江省和上海市三省一市定义为长三角研究区域,其地理坐标为27.15o~35.16o N,
114.89o~122.95o E,面积约为35.2 万km2,总人口约为2.27 亿人。气候上,该地区属亚热带
湿润季风气候,年均气温14~17 ℃, 年降水量900~1 600 mm。地貌上,该区域东北部以平
原为主,西部和南部多山地和丘陵。植被生长方面,东北部主要为耕地,西南部主要为林地,
且多为次生林。研究区域的地理位置见图1。
图1 研究区域的地理位置图
2 数据来源及处理
2.1 数据来源
本研究用于土地利用分类的遥感数据为美国LPDAAC提供的MODIS植被指数产品
MOD13A2,其为16d合成产品,空间分辨率为1 km,内容包括归一化植被指数(NDVI)和
增强型植被指数(EVI)。有研究表明,EVI能较好反映植被冠层结构;NDVI对叶绿素含量
更加敏感,更能反映植被长势信息[6-8]。故根据研究需要,本文选用2003—2013年共11年253
-2-
中国科技论文在线
http://www.paper.edu.cn
景NDVI图像进行LULC分类;选用2003年空间分辨率为30m的Landsat ETM+无云数据进行分
类方法精度验证,选用2003—2013年中国统计年鉴的LULC数据[9]进行分类结果对比,其他
辅助数据还包括中国县界行政区划矢量图、1︰100万中国植被图集[10]。
2.2 数据处理
对MOD13A2产品NDVI数据的预处理内容包括:1)使用MRT和MODISTOOL软件对图
像进行地理信息添加和拼接的批量处理;2)使用ENVI软件对每年23景的NDVI影像的层叠
加和矢量裁剪处理;3)使用TIMESAT软件对NDVI时间序列数据进行滤波处理。在此仅介
绍NDVI时间序列数据的滤波处理,其他预处理内容不赘述。
有研究表明,MOD13A2产品的NDVI数据虽已经做过最大值合成法(MVC)处理,消
除了部分噪音,但云、大气气溶胶和低太阳高度角等仍会降低到达传感器的近红外波段地表
反射,导致NDVI值突降,这会大幅度降低使用该数据进行LULC分类的精度,所以NDVI数
据应用前必须进行滤波处理[11-12]。目前对NDVI时间序列的滤波方法主要有Jönsson等[13-14]提
出的非对称高斯滤波(AG)、S-G滤波和Beck等[15]提出的双重逻辑函数滤波(DL)。考虑到S-G
滤波在保证时间序列数据的波形和波高方面有较大优势,本研究选用TIMESAT软件中耦合
的S-G滤波法[16]对NDVI时间序列进行滤波处理。S-G滤波是Savizky和Golay1964年提出的一
种运用最小二乘卷积拟合方法来平滑和计算一组相邻值的函数。基于S-G滤波原理,NDVI
时间序列的滤波过程可描述为下公式:
Y
*
j
m
i m
C Y
i
j
N
1
式中: 为合成序列数据,
原始序列数据, 为滤波系数,N为滑动窗口所包括的数
据点(2m+1)。
图2展示了研究区中耕地及林地区内单个像元2003—2005年NDVI时间序列滤波前后效
果。从图2中可以看到,S-G滤波方法在保证波高及波形的同时,能够消除不合理的突降点,
这对利用NDVI时间序列产品进行LULC分类时降低分类误差具有重要意义。
图2 利用S-G滤波方法对不同植被类型的NDVI值滤波前后对比
-3-
中国科技论文在线
3 LULC 分类试验
3.1 分类方法选择
http://www.paper.edu.cn
决策树分类法是基于遥感图像数据及其他空间数据,通过专家经验总结、数学统计和归
纳等,获得分类规则后使用条件判断进行分类的方法,具有分类结构简单明了、可操作性强、
可结合多源数据、分类标准统一等特点,而且能快捷、准确地自动识别地类信息提高分类的
效率和准确性。
本文在制定长三角LULC分类系统时参考:IGBP全球土地覆盖分类系统;美国USGS土
地覆盖分类系统;中国科学院的“中国土地资源分类系统”。最终把研究区土地覆盖类型分为
4大类:林地(包括各种果园种植地);水体(长江、境内河流、湖泊、养殖场等);耕地;
建设用地(房屋、道路、各类建筑等)。分类过程中用到的分类变量为:NDVI时间序列、
NDVI值(年平均、年最大值、生长季(生长季定义为每年4—10月)平均值)、生长周期(生
长期的开始、生长期的结束、生长期长度),目标变量为耕地、建设用地、林地、水体。
3.2 典型 LULC 类型的 NDVI 特征
基于遥感影像进行LULC分类研究时,研究者主要是通过对遥感影像上各种地物的光谱
信息进行分析,将像元分别划分为不同的地物类型,因此地物的光谱特性是LULC分类的主
要判别依据[17]。但是各分类光谱特征对不同地物类别具有不同的分离度,往往在提高某些
类别的分离性时,有可能降低了其他类别的分离性[18]。而通过分析一年中不同地物类型的
NDVI受环境、气候及人为活动的影响所产生不同的变化,可以提取更多的专业知识运用于
土地覆盖的分类中。
本研究以1︰1 000 000中国植被图集为采样基准数据,本着采样数量适中的原则,将
MODIS13A2产品NDVI数据,合成月平均数据,并基于该时间序列数据集计算了全年NDVI
最大值(Nmax)、平均值(Nmean)和生长季平均值(Ngrowth)。图3是研究区域中几种典型土
地覆盖类型的NDVI时间序列曲线图。从图3可以看到,水体的NDVI值全年最低,在0.1附近
上下波动;建设用地的NDVI值年变化呈单峰型,但最大值低于0.6;林地的NDVI值全年均
高于其他土地覆盖类型,且年变化呈单峰型,最高值出现在7、8月;耕地区域NDVI值的年
变化呈双峰型曲线特征,一般4月出现第一个峰值,8月出现第二峰值,这一特征是提取耕地
区域的重要信息依据。
图3 研究区域中不同LULC类型NDVI值时间分布
-4-
中国科技论文在线
3.3 决策树模型构建
http://www.paper.edu.cn
决策树分类是先对典型地物样本特征进行归纳生成分类规则后,再进行分类的方法。本
研究在构建决策树模型时考虑到农作物耕种的时节不同、作物生长周期的差异以及水体富营
养化较严重等一系列区域特点,在对研究区不同时相的NDVI数据进行分析、判读,对典型
地物的波谱分析以及反复试验后,确定决策树分类阈值及规律如下(NX表示单像元一年内23
景影像的第X时相的NDVI值):
1)水体提取:一般情况下各典型地物的NDVI值应呈现水体<建设用地<植被的关系,
但研究区域的水体富营养化严重,仅在冬季水生植被及藻类较少,所以通过对各典型地物的
NDVI直方图分析,确定N1=0.1为水体与其他LULC类型的区别阈值,即一月N1<0.1的为水
体。
2)建设用地的提取:一月N1≥0.1、NDVI全年的最大值Nmax<0.65且生长季NDVI平均值
Ngrowth<0.54的区域为建设用地。
3)林地与耕地的提取:研究区域的林地以常绿林为主,NDVI值全年都保持在较高值,
且呈正态分布。在区分林地与耕地的分类试验中,主要运用的是农作物返青时NDVI值急剧
上升以及作物成熟、收割后NDVI值突降的特点。研究区的主要作物为水稻、冬小麦、玉米、
油菜和薯类,研究区内的北部一季主要播种冬小麦和油菜,一般10月播种,翌年3—4月返青,
5月底至6月初收获,随之种植夏玉米、薯类及水稻等秋收作物,9月底10月初收获;研究区
内的南部以一年两季水稻为主,早稻4月中旬播种,5月初插秧,7月下旬收割,随后晚稻插
秧,10月下旬至11月收割。利用上述植被生长南北差异的规律确定:当Nmean<0.59,且
(N16-N21)>0.3或(N7-N10)>0.22或(N10-N13)>0.21的为耕地区域,其余为林地。
根据以上分类决策,建立的决策树规则见图4。
图4 决策树规则模型
在进行遥感分类时,会产生一些很小的图斑,无论是从专业制图还是从实际运用的角度,
都应该对这些图斑做相应的剔除处理。Muchoney在对中美洲地区进行植被与土地覆盖分类
制图研究中就发现,对分类后图像进行低通滤波去除孤立像元会使得整体分类精度提高
2%[19],所以在本研究中采用2×2窗口对分类后得到的图像进行低通滤波处理,消除小图斑的
影响。
4 分类结果与精度评价
4.1 分类结果
-5-
中国科技论文在线
http://www.paper.edu.cn
运用决策树分类规则对 2003—2013 年 11 年数据进行 LULC 分类。图 5 是研究区 LULC
的空间分布图。考虑到邻近年份 LULC 变化较小,本文仅给出具有一定时间跨度的 2003、
2008、2011 和 2013 年的分类结果。
图5 2003、2008、2010和2013年土地覆盖分类结果图
从图 5 可以看出:研究区内的北部以耕地为主,南部以林地为主,建设用地多集中在中
东部,且建设用地随时间呈明显星形发散增长,尤以太湖流域、长江两岸增加最为显著,更
多取代了城市周边的耕地区域,如 2003 年建设用地占研究区面积的 11.64%,2013 年上升为
15.67%,而耕地则由 2003 年的 54.08 %下降为 47.08%,这与近十年长三角地区的快速城市
化发展密切相关。另外,林地在安徽西部地区的增加最为明显,水体整体变化不大。统计研
究区耕地、林地、水体和建设用地 4 类 LULC 类型的 11 年平均面积占比依次为 51.46%,
30.26%,4.87%,13.41%。
为了分析研究区各LULC的年际变化趋势,图6以2003年各LULC类型占有面积为基数,
分别计算了2004—2013年各年4种LULC类型的增长率。由图6可见,11年来,建设用地增加
明显,尤以2007年后增加更为迅速,2013年较2003年增加了34.6%,相应的耕地面积下降较
为突出,2013年较2003年下降了13.1%;林地面积也略有增加,11年增加了10.6%;水体面
积变化不显著。计算建设用地和林地面积的年平均增长率,可以分别达到3.35%(R2=0.93)
和1.35%(R2=0.76),均表现为极显著的增加;耕地面积年平均下降率为1.45%(R2=0.88),
也通过0.001水平显著性检验。另外,图6也显示,各LULC类型的增减趋势年际间有波动,
甚至出现不合理的升降,如2006年的耕地面积异常上升,林地面积大幅下降;建设用地在2009
年出现下降,2010年又出现突增,这主要是因为分类时为保持对比的一致性,11年均使用相
同的分类规则,但各年间数据质量存在一定的差异性,所以存在个别年个别LULC类型的错
分较多。
-6-
中国科技论文在线
http://www.paper.edu.cn
图6 研究区域内不同LULC类型面积的年际变化
4.2 分类精度评价
宏观土地覆盖分类精度验证是十分复杂的问题,目前常用的验证方法有两类:1)实地
采样法;2)运用高分辨率影像解译结果验证法。对于大范围的LULC分类,实地采样成本
较高,且实施困难较多,一般使用较少。Klöditz等[20]认为以高分辨率遥感影像为参照进行较
低分辨率影像的土地覆盖分类结果验证是一种高效而节省的方式。本研究参考徐永明等[21]
在2007年对长三角地区土地覆盖分类研究中采用的方法,利用Landsat ETM+影像对分类结果
进行验证,验证步骤是:首先在Landsat ETM+影像上定义各LULC类型的训练样本,即感兴
趣区域(ROI),每个训练样本均在至少5×5窗口大小的纯LULC类型区提取。然后转化为
MODIS对应的ROI文件,尽量减少尺度转换后的误差。最后,计算两种数据分类结果的混淆
矩阵。以2003年为例,其混淆矩阵见表1,可以得到基于MODIS NDVI产品数据的总分类精
度为86.09%,Kappa系数为0.75。另外,从表1中也可以看出,各LULC类型的分类精度差别
较大,耕地和水体分类精度较高,其用户精度分别达89%和98.4%,但林地和建设用地分类
精度较低,用户精度分别为75.9%和75.5%。这主要是因为长三角的建成区区域地貌类型空
间分布较复杂,城市建成区注重绿化效果,建设用地与林地和周边耕地混杂分布,混合像元
较多,加大了分类难度,降低了分类精度。但总体上,各LULC类型的分类精度基本能满足
研究需求。
表1 2003年混淆矩阵计算评价结果
建设用地
地物
耕地
林地
水体
建设用地
合计
耕地
2 060
111
0
128
2 290
90
林地
75
349
0
2
426
81.9
水体
0
0
306
5
311
98.4
180
0
5
417
602
69.3
合计
2 315
460
311
552
3 638
用户精度/%
89
75.9
98.4
75.5
生产者精度/%
为了进一步评价逐年的分类结果,本文对比了遥感监测的各LULC类型所占面积的平均
年变化率结果和长三角地区的年鉴统计结果,见表2。表2中显示,遥感监测方法对于林地面
积的平均年变化率存在较明显高估,对于建设用地面积的年变化率略有低估,与年鉴统计结
果仅相差0.16%;耕地面积的年变化率两种数据的结果相差居中,为0.34%。遥感数据高估
林地面积的平均年变化率,主要是其对城市内部及边缘的林地有过高估计,分类过程中易将
林地与耕地、林地与建设用地的混合像元划分为林地。水体面积变化不大故未列于表中。
-7-
中国科技论文在线
http://www.paper.edu.cn
表 2 各 LULC 类型面积的平均年变化率的遥感监测结果与统计数据对比
数据来源
统计数据
遥感监测结果
林地
0.63
1.35
年变化率/%
耕地
-1.11
-1.45
建设用地
3.5
3.34
5 结论与讨论
本文对长三角地区 MOD13A2 产品的 NDVI 数据进行 S-G 滤波后,利用决策树分类方
法进行了 LULC 变化研究,得到以下结论:
1)在保证分类制图精度,牺牲分类系统多样性的前提下,将分类系统定为 4 种主要的
LULC 类型,获得了 2003—2013 年共 11 年的研究区 LULC 分类图。通过多种方法进行分类
精度的验证表明,运用研究区滤波后的 NDVI 时间序列进行 LULC 分类,能显著提高分类
精度,分类结果能满足长时间序列 LULC 变化研究的需求。
2)长三角地区 4 种 LULC 类型的空间分布特征明显,研究区内北部以耕地为主,南部
以林地为主,建设用地多分布在长江两岸和中东部地区。2003—2013 年 11 年间 4 种 LULC
类型在研究区的面积占比变化范围分别为:耕地 47.08%~54.2%、林地 28.9%~32.45%、水体
4.82%~4.91%、建设用地 11.64%~15.67%。以各 LULC 类型在 2003 年的面积为基数,计算
各类型到 2013 年 11 年占有面积的总变化率分别为:耕地减少 13.1%;建设用地增加 34.6%;
林地增加 10.6%;水体基本无变化。对比遥感监测结果与统计数据的差异发现:在长三角区
域使用空间分辨率为 1 km 的 MODIS NDVI 产品数据监测耕地和建设用地面积的年变化效果
较理想,但对林地的监测效果较差,这也说明使用空间分辨率较低的遥感数据在 LULC 类
型较为破碎的区域进行分类,往往精度较低。
3)本研究的分类后处理仅进行了 2×2 窗口的低通滤波,去除孤立像元,未做其他处理。
构建的决策树分类模型在本研究区域取得较好分类效果,该模型在其他区域是否适用还有待
进一步验证。决策树训练样本选取数目的多少是否对分类精度产生影响,统计数据的准确性
等问题,在以后的研究中都需要重视。
[参考文献] (References)
[1] 史培军, 宫鹏, 李晓兵, 等. 土地利用/覆盖变化研究的方法与实践[M]. 北京: 科学出版社, 2000: 1-3.
Shi Peijun, Gong Peng, Li Xiaobing, et al. Method and practice of land use/land cover change [M]. Beijing:
Science Press, 2000: 1-3. (in Chinese)
[2] 张新荣, 刘林萍, 方石, 等. 土地利用、覆被变化(LUCC)与环境变化关系研究进展[J]. 生态环境报, 2014,
23(12): 2013-2021.
Zhang Xinrong, Liu Linping, Fang Shi, et al. Research advances on the relationship between land use/cover
change and environmental Change [J]. Ecology and Environmental Sciences, 2014, 23(12): 2013-2021. (in
Chinese)
[3] 刘爱霞, 王静, 吕春艳. 基于 MODIS 数据的北京西北部地区土地覆盖分类研究[J]. 地球科学进展, 2005,
25(2): 96-97.
Liu Aixia, Wang Jing, Lü Chunyan. Land cover classification based on MODIS data in area to the north-west of
Beijing [J]. Progress in Geography, 2006, 25(2): 96-102. (in Chinese)
[4] 严应存, 校瑞香, 肖建设, 等. 青海省巴音河流域 LUCC 遥感调查及驱动分析[J]. 中国沙漠, 2012, 32(1):
276-283.
Yan Yingcun, Xiao Ruixiang, Xiao Jianshe, et al. Remote sensing monitoring and driving factor analysis on land
use and land cover changes of Bayin River Basin in Qinghai Province [J]. Journal of Desert Research, 2012, 32(1):
276-283. (in Chinese)
[5] 林博鸿, 吴烨. 长三角地区汽车能源消耗与 CO2 排放研究[J]. 中国科技论文在线, 2010, 5(6): 476-480.
Lin Bohong, Wu Ye. Oil consumption and CO2 emissions from automobile sector in Yangzi River Delta Region of
China [J]. Sciencepaper Online, 2010, 5(6): 476-480. (in Chinese)
[6] 何月, 樊高峰, 张小伟, 等. 浙江省植被 NDVI 动态及其对气候的响应[J].生态学报, 2012, 32(14):
-8-