logo资料库

基于R语言的京津冀各区县人均GDP空间统计分析.pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
收稿日期:2015-05-20基金项目:华北科技学院”煤矿安全评价数学方法研究(创新团队)”(项目编号:3142014127)建设和华北科技学院重点学科应用数学(项目编号:HKXJZD201402)项目基金的资助。作者简介:谭立云(1966-),男,湖南益阳人,华北科技学院基础部教授,研究方向为智能计算、数据统计分析,Email:420229631@qq.com。基于R语言的京津冀各区县人均GDP空间统计分析谭立云1,李强丽1,谭龙2(1.华北科技学院基础部,北京东燕郊101601;2.武汉大学经济与管理学院,湖北武汉430072)摘要:运用R软件对2012年京津冀43个区县人均GDP进行了空间统计分析。结果显示:整体上京津冀人均GDP没有关联性,局部而言,天津的滨海新区、和平区、河东区表现出高值被高值所包围,北京西城区表现出高值被低值所包围,河北邯郸、张家口表现出低值被低值所包围的集聚现象,从人均GDP的空间统计结果对京津冀区域经济做出了思考。关键词:京津冀一体化;人均GDP;空间统计学;Moran’sI指数中图分类号:F222.33文献标识码:A文章编号:1672-7169(2015)03-0105-06SpatialStatisticsAnalysisofRJGDPfoBeijingTianjinandHebeiBasedonRTANLi-yun1,LIQiang-li1,TANLong2(1.TheDepartmentofBasicScienceofNCIST,Yanjiao,101601,China;2.EconomicsandMagagementSchoolofWuhanUniversity,Wuhan,430072,China)Abstract:43citydistrictsandcountiesofBeijingTianjinandHebei2012averageperpersonGDPareanslys-isedusingtherealizedmethodinRanditspackages.TheresultshowsthatRJGDPisnocorrelationonthewhole,andintermsoflocal,BinHainewarea,HePingareaandHeDongareaShowshighvaluesurroundedbyhighvalues,XiChengareaShowshighvaluesurroundedbylowervalues,HanDanandZhangJiaKouShowslow-ervaluesurroundedbylowervalues,finlly,webringforwardsomeadvicesaccordingtotheanalysis.Keywords:IntegrationofBeijingTainjinandHebei;RJGDP;Spatialstatistics;IndexofMoran’sI0引言回顾30多年改革开放的历史,我们发现珠江三角洲依靠着香港的产业转移和优惠政策在20世纪80年代实现了经济腾飞,长江三角洲依靠上海的经济中心地位、浦东的开发和民营经济的发展成为20世纪90年代引领中国经济发展的火车头[1]。京津冀地区凭借优越的城市发展平台,无与伦比的政策、资源、人才、技术优势,其经济发展近几年突飞猛进,终于将“珠三角”和“长三角”甩在了后面。2003年,北京、天津的人均GDP分别为31613元和25874元,远低于上海的46718元,而河北省的人均国内生产总值为10508元,到2012年,天津、北京人均GDP分别达到了95093元和88167元,高于上海的85644元,但河北仅36700.75元,在发展的同时我们也看到了京津冀三地极不对等的地位。习总书记多次提出京津冀一体化建设的重要性,2015年2月10日上午,习总书记主持召开了中央财经领导小组第九次会议,会上总书记指出,疏解北京非首都功能、501第12卷第3期2015年6月华北科技学院学报JournalofNorthChinaInstituteofScienceandTechnologyVol.12No.3Jun.2015中国煤炭期刊网 www.chinacaj.net
推进京津冀协同发展,是一个巨大的系统工程,目标要明确,通过疏解北京非首都功能,调整经济结构和空间结构,走出一条内涵集约发展的新路子,促进区域协调发展,形成新增长极。总书记高瞻远瞩,北京只有与天津、河北等周边地区协同发展才能"瘦身健体"走内涵式发展道路,只有把河北带动起来了才能形成新的增长极。利用人均GDP分析区域经济是一种常用的方法[2],本文利用探索性空间数据分析方法对京津冀各区县的人均GDP进行关联分析,并利用分析结果对京津冀今后的经济发展提出些有益的建设性意见。探索性空间数据分析是一种具有识别功能的空间数据分析方法,主要用于探索一些变量的空间关联性和集聚现象。某一个变量在空间上发生集聚,意味着在一定区域内,这一变量在各个地域单元之间具有自相关性,空间自相关性可以看作是一种反映集聚现象的测度[4-5]。1空间统计分析空间数据是“位置+属性”的组合,地理单元间的空间结构关系一般通过空间权重矩阵来表达,空间权重矩阵表达了各空间单元之间的邻近关系。它是一个二维矩阵,如研究空间有n个单元,则空间权重矩阵W可以表示如下:W=w11w12…w1nw21w22…w2nwn1wn2…wnn(1)式中,W中的元素wij=1,当地区i和地区j相邻0,当地区i和地区j{不相邻为了计算空间滞后值,常常需要将空间权重矩阵进行标准化,使得每一行的权重之和为1。一般来说,地理距离近的现象或单元之间,将存在某种联系,从而使得它们的观测值呈现某种相关性。空间自相关即为测量邻近事物关联强度的方法与指标。空间自相关有全局和局部两种,全局空间自相关用来分析整个区域关联性,描述的是研究空间范围内所有单元的整体空间关系,常用全局莫兰(Moran)指数I和格里(Geary)指数C。局部空间自相关则是描述某空间单位为中心的空间自相关值,常用指数是局部莫兰(Moran)指数I和局部格里(Geary)指数C。在全局指标不显著的情况下,有可能存在显著的局部空间自相关,而在全局指标显著的情况下,也有可能存在不显著的局部空间自相关。1.1全局空间自相关性指标莫兰1950年提出了全局自相关莫兰指数I,它是最早应用于检验空间关联性和集聚问题的指标,反映了整个研究区域内,各个地域单元与邻近地域单元之间的相似性,其计算公式为I=nΣni=1Σnj=1wij(xi-x)(xj-x)Σni=1Σnj=1w()ijΣni=1(xi-x)2(2)式中,x=1nΣni=1xi,xi为地区i的观测值,n为地区数,W=(wij)为空间权重矩阵。莫兰指数I取值介于-1与1之间,大于0表示正相关,值越大表明具有相似的属性集聚在一起(即高值与高值邻接、低值与低值邻接),小于0表示负相关,值越接近-1,表明具有相异的属性集聚在一起(即高值与低值邻接、低值与高值邻接),接近0,则表示属性是随机分布的,或者说不具有空间自相关性。对自相关性进行检验时,原假设是不存在空间自相关性,其统计量一般为标准化之后的莫兰(Moran)指数I,即ZI=I-E(I)Var(I槡)。通过正态分布和随机分布两种假设下得到I的数学期望和方差,并据此计算出ZI统计量,用来作为接受或拒绝零假设的依据。在正态分布假设下,莫兰(Moran)指数I的数学期望为En(I)=-1n-1,方差为Varn(I)=n2S1-nS2+3S20S20(n2-1)-E2n(I)(3)式中S0=Σni=1Σnj=1wij,S1=12Σni=1Σnj=1(wij+wji)2,S2=Σni=1(wi+wi)2,wi=Σnj=1wij,wi=Σnj=1wji。601华北科技学院学报2015年第3期中国煤炭期刊网 www.chinacaj.net
在随机分布假设下,莫兰(Moran)指数I的数学期望和方差分别为ER(I)=-1n-1,VarR(I)=n[n2-3n+3)S1-nS2+3S20]-b2[(n2-n)S1-2nS2+6S20]S20(n-1)(n-2)(n-3)-E2R(I)(4)式中S0,S1,S2同上,b2=nΣni=1(xi-x-)4(Σni=1(xi-x-)2)2。1.2局部空间自相关性指标安塞林1995年提出一个局部莫兰指数(简称LISA)用来检验局部地区是否存在变量集聚现象,地区单元i的局部莫兰指数定义为:Ii=(xi-x)Σnj≠iwij(xj-x)S20(5)式中S0,wij同上这个指数用来检验局部地区是否存在有高值或低值在空间上趋于集聚。Ii取值也在-1与1之间,正的Ii表示一个高值被高值所包围,或者是一个低值被低值所包围,负的Ii表示一个低值被高值所包围,或者是一个高值被低值所包围,全局Moran’sI值和局部Moran’sI值的关系为:I=1nΣni=1Ii1.3Moran’sI散点图Moran’sI散点图常用来研究局部的空间不稳定性,对空间滞后因子Wz和z数据对进行可视化的二维图示。Moran’sI散点图的四个象限分别对应于区域单元与其邻居之间四种类型的局部空间关系:第一象限代表了高观测值的区域单元被高值的区域所包围的空间关系,第二象限代表了低观测值的区域被高值区域所包围的空间关系,第三象限代表了低观测值区域单元被同是低观测值区域所包围的空间关系,第四象限代表了高观测值的区域单元被低值区域所包围的空间关系。2京津冀各区县人均GDP空间统计集聚性分析本文数据来源于北京市、天津市和河北省2013年统计年鉴,数据权威可靠。北京市的行政地区单元有:东城区、西城区等16个区县;河北省的行政地区单元有:石家庄市、承德市等11个市,天津市的行政地区单元有:和平区、河东区等16个区县,共计43个行政区县。分析软件是R[6-8],分析变量是JGDP(人均GDP),本文中仅计算了全局Moran’sI指数、局部Moran’sI指数和Moran’sI散点图,根据统计量来说明上述空间统计分析方法在确定、量化经济区域内存在的空间关联的有效性。2.1全局Moran’sI指数利用R软件,得到基于随机分布假设下的全局Moran’sI检验结果如下:表1基于随机分布假设下的全局Moran’sI检验结果表Moran’sItestunderrandomisationdata:RJGDPweights:gdpdwMoranIstatisticstandarddeviate=1.6448,p-value=0.05001alternativehypothesis:greatersampleestimates:MoranIstatisticExpectationVariance0.074041665-0.0238095240.003539249从表1可知,全局Moran’sI=0.074041665>0,伴随概率p=0.05001,在0.10水平下,拒绝零假设,即认为从整体来讲,存在空间正集聚现象,但在0.05水平下,接受零假设,即认为整体来讲,不存在集聚现象,可见,就算有集聚现象也是不明显的。利用R软件,得到基于正态分布假设下的全局Moran’sI检验结果如下:表2基于正态分布假设下的全局Moran’sI检验结果表Moran’sItestundernormalitydata:RJGDPweights:gdpdwMoranIstatisticstandarddeviate=1.5581,p-value=0.0596alternativehypothesis:greatersampleestimates:MoranIstatisticExpectationVariance0.074041665-0.0238095240.003943848701第3期谭立云等:基于R语言的京津冀各区县人均GDP空间统计分析中国煤炭期刊网 www.chinacaj.net
从表2可见,基于正态分布假设下得到的检验结果跟随机分析假设下结论一样。由此可见,京津冀三地整体而言,优势不是非常明显,没有出现显著的高值被高值包围的情况,说明北京、天津等虽然人均GDP在全国最高,但其内部区县之间也是不均衡发展的,差异较大,下面我们分析局部情况如何。2.2局部Moran’sI指数利用R软件,得到的京津冀三地43个行政区县地区的局部Moran’sI检验结果如表3所示。表3局部Moran’sI检验结果表序号区县IiE.IiVar.IiZ.IiPr.z...0.1通州区-0.0023490-0.02380950.00984690.21626681.00002昌平区0.1264926-0.02380950.02861430.88853221.00003大兴区-0.0354776-0.02380950.0126844-0.10360101.00004东城区-0.0359516-0.02380950.0126844-0.10780931.00005西城区-0.1500229-0.02380950.0137654-1.07575001.00006海淀区-0.0050190-0.02380950.01376540.16015641.00007朝阳区-0.0050518-0.02380950.01167550.17359651.00008房山区0.1007125-0.02380950.01752710.94056911.00009丰台区-0.0202546-0.02380950.01268440.03156441.000010石景山区0.0677707-0.02380950.02231480.61306301.000011门头沟区0.1060116-0.02380950.01899000.94206861.000012顺义区-0.1718070-0.02380950.0175271-1.11789011.000013延庆县0.0944657-0.02380950.03727620.61260091.000014密云县0.1154231-0.02380950.02861430.82309311.000015怀柔区0.0929508-0.02380950.02630450.71991311.000016平谷区-0.0182556-0.02380950.01073170.05361251.000017石家庄0.2123959-0.02380950.27499720.45042831.000018承德0.1820864-0.02380950.09213490.67832161.000019张家口0.4965156-0.02380950.86015630.56103010.574820秦皇岛-0.0887170-0.02380950.8601563-0.06998521.000021唐山0.0745770-0.02380950.03118080.55717511.000022廊坊-0.0711512-0.02380950.0116755-0.43813201.000023保定0.0522330-0.02380950.27499720.14500821.000024沧州0.1677138-0.02380950.07994410.67737411.000025衡水0.2858483-0.02380950.27499720.59049731.000026邢台0.3936576-0.02380950.27499720.79608270.852027邯郸0.4002887-0.02380950.86015630.45727530.647528和平区0.4544144-0.02380950.01617683.75998080.002329河东区0.5521245-0.02380950.01617684.52821460.000130河西区-0.0233242-0.02380950.01617680.00381551.000031南开区-0.1177475-0.02380950.0126844-0.83407611.000032河北区-0.1640120-0.02380950.0137654-1.19498231.0000801华北科技学院学报2015年第3期中国煤炭期刊网 www.chinacaj.net
续表序号区县IiE.IiVar.IiZ.IiPr.z...0.33红桥区-0.2111460-0.02380950.0126844-1.66336231.000034东丽区0.0847115-0.02380950.01899000.78750141.000035西青区0.0647097-0.02380950.01167550.81921731.000036津南区-0.0026116-0.02380950.02861430.12531451.000037北辰区0.0545920-0.02380950.01268440.69612771.000038武清区-0.0371676-0.02380950.0098469-0.13461471.000039宝坻区-0.0611527-0.02380950.0090157-0.39328811.000040滨海新区0.4905123-0.02380950.03404932.78728310.047841宁河县-0.0548560-0.02380950.0286143-0.18353581.000042静海县-0.0838075-0.02380950.0161768-0.47172751.000043蓟县-0.1265335-0.02380950.0107317-0.99160071.0000表中Ii是第i个地区单元的局部Moran’sI,E.Ii、Var.Ii、Z.Ii分别是Ii的数学期望、方差、标准化值,Pr.z...0是零假设的检验伴随概率p。从表3可知,天津和平区、河东区、滨海新区的p值小于0.05,而且有较大的正局部Moran’sI值,说明这三地与周边地区有相似性,且存在相对高值的集聚现象,邢台、邯郸、张家口三地的p值均小于0.95,说明与之邻接的地区有相似性,周边都是低值地区。其他区县的p值均为1,说明这些地区的观测值分布比较随机。从表3还可以得到,北京大兴区、通州区、平谷区与河北廊坊接临,它们的局部Moran’sI均为负值,说明虽然接壤,但因为行政归属不同,但人均GDP是不相似的,天津的武清区、津南区、静海县、蓟县、宁河县、宝坻区也与河北交界,它们的局部Moran’sI也均为负值,也说明虽然地域接壤,但大的行政归属不同,人均GDP不具有相似性,北京的房山区、门头沟区、怀柔区、密云县、延庆等局部Moran’sI均为正值,这些区县都与河北接壤,这些区县在北京也属于低值区,与相连的河北交界市没有表现出明显的差异,这与我们的传统观念是一致的。2.3局部Moran’sI散点图利用R软件,我们做出了局部Moran’sI散点图,见图1所示。图1局部Moran’sI散点图图中有重要影响的是天津滨海新区、河东区、和平区,北京的西城区,河北的邯郸市和张家口市,滨海新区、河东区、和平区均位于第一象限,这说明这三地具有较高的人均GDP值,而且与这相连的几个区也具有较高的人均GDP值,北京的西城区位于第四象限,说明西城区具有较高的人均GDP值,但周边的几个区具有较低的人均GDP值,河北的邯郸和张家口位于第三象限,说明这些地区的人均GDP较低,而且周边的区县也具有较低的人均GDP值,这些地方都属于河北省。第二象限是低值被高值所包围的区县,这些主要是接壤的一些区县,表现出不901第3期谭立云等:基于R语言的京津冀各区县人均GDP空间统计分析中国煤炭期刊网 www.chinacaj.net
同的特殊性。从散点图还可以看出来,天津市的发展比北京市的发展较好,天津的优势明显,相邻几个区都是高值区初步具有规模效应,发展比较均衡,而北京只有西城区是高值区,与之相邻的几个区与西城相比差别较大,说明北京的发展极不均衡,没有形成一种整体的优势,因此加强区县间合作,调整经济结构,抓住特色,突出特色大力发展,提高城市整体规模效应是北京今后发展中的一个重要方面。3结论从全局Moran’sI值和局部Moran’sI值来看,京津冀三地整体上没有表现出集聚现象,说明三地各区县间的发展都不均衡,或者说整体优势不够明显。但从局部来看,存在集聚现象,天津发展比较均衡,区县间协调发展较好,2012年人均GDP全国第一,北京发展不均衡,区县间协调发展不够好,我们还发现行政区域划分对经济发展影响非常大,交界地域人均GDP基本上不具有相似性,因此加强三地的协调关系,自觉打破“一亩三分地”意识,形成一种共同发展不仅利人而且利己的大局意识,特别是首都北京,必须真正积极参与到京津冀一体化建设的战略思路上来,消除局部小利益意识,贪大贪全、自我封闭对北京发展都是极其不利的,如北京、天津、河北对接的高速公路、国道、省道现在存在着非常多的“断头路”,再比如,最近广受社会关注的燕郊的问题。这个工作在北京、生活在燕郊的庞大群体有30万人,每天进出北京,现在仅仅有一条102国道,高峰的时候交通极为拥堵,虽然铁路交通部门有意在北京站与燕郊站开通专线,但由于时间不合理,还有去燕郊火车站很不方便等等,因此上座率非常低,另外,现在从天津到石家庄还没有高铁,这也为很多商旅人士带来了诸多不便。作者个人认为,交通上的“断头路”打通了,经济金融上的“断头路”打通了,社会保障上的“断头路”打通了,相当多的事情就会变成了一种市场行为,会自觉地去实现,而不需要政府强迫干预。参考文献[1]李曼.京津冀区域经济一体化发展研究[D].天津大学,2005.[2]熊永康.基于R语言的各省市人均GDP空间统计分析[J].科技信息,2013(25):92-93.[3]杨中庆.基于R语言的空间统计分析研究与应用[D].广州:暨南大学,2006.[4]王雪青,陈媛,刘炳胜.中国区域经济房地产经济发展水平空间统计分析[J].数理统计与管理,2014,33(1):59-71.[5]王怀亮.山东省农民人均纯收入空间自相关分析[J].合作经济与科技,2015(5):41-42.[6]王庆喜,等.区域经济研究实用方法:基于ArcGIS,GEODa和R的运用[M].北京:经济科学出版社,2014.[7]徐爱萍,舒红译.空间数据分析与R语言实战[M].北京:清华大学出版社,2013.[8]陈安宁.空间计量学入门与GeoDa软件应用[M].浙江:浙江大学出版社,2104.011华北科技学院学报2015年第3期中国煤炭期刊网 www.chinacaj.net
分享到:
收藏