logo资料库

基于地理加权回归的城市轨道交通客流分析.pdf

第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
资料共11页,剩余部分请下载后查看
中国科技论文在线 http://www.paper.edu.cn 基于地理加权回归的城市轨道交通 客流分析 # 严宇威,李嘉,鞠姿彦,赵振虎,余宏鑫,赵星** (河海大学土木与交通学院,南京市 210000) 摘要:为了揭示地理因素与城市轨道交通客流预测之间的联系,探究站点周围各项用地属性 对轨道交通客流的影响,本文利用南京地铁 AFC 数据,由圈层用地属性切入,同时考虑影 响客流的其他显著因素,用地理加权回归模型进行拟合分析。研究发现用地属性对客流造成 的影响会随着站点地理位置以及站间关系的改变而发生变化,呈现出一定的规律性。地理加 权回归模型对揭示各地铁站点的区位差异以及地铁站点间的聚散关系对客流造成的影响具 有重要意义,研究总结其规律可以对未来城市及轨道交通规划建设提供帮助。 关键词:城市轨道交通;客流分析;地理加权回归;用地属性 中图分类号:U12 Passenger Flow Analysis of Urban Rail Transit Based on Geographically Weighted Regression Yan Yuwei, Li Jia, Ju Ziyan, Zhao Zhenhu, Yu Hongxin, Zhao Xing (Civil and Transportation School, Hohai University, Nanjing 210000) Abstract: In order to reveal the geographical factors and the relationship between urban rail transit passenger flow forecast, explore the site-around land properties' influence on rail transit passenger flow, this paper using the Nanjing subway AFC data,considering layers of land property and the other significant factors influencing the passenger flow at the same time, using geographically weighted regression model fitting analysis.It is found that the influence of land use attribute on passenger flow will change with the change of site's geographical location and inter-station relationship, showing a certain regularity.The geo-weighted regression model is of great significance to reveal the location difference of subway stations and the influence of the accumulation and dispersion relationship among subway stations on passenger flow. Key words: urban rail transit;Passenger flow analysis;Geographically weighted regression;Land property 5 10 15 20 25 30 0 引言 35 城市轨道交通客流预测是确定城市轨道交通系统路网规模的重要参考依据[1],客流预 测结果直接关系到城市轨道长远规划的制定以及站点周边土地资源的开发和使用。 地理加权回归是一种有效探测空间非平稳特征的分析方法[2]。冯诚等人针对轨道客流问 题,提出基于灰狼优化算法与小波神经网络的城市轨道交通短时进站客流预测模型[3];孔祥 夫等人基于多元回归分析的直接估计模型在土地利用视角下对轨道站点客流进行预测[4]。J érémy Roos[5]等人提出了基于时空邻域条件的高斯算法学习模型对不完全数据的短期轨道 基金项目:国家级大学生创新创业训练计划项目 作者简介:严宇威(1999-),男,本科生在读 通信联系人:赵星(1986-),女,副教授、硕导,主要研究方向:应急疏散交通管理、城市轨道交通客流 特征分析与预测. E-mail: zhaoxing@hhu.edu.cn - 1 -
中国科技论文在线 http://www.paper.edu.cn 客流进行预测,侧面反映出地理因素对客流预测的重要性。 影响客流的因素诸多,精细化研究站点客流的影响因素对于建立轨道交通与土地利用长 效互动机制[6]具有重要意义。李国强等人基于南京轨道交通运营客流 AFC 数据和网络爬取 的 POI 数据,将车站客流影响因素划分为土地利用、公共交通接驳和车站属性因素三大类[7]。 已有研究表明城市轨道站点客流量与周边土地利用情况密切相关[8],站点周边土地开发强度 的提高能为轨道站点吸引更多客流,而客流量的增加也能促进周边土地开发[9]。 地理加权回归模型作为空间统计学中的空间变异系数回归模型可以很好地处理空间异 构现象的问题,那如何从地理加权的角度筛选与客流量显著相关的因素呢?Cardozo[10]等人 以土地使用组合等作为核心变量,结合马德里 190 个站点数据进行地理加权回归分析。 Blainey 和 Mulley[11]利用地理加权回归模型(GWR)对悉尼 297 个站点的客流数据进行拟合, 研究发现站点等因素与 cbd 距离等因素显著相关。马晓磊[12]等人通过北京地铁客流量数据, 采用地理加权回归模型定量计算回归方程,详细分析了客流与用地之间的相关系数在空间的 分布情况。 本文从城市轨道交通客流量与影响因素的关系分析方面着手,采用网络客流评估预测方 法[13],研究地理加权回归模型中自变量和因变量之间的关系,利用地理加权回归模型进行 回归拟合,充分发挥站点客流与站点周边土地利用交互关系[14],试图最大意义上发挥轨道 交通支撑和引领城市发展作用。 40 45 50 1 数据描述 55 1.1 数据来源 本文结合南京地铁 113 个站点的 AFC 数据,获取工作日早高峰出站客流,综合探究站 点特性因素以及站点周围各项用地属性与客流之间存在的内在联系。 考虑到城市土地利用反映城市布局的基本形态和城市功能区的地域差异,本文将用地属 性分为了居住、商业、办公、工业、医院、学校、交通枢纽、公共用地八种用地类型。将居 60 住用地细分为别墅区(1 到 2 层楼房,用住宅 a 表示)、中层住宅区(3 到 7 层楼房,用住 宅 b 表示)和高层住宅区(8 层及 8 层以上楼房,用住宅 c 表示);考虑到是否寄宿,将学 校用地细分为中小学(用学校 a 表示)和大学(用学校 b 表示),共计 11 类土地属性。在用 地面积测量的过程中,选取南京市地铁站点周边 1500m 作为测量范围,以城市轨道站点为 圆心,以 250m 作为间隔分圈层进行测量,分别画出 250m、500m、750m、1000m、1250m、 65 1500m 半径的圈层,即共计 66 个土地属性变量。 1.2 Map 生成 本文在原始数据处理基础上,搜索查找 GCS_WGS_1984 坐标系下的各站点坐标以及南 京市边界矢量图(如图 1 所示),导入 ArcMap 构成本文的研究区域(如图 2 所示)。 - 2 -
中国科技论文在线 http://www.paper.edu.cn 70 图 1 南京市边界 图 2 南京地铁站点 Fig 1 Nanjing boundary Fig 2 Nanjing subway station 由于多点要素(本文为站点要素)无法构建地理加权模型,因此需要将多点要素转化为 面要素以实现模型构建。而“泰森多边形”具有依据点位构建面要素以及数据可继承(即多 点要素的属性可由面要素对应继承)等优点,因此本文以南京市作为边界依据各个站点构建 75 泰森多边形以适应进一步分析(如图 3 所示)。 图 3 泰森多边形 Fig 3 Tyson polygon - 3 -
中国科技论文在线 1.3 变量筛选 http://www.paper.edu.cn 80 本文通过莫兰指数[15]检验各自变量的空间相关性,排除空间意义不明显的变量。再检 验筛余变量的多重共线性,结合与因变量之间的相关性,最终筛选出参与地理加权回归的自 变量。 1.3.1 Moran’ s I(莫兰指数)变量筛选 作为衡量空间相关性的重要指标,莫兰指数可以解释要素在空间层面上的分布特征[16]。 85 Moran’ s I 大于 0 时表现出空间正相关,要素随着空间分布位置的聚集(距离减小)相关性 越发显著;Moran’ s I 小于 0 时表现出空间负相关,即随着空间分布的离散,相关性反而显 著[17]。同时结合 P 值和 Z 得分进行判断:P 值小于 0.05(通过 95%置信度检验),且 Z 得 分超过临界值 1.65(拒绝零假设设定的阈值);Z 分数为负号,且通过显著性检验,比如<-1.96, 表示有负相关[18]。 90 I = ∑ ∑ ∑ ̅ ∑ 式 1 式 1 中, ∑ ̅ 为样本方差, 为空间权重矩阵的(i,j)(用来度量区 域 i 与区域 j 之间的距离),∑ ∑ 为所有的空间权重之和。 验证各站点特性因素变量的空间自相关性,结果显示为(如表 1 所示): 表 1 站点特性因素变量空间自相关性检验结果 95 Tab 1 spatial autocorrelation test results of site characteristic factors and variables 站点特性要素 站点进出口数目 最小站间距 到新街口的距离 快速路 主干道 次干道 公交线路数 Moran’ s I 检验结果 Moran’ s I 0.094 0.804 0.957 0.638 0.827 0.454 0.227 P 值 0.009 0.000 0.000 0.000 0.000 0.000 0.000 Z 得分 2.621 16.622 19.268 12.786 16.121 9.154 4.732 可以看出,各站点特性要素的空间自相关性都满足 P 值小于 0.05,Z 得分大于 1.65 的 临界要求,有空间分析的意义。 针对各站点周边的用地属性,分别对不同圈层的要素进行空间自相关验证(以 250m 圈 层为例)(如表 2 所示): 100 表 2 0-250m 圈层空间自相关性检验结果 Tab 2 spatial autocorrelation test results of 0-250m enclosure space 站点特性要素 Moran’ s I Moran’ s I 检验结果 住宅 a 住宅 b 住宅 c 写字楼 工业 0.271 0.065 -0.006 0.162 0.241 - 4 - P 值 0.000 0.144 0.977 0.001 0.000 Z 得分 5.662 1.462 0.029 3.463 5.025
中国科技论文在线 http://www.paper.edu.cn 商业 学校 a 学校 b 枢纽 公共用地 医院 0.027 -0.047 0.249 -0.020 0.093 0.075 0.461 0.440 0.000 0.778 0.038 0.057 0.737 -0.772 5.260 -0.282 2.070 1.902 排除要素:住宅 b、住宅 c、商业、学校 a、枢纽。 根据 Moran’ s I 检验结果,对不同圈层的要素空间自相关检验结果汇总(如表 3 所示): 105 表 3 圈层要素筛选汇总表 Tab 3 summary table of loop factor screening 圈层 0-250m 0-500m 0-750m 0-1000m 0-1250m 0-1500m 排除用地熟悉要素 住宅 b、住宅 c、商业、学校 a、枢纽 住宅 c、商业、学校 a、枢纽、医院 住宅 c、学校 a、枢纽 枢纽 商业、枢纽 枢纽 1.3.2 多重共线性变量筛选 当解释变量之间存在严重的多重共线性时,极有可能导致实证分析回归模型失效[19], 强行回归建模将导致模型中可能存在的重要要素被掩盖,模型解释更加困难,无法进行地理 加权回归拟合,因此本文对样本在 Moran’ s I 检验结果基础上进行了共线性检验。 110 在回归分析中,采用“后退”的方法筛除相关性低的变量,并检验剩余变量的多重共线 性,VIF 不大于 10 即满足要求。得到最终筛选结果(如表 4 所示): 模型 0-250m 0-500m 0-750m 表 4 圈层变量共线性统计表 Table 4 loop variables collinearity statistical table 共线性统计 (常量) 站点进出口数 主干道 写字楼 250 医院 250 公交车线路 (常量) 站点进出口数 主干道 公交车线路 写字楼 500 公共用地 500 (常量) 站点进出口数 主干道 - 5 - VIF 1.287 1.455 1.272 1.148 1.242 1.377 1.395 1.237 1.388 1.076 1.344 1.701
中国科技论文在线 http://www.paper.edu.cn 0-1000m 0-1250m 0-1500m 公交车线路 写字楼 750 公共用地 750 医院 750 (常量) 站点进出口数 主干道 公交车线路 写字楼 1000 学校 b1000 公共用地 1000 (常量) 站点进出口数 公交车线路 写字楼 1250 公共用地 1250 主干道 学校 b1250 (常量) 站点进出口数 公交车线路 写字楼 1500 公共用地 1500 主干道 学校 b1500 1.245 1.443 1.108 1.285 1.321 1.673 1.250 1.631 1.027 1.090 1.298 1.270 1.677 1.086 1.741 1.038 1.272 1.275 1.695 1.053 1.770 1.052 2 地理加权回归模型的构建 115 多个自变量的线性回归称为多元线性回归,地理加权回归模型(GWR)是普通线性回 归模型的扩展式(在回归参数之中添加地理位置因子)[20]。 多元线性回归一般式: ε 其中, 为因变量; 为自变量; 是 p+1 个未知参 数, 是回归常数, 是回归参数;ε是随机误差。 120 地理加权回归模型公式: ∑ 这里 是采样点的地理位置因子, 是在 i 采样点上的第 k 个回 归参数,是地理位置的函数,省略地理位置因子项为: - 6 -
中国科技论文在线 http://www.paper.edu.cn ∑ 3 结果与讨论 3.1 地理加权回归模型拟合结果 125 根据南京地铁 AFC 数据,针对客流数据筛除相关性低的变量,并检验剩余变量的多重 共线性,将最终筛选得到的变量在 ArcMap 中分别进行固定范围的地理加权回归拟合。 分别对不同范围的固定圈层进行地理加权回归拟合,得到结果(如表 5 所示): 表 5 固定圈层实验拟合结果 Ta 5 experimental fitting results of fixed layer 模型 0-250m 0-500m 0-750m 0-1000m 0-1250m 0-1500m(最高) R2 0.774 0.803 0.813 0.814 0.806 0.911 模型评价参数表 Adjusted R2 0.755 0.789 0.798 0.799 0.790 0.850 AICC 1974.297 1973.718 1953.105 1952.457 1957.442 1965.506 130 可见固定 0-1500m 范围的模型拟合度最高。 0-1500m 圈层地理加权回归模型(GWR)拟合结果为(如表 6 所示): 表 6 1500m 圈层 GWR 拟合结果 Tab 6 GWR fitting results of 1500m ring layer GWR 模型参数估计结果 变量 Min Max Mean L-quartile U-quartile Rang 站点进出口数目 -18.655 897.206 561.241 295.613 801.068 915.861 主干道 -0.072 0.121 公交车线路数 -31.604 123.190 写字楼 学校 b 公共用地 0.002 -0.001 -0.002 0.007 0.006 0.000 0.051 39.165 0.005 0.001 0.000 0.018 23.721 0.004 0.000 -0.001 0.067 72.275 0.006 0.003 0.000 0.154 154.794 0.005 0.007 0.002 自变量:工作日早高峰出站客流 R2(Adjusted)=0.850 3.2 讨论 135 (一) 对比多元线性回归: 对工作日早高峰出站客流分圈层进行拟合: ①GWR 模型中 1500m 圈层为最佳圈层,拟合度最高,而线性回归中 500m 为最佳圈层; ②相同范围相同变量回归拟合得到的两种模型,地理加权回归模型相较于多元线性回归 模型,拟合度都会有所提升。 140 (二) 基于 GWR 模型的结果与分析如下: 针对工作日早高峰出站客流,从变量筛选的结果来看共筛选出六个自变量,包括站点特 - 7 -
中国科技论文在线 http://www.paper.edu.cn 性因素“站点进出口数”、“主干道”、“公交车线路数”,站点周围用地属性因素“写字 楼”、“学校 b”和“公共用地”。 (1) 站点特性因素 145 三个站点特性因素在不同的地区都存在正相关与负相关的差异,但由参数分布图我们可 以看出,较之呈现负相关的地区,正相关的地区占大多数,且系数绝对值均要大于负相关系 数的绝对值。“站点进出口数”对客流的影响分布规律性较强(如图 4 所示),由城市中心 地区向城郊方向逐渐降低,并在城郊的部分地区转换为负相关。“主干道”与“公交车线路 数”系数分布规律性并不明显(如图 5,图 6 所示),但两者都表现出在城市中心的部分地 150 区,因素与客流间呈现负相关,本文认为是由于道路交通在短程交通方面的优势及其与城市 轨道交通的竞争关系导致。 图 4 站点进出口数 图 5 主干道 图 6 公交车线路数 Fig 4 the number of entrances Fig. 5 main road Fig 6 number of bus routes 155 and exits of the stations (2) 站点周围用地属性因素 ①“写字楼”因素与客流呈现正相关,工作日早高峰的出站客流主要是前往上班的城市 居民,写字楼是工作场所,拥有更大面积的工作用地,能够吸引到的客流也就越多,符合一 般性认识。 160 ②“学校 b”与客流的关系同样经历了由负相关到正相关的转变(如图 7 所示)。由系 数分布图可以看出,该因素与客流的关系有很明显的由城市中心地区向城市外围地区变化的 规律。随着城市的发展,南京市中心已经形成了相当部分的“校园区”,在这些区域中,有 城市发展初期就已经建成的“老校区”,它们大都集中在城市的中心地区,为昔日城市的发 展做出了巨大的贡献。而如今兴办的“新校园区”都分布在城市郊区,为缓解城市中心用地 165 压力做出贡献。分布在城郊的校园区,与客流呈现负相关,符合一般认识。而城市中心地区 的校园因素却与客流表现为正相关,结合数据分析,本文认为原因主要是:城市中心的用地 规划建设已经基本完善,在分布有校园的地区同样大面积地分布有“可工作空间”,此消彼 长之下,使得校园因素被变异地认为与客流表现为正相关。 ③“公共用地”是城市中可供城市居民活动的相对开放的空间。随着城市的发展,新兴 170 的“公共用地”都只能在城市的外围建设,这样一种用地属性在某种层面上而言,象征着较 慢的生活节奏,与工作日中客流的流动目的存在较大的差异,表现为负相关同样符合人们的 一般认识(如图 8 所示)。由系数的分布图我们可以看到,该因素对客流的贡献系数(绝对 - 8 -
分享到:
收藏