logo资料库

基于SPSS多元线性回归对城市用水量的分析.pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
收稿日期:2019-03-11作者简介:田午子(1996-),男,陕西宝鸡人,华北科技学院安全工程学院在读硕士研究生,研究方向:矿井防治水。E-mail:643544533@qq.com基于SPSS多元线性回归对城市用水量的分析田午子,孙泽,孙润,于涵(华北科技学院安全工程学院,北京东燕郊065201)摘要:城市用水量是城市给水系统规划的一项重要参考指标,对城市用水量的预测具有重要意义。通过查阅北京统计局出示的有关数据以及阅读相关文献,搜集北京市近15年的统计资料,基于SPSS多元线性回归中的逐步回归分析法,建立回归模型。经检验,该模型具有较高准确度,可以用来预测城市用水量。关键词:城市用水量;多元线性回归;SPSS;逐步分析中图分类号:TU991.31文献标识码:A文章编号:1672-7169(2019)02-0114-04AnalysisofUrbanWaterConsumptionBasedonSPSSMultipleLinearRegressionTIANWuzi,SUNZe,SUNRun,YUHan(SchoolofSafetyEngineering,NorthChinaInstituteofScienceandTechnology,Yanjiao,065201,China)Abstract:Urbanwaterconsumptionisanimportantreferenceindexofurbanwatersupplysystemplanning,whichisofgreatsignificancetothepredictionofurbanwaterconsumption.ThroughreviewingtherelevantdataproducedbytheBeijingBureauofStatisticsandreadingrelateddocuments,wecollectedthestatisticalda-taofBeijingforthepast15yearsandestablishedaregressionmodelbasedonthegradualregressionanalysismethodinSPSSmultivariatelinearregression.Themodelisprovedtohavehighaccuracyandcanbeusedtopredicturbanwaterconsumption.Keywords:Urbanwaterconsumption;multiplelinearregression;SPSS;stepwiseanalysis0引言水资源是人类生存发展的必要前提,据统计,地球存在的淡水资源只有3.5亿亿立方米,在这有限的淡水资源中,仅有0.34%是人类可以利用的。由于经济迅速发展,人民生活水平的不断提高,人口流动性也逐步增强,这使得城市外来人口的数量也随之急剧增涨,导致城市用水量的增加,给城市水循环系统造成巨大压力,因此,需要重新对其进行规划,以便保证城市的良好发展以及水资源的有效利用。城市用水量受多个因素的影响,导致预测不能采用历史数据类推的方法,只有充分考虑多方面的因素,才能使城市用水量的预测达到理想效果。目前,城市用水量预测常用的方法有:时间序列分析法、灰色预测法、解释性预测方法、多因素回归分析法等[1]。城市用水量的统计较为复杂,因此,本文在前人的理论基础上,选择较易统计数据的影响因素,利用SPSS软件建立多元线性回归模型,对城市用水量进行预测分析。1多元线性回归分析原理[2,3]在实际问题中,往往需要同时考虑多个因素411第16卷第2期2019年4月华北科技学院学报JournalofNorthChinaInstituteofScienceandTechnologyVol.16No.2Apr.2019中国煤炭行业知识服务平台www.chinacaj.net
的影响。此时,因变量只有1个,也称之为反应变量或响应变量,用字母Y表示。而影响因素的自变量用X表示。观察多个自变量X1,X2,X3,…,Xi与因变量Y之间的关系时,多元线性回归模型为:Y=b0+b1X1+b2X2+…+biXi+ε(1)式中b0为常数项,表示当所有自变量取值均为零时因变量的估计值。b1,b2,…bi为偏回归系数,其数值大小决定了自变量的影响程度。ε为随机误差,表示由于客观原因没有考虑到的其他因素。为了让建立的模型能准确预测实际问题,必须保证选择的自变量与因变量之间存在相关性以及各自变量之间存在互斥性,且要保证统计数据的真实性。多元线性回归要对建立的回归模型和回归系数进行检验,还需要考虑各个自变量之间是否存在共线性等问题。2影响城市用水量的因素选择和数据采集城市用水量通常是指生活用水、工业用水、农业用水和生态环境用水,这四个方面用水量的总和,而每方面的用水量都不是固定的,随着各种影响因素的变化而变化。生活用水主要是指城市居民日常用水,以天或者季度为单位预测用水量时,生活用水量与人口数量、季节、气候和生活习惯有关,而以年为单位预测时,主要影响因素就变成了人口数量;工业用水是指工业生产中的用水,与企业发展状况以及工艺性质等因素有关;农业用水指用于灌溉和农村牲畜的用水,与气候、灌溉面积、农业技术有关;生态环境用水是指修复环境质量的用水,主要与环境污染以及降雨量有关。而在不同的城市,因其地理位置、发展规模、常住人口的数量、自然条件等诸多因素的影响,用水量之间相差较大[4]。虽然影响城市用水量的因素多而复杂,但用水量与影响因素之间还是存在一定的规律性。结合各方面因素以及前人经验[1,4-7],在本文中预测北京市用水量时,选择5个因素作为影响自变量,即地区生产总值GDP(亿元)X1,城市常住人口(万人)X2,工业产值(亿元)X3,固定资产投资价格(亿元)X4,粮食产能(吨)X5,并取Y为总用水量(108m3/a),建立数学模型,具体数据见表1。表1北京市城市用水量及其影响因素的基本资料年份地区生产总值GDPX1(亿元)城市常住人口X2(万人)工业产值X3(亿元)固定资产投资价格X4(亿元)粮食产能X5(吨)总用水量Y(108m3/a)20035104.11456.44410.82157.1580276.035.820046164.91492.75733.32528.3701789.034.620057141.41538.06946.22827.2949267.034.520068312.61601.08210.03371.51091699.034.3200710071.91676.09648.43966.61020686.034.8200811392.01771.010413.13848.51254509.035.1200912419.01860.011039.14858.41247673.635.5201014441.61961.913699.85493.51156864.835.2201116627.92018.614513.65910.61217700.136.0201218350.12069.315596.26462.81137733.635.9201320330.12114.817370.97032.2961259.836.4201421944.12151.618452.97562.3639369.137.5201523685.72170.517449.67990.9626362.438.2201625669.12172.918087.38461.7536917.238.8201728014.92170.718901.18948.1411237.439.5数据来源:《北京统计年鉴》2004-20183SPSS多元线性回归分析及模型应用3.1SPSS多元线性回归具体过程[2,8]将数据导入SPSS,选择分析→回归→线性,进入分析界面主对话框,选择Y为因变量,X1~X5为自变量,并在方法中选择“步进”;在统计量对话框选择“估算值”、“模型拟合”;在“保存”对话框选择“未标准化”,完成以上设置以后,点击“确定”。511第2期田午子等:基于SPSS多元线性回归对城市用水量的分析中国煤炭行业知识服务平台www.chinacaj.net
3.2SPSS结果分析SPSS数据处理结束,处理过程及结果见表2~4。表2模型汇总模型RR方调整后R方标准估算的误差10.909a0.8250.8120.7079420.975b0.9510.9420.3918630.984c0.9680.9600.3276140.990d0.9800.9720.27475注:模型1预测自变量为X1;模型2预测自变量为X1,X3;模型3预测自变量为X1,X3,X5;模型4预测自变量为X1,X3,X5,X2;因变量为Y。表2是采用逐步回归分析得出的各模型汇总,5个选用的自变量中固定资产投资价格(亿元)X4被移除,其余被引用。由表可以得出模型4的相关系数(R)最大,表明模型5的因变量与自变量之间的相关性最好;判定系数(R2)以及调整后的判定系数(R2)揭示模型的拟合情况,其中模型4的判定系数最大,表明模型4的拟合情况最好,拟合程度非常高。因此,选择模型4来建立回归方程,该模型中因变量Y与自变量X1、X3、X5、X2之间存在密切的相关关系。表3方差分析表模型平方和自由度均方F显著性4回归36.58149.145121.1530.000e残差0.755100.075总计37.33614注:预测自变量为X1,X3,X5,X2;因变量为Y。表3是模型5的方差分析表,F检验是对回归方程的显著性检验,表示多个因素的综合影响程度,显著性sig值小于0.05时,才具有意义。模型5的显著性sig值为0,小于0.05,表明模型是非常显著的,具有统计学意义。模型有统计学意义不等于模型内所有的变量都有统计学意义,还需要进一步对各自变量进行检验。表4回归系数及显著性检验模型未标准化系数标准化系数B标准误差Betat显著性4(常量)29.0009962.676304610.8360.000X10.0003120.00007131.4194.3710.001X3-0.0005190.0001372-1.578-3.7790.004X5-0.0000020.0000004-0.319-3.7410.004X20.0056180.00236570.9302.3750.039表4各回归系数以及显著性检验,t检验是对单个自变量的显著性检验。表中常量及X1、X3、X5、X2的各显著性sig值均小于0.05,则各变量系数十分显著,具有统计学意义,不能从回归方程中剔除。从以上分析可得出,逐步回归方程为:Y=29.000996+0.000312X1-0.000519X3-0.000002X5+0.005618X2(2)3.3误差分析结合北京市城市用水量的实际值,再采取回归方程后的预测值,得出两者之间的相对误差,见表5。611华北科技学院学报2019年第2期中国煤炭行业知识服务平台www.chinacaj.net
表5城市用水量误差检验年份实际值(108m3/a)预测值(108m3/a)相对误差(%)200335.835.3261.32200434.634.9310.96200534.534.3660.39200634.334.1450.45200734.834.5100.83200835.134.5911.45200935.535.1011.12201035.235.1050.27201136.235.5611.77201235.935.9820.22201336.436.2870.31201437.537.0791.12201538.238.2760.20201638.838.7560.11201739.539.3040.50通过对城市用水量的实际值与预测值之间相对误差的比较,该回归模型的最大误差为1.77%,最小误差为0.11%,平均误差0.73%。因此,该SPSS逐步线性回归模型具有较高的精确度,可以用来预测用水量。3.4模型应用通过查找资料,得出2018年北京市地区生产总值、城市常住人口、工业产值以及粮食产能这4个影响自变量的数据,带入公式(2)中,预测2018年的城市用水量为39.9亿立方米,实际城市用水量为39.1亿立方米(见表6)。通过比对发现,预测值和实际值存在误差,但在允许范围内,也进一步验证了该模型的准确性。表62018年北京市城市用水量预测结果年份地区生产总值GDP(亿元)城市常住人口(万人)工业产值(亿元)粮食产能(吨)预测用水量(108m3/a)实际用水量(108m3/a)201830320.02154.219212.934000039.939.1数据来源:《北京市2018年国民经济和社会发展统计公报》4结论通过查阅资料,选取地区生产总值,城市常住人口,工业产值,固定资产投资价格以及粮食产能这5个变量作为影响城市用水量的主要因素。结合近15年的北京市统计资料,运用SPSS多元线性回归中的逐步回归分析法,得到:运用模型检验及变量检验,剔除固定资产投资价格这个变量,使用其余4个变量建立回归模型并进行误差分析。经实际统计数值与预测数值对比,发现相对误差在允许范围内,说明模型具有较高可信度及精确度,并利用该模型预测得出2018年北京市的用水量,达到简单方便预测城市用水量的效果。参考文献[1]李琳,左其亭.城市用水量预测方法及应用研究[J].水资源与水工程学报,2005,16(3):6-10.[2]杨维忠,张甜,刘荣.SPSS统计分析与行业应用案例详解[M].第3版.北京:清华大学出版社,2015:87-92.[3]李静萍.多元统计分析[M].第2版.北京:中国人民大学出版社,2015:3-20.[4]杨旭.城市用水量变化影响因素及其预测方法[J].黑龙江科技信息,2008,(12):13.[5]李林,刘坤.多元线性回归与GM(1,1)模型耦合预测城市用水量[J].水资源与水工程学报,2008,19(1):61-63.[6]李林.多元线性回归模型预测城市用水量[J].塔里木大学学报,2007,19(2):40-42+59.[7]周鹏飞,卢泽雨.基于SPSS多元线性回归模型在城市用水量的预测[J].水利科技与经济,2018,24(5):6-10.[8]刘健,程根银.基于多元线性回归对我国煤炭消费量的分析[J].华北科技学院学报,2018,15(3):108-112.711第2期田午子等:基于SPSS多元线性回归对城市用水量的分析中国煤炭行业知识服务平台www.chinacaj.net
分享到:
收藏