logo资料库

基于BP神经网络的人口预测模型研究.pdf

第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
资料共3页,全文预览结束
第 !"卷第#期 #$$%年&月 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! ! 【统计理论与方法】 ’()*!"+(*# ,-.*, 统 计 与 信 息 论 坛 #$$% 基 于 34 神 经 网 络 的 人 口 预 测 模 型 研 究 吴劲军 (江西财经大学 统计学院,江 西 南昌&&$$!&) 摘 要:将 34神经网络应用于人口预测模 型研究,讨 论了可 行性、网络结 构设计 和学习 算法;计算实 例 表明,人口预测的神经网络模型具有客观性、精度高、易操作的 特点。 关键词:神经网络;学习算法;人口预测 中图分类号:52#;51 文献标识码:6 文章编号:!$$1/&!!0(#$$%)$#/$$%%/$& 一、引 言 人口预测研究是国家制定未来人口发展目标和 生育政策等有关人口政策的基础,对于国民经济计 划的制定和 社会战略目标的决策具有 重要参考价 值。一般的人口预测统计学模型,其预测精度难以 保证。文献[!]在马尔萨 斯人口模型的 基础上提出 了修正的马尔萨斯人口模型,并结合分岔理论进行 了分阶段实际人口预测,这不失为一种好的方法,但 仍存在函数选择和阶段划分的主观性问题。而34 神经网络带有高度并行处理信息的机制且具有高速 的自学习、自适应能力,能较好的再现人口增长的非 线性动力学特性,克服了以往人口预测方法中的人 为随机性因素,因此本文采用 34 神经网络理论来 建立人口预测模型,并进行实证研究。 二、34神经网络应用于 人口预测的可行性 !734神经网络的基本原理 34神经网络是误差反向传播的多层前向网络, 其信息处理机制由神经元激活特性和网络拓扑结构 决定,神经元的激活函数是非线性的89:;(9<函数, 网络结构由输入层、隐含层、输出层组成,同层节点 间无关联,异层节点前向连接。34神经网络对问题 的求解方法与传统方法不同,它是经过训练来解答 问题的,训练一个人工神经网络是一系列的输入和 理想的输出作为训练的样本,根 34算法对网络 进行足够的训练,使得34神经网络能够学 习包含 在“解”中的基本原理,训练结束后,该模型便可以求 解相同的问题。 #7运用34神经网络进行人口预测的可行性 一个好的人口预测模型首先应符合人口基本理 论和数学建模要求,这是选择模型的关键。其次要 保证模型数据可得、一致和可比性,在数据预测检验 阶段应充分拟合原始数据,特别是有波动的数据,因 为波动性数据往往蕴藏了系统重要信息。 具有4个输入、= 个输出的 34 网络可看作 4 维欧氏空间到 = 维欧氏空间的一个非线性映射,文 献[#]已经证明了只含一个隐含层的34网络可以逼 近任何连续函数。34网络的非线性映射与人口非 线性特征是相近的,对于未知的人口动力学系统可 通过神经网 络来学 习系 统的表 征量 并进 行预 测, >();(:(.(?连续定理(!"@1)从 数学上保证了 网络 用于时间序列预测的可行性。网络的输入向量和结 构参数可由相空间重构技术予以确定(证明见参考 文献[#][@]),同时34网络的动态学习能力对人口波 动性数据具有较强的识别和拟合能力,克服了以往 人口预测模型剔除奇异值或划分阶段处理的缺陷。 因此从模型映射性质、输入变量的选择和波动性数 据拟合等方面表明34神经网络模型用于人口预测 是可行的。 三、人口预测的34神经 网络模型的建立 &层的 34网络模型由输入层、一个隐含层、输 收稿日期:#$$&/!#/!0 作者简介:吴劲军(!"12/ ),男,江西九江人,硕士生。研究 向: 挖掘和综合评价。 %%
吴劲军:基于!"神经网络的人口预测模型研究 出层组成,!"算法的学习过程分为正向输入和反向 传播两个过程,正向传播中输入信息从输入层经隐 含层处理,并传向输出层,如果在输出层不能得到期 望输出,则转入反向传播将误差信号沿原来的联接 通路返回。建立一个神经网络预测模型主要包括三 个阶段:配置阶段、训练阶段、预测阶段。 #$配置阶段 神经网络各层节点数的确定是直接影响网络模 拟成功与否的关键技术,本文采用相空间重构技术 (%"算法)从人口时间序列中提取系统信息作为模 型结构参数选择的依据。不失一般性,令&(’)为观 测到的人口时序数(’(),#,…,*),可得 + 维人口 相空间矢量: !"(",!) #{$(%),$(%&!),…,$[%&(" ’#)!]} (#) 式(#)中,(#,-,…,*.,+ 为嵌入维数,!为时间延 迟,*.(*/(+/’)!。通过 *.个矢量在 + 维人口 相空间中描述出人口动力系统轨迹,当 +!-01# 时(0为吸引子关联维数),可重现原吸引子的几何 特征。对!,23435678,7’89,等人在数值实验中提 # 8 的时滞作 出运用自相关函数下降到初始值的#/ 为延迟时间,嵌入维数 + 是通过相关积分计算出关 联维数来确定的。%"算法得到由离散人口时序数 &(’)重构的 + 维人口相空间,在 + 维人口相空间中 状态转移形式为::,1#(;(:,),其中 :, 为人口相 空间矢量,再结合式(#)展开: [$(%&#),…,$(%&#&(" ’#)!)] #({$(%),…,$[%&(" ’#)!]} 为计算方便和直观起见,上式记为: (-) $[%&#&(" ’#)!] #){$(%),…,$[%&(" ’#)!]} (<) 这时=(·)是一 个 + 维矢量 到一维 实数的 映 射,运用<层 !"神经网络模型多输入单输 出的函 数逼近功能来实现。<层 !"神经网络模型由输入 层、隐含层和输出层组成,输入和输出节点数分别为 +、#,隐含层节点数根据神经网络优化理论确定为 -+1#,其网络学习分为两个过程: (#)正向传播输出 输入单元:>&’(&(’),’(#,-,…,+ 隐层单元:>&?("(,8’&?),其中 ,8’&?( " + @9?>&’ ’(# 1#?,?(#,-,…,-+1# 输出单元:=("(,8’&),其中,8’&( " @?>&?1# 这里=为网络输出,"为79A+690函数,@ 为权 ?(# -+1# 值,#为阀值。 (-)反向传播修正权值。为克服一般!"算法 收敛速度慢、局部极值的缺陷,本文采用动量/自适 应调整算法,其算法: *(+&#)# *(+)&"(+),(+) (B) 式(B)中 @(C)为C时刻权值向量,D(C)(/#E/#F (C)为C时刻的负梯度,D(C/#)为 C/#时刻的负 梯度,$为学习率,C为训练步数。 -3训练和预测阶段 将 *./#个矢量作为输入数据,与对应的理想 输出组成训练样本输入网络(见表#,’()),得到输 出结果,并与实际人口数作比较,若存在误差,立即 进行反向调整。网络训练结束后,将第 *.个矢量输 入网络,此时输出为人口预测数。 样本号 # - $ *./# *. 表# 训练与预测样本的划分 + 个输入值 &(’),&(’1!),…,&[’1(+/#)!] &(’1#),&(’1#1!),…,&[’1#1(+/#)!] $ #个输出值 &[’1#1(+/#)!] &[’1-1(+/#)!] $ &(’1*./-),&(’1*./-1!),…,&[’1*./-1(+/#)!] &(’1*./#),&(’1*./#1!),…,&[’1*./#1(+/#)!] &[’1*./#1(+/#)!] &[’1*.1(+/#)!] 四、实证计算及结果分析 本文就江西省#GBG%-))#年的人口数据进行 实证分析和检验,其中#GBG%#GGG年人口数作为预 测数据,-)))%-))#年人口数为检验数据。由相空 间重构技术计算出嵌入维 + (H,关联维 0( -3-<。建立!" 神经网络的人口预测模 型,选取输 入层、隐含层、输出层的节点 分别为H、#<、#,采用 2I’JIK神经网络工具箱中的’LI9,K&M函 (动量/ 自适应调整 算法,详见参 考文献[B])来训练 !" 网 络,其拟合数据与实际数据效果见附图,-)))、-))# 年的预测数据为B#N)3ON、B#OP3-<万人,实际数据 为B#-P3GN、B#HN3#H 万人,相 对误 差率 为 #Q、 )$-Q。采用文 献[<]中的马尔萨 斯人口模 型、修 正 马尔 萨 斯 人口 模 型(其 预 测 年 份 为 #GG)% #GGG),来对 江西省 -)))、-))# 年人口 进行 拟 合,并与!"神经网络模型预测结果进行比较,其结 果见表-。 OB
统 计与信息论坛 附图 预测、检验数与实际数拟合效果图 表! 江西省人口数据拟合对比表 检验数据 真实数据 预测数据 &$!()%* &$*’)+* &$-*)$- &$+()!. &$!()%* &$*()+! &$-*)$- &!’&)-- &$!()%* &.%%)++ &$-*)$- &+’’)+. 单位:万人 相 对误差率 $, ’)!, $)!, ’)%, +)$, (, 模 型 原始计算数据时间 "#神经网络 $%&%!$%%% 修正马尔萨斯模型 $%%’!$%%%% 马尔萨斯模型 $%&%!$%%% 年份 !’’’ !’’$ !’’’ !’’$ !’’’ !’’$ 数据来源:历年江西省统计年鉴 通过对江西省$%&%!!’’$年人口数的实证计 算,得到以下结论: $)"#神经网络模型预测结果分析 江西省人口增长动力系统的维数是-,关联维 数是!)!.,表明描述江西省人口增长这个动力系统 需要.个主要解释变量。由附图可知模型对波动较 大的数据拟合较好。!’’’、!’’$年预测数据的相对 误差率分别为$,、’)!,,预测精度较高。 !)三种预测模型比较分析 由表!可知,"#神经网络模型和修正马尔萨斯 模型的预测精度都较高,但后者对于预测数据的选 取及方程的/、0值检验的有效性,理论上尚要进一 步论证。马尔萨斯模型的局限性是显见的。"# 神 经网络通过权值反向调整表现 出很强的自适 应能 力,对于人口这个复杂非线性系统波动性具有较强 的再现和泛化功能,且结合相空间重构技术,从而减 少了建模过程中的主观性,因此 "#神经 网络人口 预测模型在理论上是可行的,实践上具可操作性。 "#神经网络用于人口预测的研究是一种新的 尝试,它不是采用分而治之的还原方法,而是立足于 对人口增长机制整体的把握,利用神经网络强大的 学习和认识能力去阐明人口变动的统计特征,同时 也深化了对人口系统波动性的认识,为人口研究提 供一定的参考作用。 参考文献 [$] 方亚玲)对人口模型的研究[1])山西煤炭管理干部学院学报,!’’’,(!)) [!] 阎平凡,张长水)人工神经网络与模拟进化计算[2])北京:清华大学出版社,!’’.) [.] 王周喜,胡 斌,王洪萍)人口预测模型的非线性动力学研究[1])数量经济技术 经济研究,!’’!,(()) [&] 楼顺天,施 阳)基于 23453"的系统分析与设计—神经 网络[2])西安:西安电子 科技大学出版社,$%%%) [+] 吕金虎,陆君安,陈士华)混沌时间序列分析及应用[2])武汉:武汉大学出版社,!’’!) [-] 江西省人口统计年鉴[2])北京:中国统计出版社,!’’!) (责任编辑:张治国) -&
分享到:
收藏