第 !"卷第#期
#$$%年&月
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!
【统计理论与方法】
’()*!"+(*#
,-.*,
统 计 与 信 息 论 坛
#$$%
基 于 34 神 经 网 络 的 人 口 预 测 模 型 研 究
吴劲军
(江西财经大学 统计学院,江 西 南昌&&$$!&)
摘 要:将 34神经网络应用于人口预测模 型研究,讨 论了可 行性、网络结 构设计 和学习 算法;计算实 例
表明,人口预测的神经网络模型具有客观性、精度高、易操作的 特点。
关键词:神经网络;学习算法;人口预测
中图分类号:52#;51 文献标识码:6 文章编号:!$$1/&!!0(#$$%)$#/$$%%/$&
一、引 言
人口预测研究是国家制定未来人口发展目标和
生育政策等有关人口政策的基础,对于国民经济计
划的制定和 社会战略目标的决策具有 重要参考价
值。一般的人口预测统计学模型,其预测精度难以
保证。文献[!]在马尔萨 斯人口模型的 基础上提出
了修正的马尔萨斯人口模型,并结合分岔理论进行
了分阶段实际人口预测,这不失为一种好的方法,但
仍存在函数选择和阶段划分的主观性问题。而34
神经网络带有高度并行处理信息的机制且具有高速
的自学习、自适应能力,能较好的再现人口增长的非
线性动力学特性,克服了以往人口预测方法中的人
为随机性因素,因此本文采用 34 神经网络理论来
建立人口预测模型,并进行实证研究。
二、34神经网络应用于
人口预测的可行性
!734神经网络的基本原理
34神经网络是误差反向传播的多层前向网络,
其信息处理机制由神经元激活特性和网络拓扑结构
决定,神经元的激活函数是非线性的89:;(9<函数,
网络结构由输入层、隐含层、输出层组成,同层节点
间无关联,异层节点前向连接。34神经网络对问题
的求解方法与传统方法不同,它是经过训练来解答
问题的,训练一个人工神经网络是一系列的输入和
理想的输出作为训练的样本,根 34算法对网络
进行足够的训练,使得34神经网络能够学 习包含
在“解”中的基本原理,训练结束后,该模型便可以求
解相同的问题。
#7运用34神经网络进行人口预测的可行性
一个好的人口预测模型首先应符合人口基本理
论和数学建模要求,这是选择模型的关键。其次要
保证模型数据可得、一致和可比性,在数据预测检验
阶段应充分拟合原始数据,特别是有波动的数据,因
为波动性数据往往蕴藏了系统重要信息。
具有4个输入、= 个输出的 34 网络可看作 4
维欧氏空间到 = 维欧氏空间的一个非线性映射,文
献[#]已经证明了只含一个隐含层的34网络可以逼
近任何连续函数。34网络的非线性映射与人口非
线性特征是相近的,对于未知的人口动力学系统可
通过神经网 络来学 习系 统的表 征量 并进 行预 测,
>();(:(.(?连续定理(!"@1)从 数学上保证了 网络
用于时间序列预测的可行性。网络的输入向量和结
构参数可由相空间重构技术予以确定(证明见参考
文献[#][@]),同时34网络的动态学习能力对人口波
动性数据具有较强的识别和拟合能力,克服了以往
人口预测模型剔除奇异值或划分阶段处理的缺陷。
因此从模型映射性质、输入变量的选择和波动性数
据拟合等方面表明34神经网络模型用于人口预测
是可行的。
三、人口预测的34神经
网络模型的建立
&层的 34网络模型由输入层、一个隐含层、输
收稿日期:#$$&/!#/!0
作者简介:吴劲军(!"12/ ),男,江西九江人,硕士生。研究 向: 挖掘和综合评价。
%%
吴劲军:基于!"神经网络的人口预测模型研究
出层组成,!"算法的学习过程分为正向输入和反向
传播两个过程,正向传播中输入信息从输入层经隐
含层处理,并传向输出层,如果在输出层不能得到期
望输出,则转入反向传播将误差信号沿原来的联接
通路返回。建立一个神经网络预测模型主要包括三
个阶段:配置阶段、训练阶段、预测阶段。
#$配置阶段
神经网络各层节点数的确定是直接影响网络模
拟成功与否的关键技术,本文采用相空间重构技术
(%"算法)从人口时间序列中提取系统信息作为模
型结构参数选择的依据。不失一般性,令&(’)为观
测到的人口时序数(’(),#,…,*),可得 + 维人口
相空间矢量:
!"(",!)
#{$(%),$(%&!),…,$[%&(" ’#)!]} (#)
式(#)中,(#,-,…,*.,+ 为嵌入维数,!为时间延
迟,*.(*/(+/’)!。通过 *.个矢量在 + 维人口
相空间中描述出人口动力系统轨迹,当 +!-01#
时(0为吸引子关联维数),可重现原吸引子的几何
特征。对!,23435678,7’89,等人在数值实验中提
#
8
的时滞作
出运用自相关函数下降到初始值的#/
为延迟时间,嵌入维数 + 是通过相关积分计算出关
联维数来确定的。%"算法得到由离散人口时序数
&(’)重构的 + 维人口相空间,在 + 维人口相空间中
状态转移形式为::,1#(;(:,),其中 :, 为人口相
空间矢量,再结合式(#)展开:
[$(%),…,$(%&(" ’#)!)]
#({$(%),…,$[%&(" ’#)!]}
为计算方便和直观起见,上式记为:
(-)
$[%&(" ’#)!]
#){$(%),…,$[%&(" ’#)!]}
(<)
这时=(·)是一 个 + 维矢量 到一维 实数的 映
射,运用<层 !"神经网络模型多输入单输 出的函
数逼近功能来实现。<层 !"神经网络模型由输入
层、隐含层和输出层组成,输入和输出节点数分别为
+、#,隐含层节点数根据神经网络优化理论确定为
-+1#,其网络学习分为两个过程:
(#)正向传播输出
输入单元:>&’(&(’),’(#,-,…,+
隐层单元:>&?("(,8’&?),其中 ,8’&?( "
+
@9?>&’
’(#
1#?,?(#,-,…,-+1#
输出单元:=("(,8’&),其中,8’&( "
@?>&?1#
这里=为网络输出,"为79A+690函数,@ 为权
?(#
-+1#
值,#为阀值。
(-)反向传播修正权值。为克服一般!"算法
收敛速度慢、局部极值的缺陷,本文采用动量/自适
应调整算法,其算法:
*(+)# *(+)&"(+),(+) (B)
式(B)中 @(C)为C时刻权值向量,D(C)(/#E/#F
(C)为C时刻的负梯度,D(C/#)为 C/#时刻的负
梯度,$为学习率,C为训练步数。
-3训练和预测阶段
将 *./#个矢量作为输入数据,与对应的理想
输出组成训练样本输入网络(见表#,’()),得到输
出结果,并与实际人口数作比较,若存在误差,立即
进行反向调整。网络训练结束后,将第 *.个矢量输
入网络,此时输出为人口预测数。
样本号
#
-
$
*./#
*.
表# 训练与预测样本的划分
+ 个输入值
&(’),&(’1!),…,&[’1(+/#)!]
&(’1#),&(’1#1!),…,&[’1#1(+/#)!]
$
#个输出值
&[’1#1(+/#)!]
&[’1-1(+/#)!]
$
&(’1*./-),&(’1*./-1!),…,&[’1*./-1(+/#)!]
&(’1*./#),&(’1*./#1!),…,&[’1*./#1(+/#)!]
&[’1*./#1(+/#)!]
&[’1*.1(+/#)!]
四、实证计算及结果分析
本文就江西省#GBG%-))#年的人口数据进行
实证分析和检验,其中#GBG%#GGG年人口数作为预
测数据,-)))%-))#年人口数为检验数据。由相空
间重构技术计算出嵌入维 + (H,关联维 0(
-3-<。建立!" 神经网络的人口预测模 型,选取输
入层、隐含层、输出层的节点 分别为H、#<、#,采用
2I’JIK神经网络工具箱中的’LI9,K&M函 (动量/
自适应调整 算法,详见参 考文献[B])来训练 !" 网
络,其拟合数据与实际数据效果见附图,-)))、-))#
年的预测数据为B#N)3ON、B#OP3-<万人,实际数据
为B#-P3GN、B#HN3#H 万人,相 对误 差率 为 #Q、
)$-Q。采用文 献[<]中的马尔萨 斯人口模 型、修 正
马尔 萨 斯 人口 模 型(其 预 测
年 份 为 #GG)%
#GGG),来对 江西省 -)))、-))# 年人口
进行 拟
合,并与!"神经网络模型预测结果进行比较,其结
果见表-。
OB
统 计与信息论坛
附图 预测、检验数与实际数拟合效果图
表! 江西省人口数据拟合对比表
检验数据
真实数据
预测数据
&$!()%*
&$*’)+*
&$-*)$-
&$+()!.
&$!()%*
&$*()+!
&$-*)$-
&!’&)--
&$!()%*
&.%%)++
&$-*)$-
&+’’)+.
单位:万人
相 对误差率
$,
’)!,
$)!,
’)%,
+)$,
(,
模 型
原始计算数据时间
"#神经网络
$%&%!$%%%
修正马尔萨斯模型
$%%’!$%%%%
马尔萨斯模型
$%&%!$%%%
年份
!’’’
!’’$
!’’’
!’’$
!’’’
!’’$
数据来源:历年江西省统计年鉴
通过对江西省$%&%!!’’$年人口数的实证计
算,得到以下结论:
$)"#神经网络模型预测结果分析
江西省人口增长动力系统的维数是-,关联维
数是!)!.,表明描述江西省人口增长这个动力系统
需要.个主要解释变量。由附图可知模型对波动较
大的数据拟合较好。!’’’、!’’$年预测数据的相对
误差率分别为$,、’)!,,预测精度较高。
!)三种预测模型比较分析
由表!可知,"#神经网络模型和修正马尔萨斯
模型的预测精度都较高,但后者对于预测数据的选
取及方程的/、0值检验的有效性,理论上尚要进一
步论证。马尔萨斯模型的局限性是显见的。"# 神
经网络通过权值反向调整表现 出很强的自适 应能
力,对于人口这个复杂非线性系统波动性具有较强
的再现和泛化功能,且结合相空间重构技术,从而减
少了建模过程中的主观性,因此 "#神经 网络人口
预测模型在理论上是可行的,实践上具可操作性。
"#神经网络用于人口预测的研究是一种新的
尝试,它不是采用分而治之的还原方法,而是立足于
对人口增长机制整体的把握,利用神经网络强大的
学习和认识能力去阐明人口变动的统计特征,同时
也深化了对人口系统波动性的认识,为人口研究提
供一定的参考作用。
参考文献
[$] 方亚玲)对人口模型的研究[1])山西煤炭管理干部学院学报,!’’’,(!))
[!] 阎平凡,张长水)人工神经网络与模拟进化计算[2])北京:清华大学出版社,!’’.)
[.] 王周喜,胡 斌,王洪萍)人口预测模型的非线性动力学研究[1])数量经济技术 经济研究,!’’!,(())
[&] 楼顺天,施 阳)基于 23453"的系统分析与设计—神经 网络[2])西安:西安电子 科技大学出版社,$%%%)
[+] 吕金虎,陆君安,陈士华)混沌时间序列分析及应用[2])武汉:武汉大学出版社,!’’!)
[-] 江西省人口统计年鉴[2])北京:中国统计出版社,!’’!)
(责任编辑:张治国)
-&