竞赛承诺书
我们仔细阅读了 2018 年吉首大学第十六届数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮
件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问
题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他
公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正
文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反
竞赛规则的行为,我们将受到严肃处理。我们授权 2018 年吉首大学第十六届数
学建模竞赛,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在
书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从组委会提供的试题中选择一项填写):A 题
我们的参赛报名号为(如果组委会设置报名号的话):第 65 组
所属学校(请填写完整的全名):吉首大学
参赛队员 (打印并签名) :1.宁洪斌
2.肖雯文
3.戴丹娜
指导教师或指导教师组负责人 (打印并签名):戴厚平
日期:2018 年 6 月 24 日
评阅编号(由组委会评阅前进行编号):
人口规模与结构问题
关 键 词:人口预测 、二胎政策、灰色预测、BP 神经网络、灰色关联分析
摘
要:
针对问题一,我们主要研究了全面二胎政策 颁布前后人口结构的预测问题。
首先为了提高预测精度,以 1996-2016 年湖南年终总人口数据资料为依据,分别
使用了灰色预测模型和 BP 神经网络模型相结合来进行人口预测,其次考虑到全
面二胎政策带来的影响,结合育龄妇女二胎生育意愿以及二胎生育能力,并且运
用离散累加法求得每年新增的人口数。最终建立二胎政策下 2018-2028 年人口
预测并建立人口结构模型。然后本文将根据相关数据分析人口的地区分布、性别、
年龄、教育程度等方面的变化情况;同时客观量化分析“单独二孩”、“全面二
孩”等政策对人口数量变化形成的原因、发展趋势的影响;
针对问题二,我们以实际数据建立模型,统计分析湖南省经济、教育、社会
资源等分配问题与人口规模、结构的关系。通过解决前两个问题,提出关于针对
人口规模预测和优先规划好社会资源的分配等方面问题的建议。
针对问题三,本文将就问题一和问题二中的一些存在的问题提出自己的有针
对性的合理的建议。
1.1 研究背景
1、问题提出
人口问题始终是社会发展过程中首要研究的问题之一。在“全面二孩”大背
景下,针对人口规模预测和优先规划好社会资源的分配等方面问题仍然还有很多
问题值得深入研究。本文以以湖南省人口数据为例,建立科学合理的人口预测数
学模型,并分析“单独二孩”、“全面二孩”等政策对人口数量变化形成的原因、
发展趋势的影响以及湖南省经济、教育、社会资源等分配问题与人口规模、结构
的关系。
自 20 世纪八十年代起中国实行“每对夫妇只能生育一个小孩”的生育政策。
在此政策影响下,中国的人口生育率和自然生育率从 1970 年的 33.43‰和
25.83‰迅速下降到 2013 年的 12.08‰和 4.92‰。随着人口生育率的不断下降,
我国人口年龄结构发生了重大变化,这对我国经济的长期健康发展产生不利的影
响。2013 年,十八届三中全会决定将我国人口政策调整为“单独二孩”政策。紧
接着在 2016 新年伊始,又将人口政策调整为“全面二孩”政策。经济学界一致认
为“全面二孩”政策有利于我国人口红利对经济增长,被认为是推动我国经济长
期健康发展的重要措施。在“全面二孩”大背景下,针对人口规模预测和优先规
划好社会资源的分配等方面问题仍然还有很多问题值得深入研究。
1.2 问题重述
1、应用某一种仿生智能算法原理,建立科学合理的人口预测数学模型,预
测未来 10 年的人口总数,预测统计分析人口的地区分布、性别、年龄、教育程
度等方面的变化情况;同时客观量化分析“单独二孩”、“全面二孩”等政策对
人口数量变化形成的原因、发展趋势的影响;
2、建立相关模型,统计分析湖南省经济、教育、社会资源等分配问题与人
口规模、结构的关系,应用历年数据验证你们的模型;
3、结合前两问的研究结果,为政府决策部门提供一份详细的建议报告。
2、问题一
对于人口总数预测问题,有很多传统的方法,比如 logistic 法、常微分方
程法、灰色预测法以及动态预测法等。将人口预测分为两部分,全面二孩政策下
的人口=未开放二孩政策下的人口+后期新增二孩数。利用湖南统计局给出的
1996-2015 年的人口数据,在灰色神经网络的作用下,合理预测出未开放政策
下 2018-2028 年的人口总数。对于新增二孩数,在合理预测出每年育龄 妇女的
人数的基础上,参考二胎生育意愿,同时考虑育龄妇女二胎生育能力,即二胎生
育率,从而算出政策开放后每年 的新增二胎数进行累加计算。最终求得二胎政
策下 2018-2028 年人口总数。 对于每年新增二胎数,在根据历年的育龄妇女数
据进行灰色神经预测出 2018-2028 每年的数据后,根据调查统计湖南有意愿生
二孩的育龄妇女所占比率为 5.13%,进而通过数学计算得到每年增加的二胎数
目,最终获得人口总量。
对于人口的地区分布、性别、年龄、教育程度等方面的变化情况问题,我们
采用将有关数据做成有效模型或者图像进行客观分析。
1
2.1 问题具体分析
GM(1,1)模型是灰色预测的核心,它是一个单个变量预测的一阶微分方程模
型,其离散时间响应函数近似呈指数规律。BP 网络由输入层、输出层以及一个
或多个隐层节点互连而成的一种多层网,这种结构使多层前馈网络可在输入和输
出间建立合适的线性或非线性关系,又不致使网络输出限制在-1 和 1 之间。
(1)首先输入 1996-2015 年原始人口 Ti 进入灰色预测模型中,并输入预
测年份;获得时间序列下 1996-2015 年人口预测值 Pi;
(2)将预测值 Pi 作为输入量,实际人口数据 Ti 作为输出量,对神经网络进
行训练;
(3)将想要预测年份的灰色预测值作为输入,代入神经网络,从而获得对应
的输出。
2.2 模型的建立与求解
(1)灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测
通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进
行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相
应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反
应预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征
量,或达到某一特征量的时间。
GM(1,1)模型
令
)0(
x
(
x
)0(
),1(
x
)0(
2(
),...,
x
)0(
(
n
)),
x
)0(
x
),1((
x
2(
),...,
nx
(
))
作一次累加,生成消除数据的随机性和波动性,即
)1(
x
k
)(
k
i
1
)0(
kmx
),
(
,...,2,1
n
),1(
x
)1(
2(
),...,
x
)1(
)(
n
有
)1(
x
k
)(
)1(
x
x
)0(
),0(
),1(
x
)0(
2(
),...,
x
)0(
(
n
)1
x
)0(
)(
n
)0(
x
dx
dt
k
)(
X 可建立白化方程:
ax
即
u
该方程的解为:
)1(
x
)1(
(
x
)1(
)1,1(gm
u
a
)
e
ak
u
a
kx
(
)1
x
)1((
au
/
)
exp()
au
/
其中:a 称为发展灰度,u 称为内生控制灰度
(2)BP 网络不仅有输入节点、输出节点,而且还有一层或多层隐含节点。
在正向传播过程中,每一层神经元的状态只影响到下一层神经元网络。如果输出
层不能得到期望输出,就是实际输出值与期望输出值之间有误差,那么转入反向
传播过程,将误差信号沿原来的连接通路返回,通过修改各层神经元的权值,逐
次地向输入层传播去进行计算,再经过正向传播过程,这两个过程的反复运用,
使得误差信号最小。实际上,误差达到人们所希望的要求时,网络的学习过程就
2
结束。
BP 算法步骤分两阶段:第一阶段( 正向过程) 输入信息从输入层经隐层逐
层计算各单元的输出值,根据下式计算每层的输出值:
net
j
i
Ow
ij
i
;
fO
j
(
net
j
)
其中 iO 为上一层第 i 个单元的输入 ijw 为对应的权值。第二阶段(反向传播过
程)输出误差逐层向前算出隐层各个单元的误差,并用此误差修正前层的值。在
BP 算法中常采用梯度法修正权值,为此要求输出函数可微,通常采用 Sigmoid
函数作为输出函数。
(1)计算误差
E
1
y
j
2
(
i
2)ˆ
y
j
其中 jy 是目标输出, iyˆ 是网络输出。
(2)按照梯度方向计算各层权重的修正值:
tw
)(
ij
E
w
ij
O
i
j
其中 j的计算公式为
OOy
O
1(
(
j
{
O
O
w
,
1(
k
j
jk
k
j
)
)
j
j
j
,输出层的计算方法
)
非输出层的计算方法
(3)修正各层权重
tw
(
ij
)1
tw
)(
ij
tw
)(
ij
。
(4)重复上述过程直到算法收敛,即误差小于给定的阈值。
2.3 人口预测
将湖南统计局查询到的 1996-2015 年的原始数据作为检验样本,通过灰色
预测法得到的 1996-2015 年的预测值作为输入样本,不断训练神经网络,从而
获得合理的权值或阈值。在此基础上,预测 2018-2028 年的人口总数,所得的
图形见图 1。
图 1 灰色预测结果
3
通过 1996-2015 年的人口数训练,仿真出 2016-2028 的人口数如表 1 所示,
这是由隐层数目单元 n 反复改变得出的最佳拟合效果
表 1:2018-2028 湖南人口总数
年份
总人口数(万
人)
6428.00
6465.00
6502.00
6532.00
6562.05
6595.85
6628.50
6662.80
6697.70
6732.10
6768.10
6805.70
6845.20
6900.20
7089.53
7153.60
7179.87
7147.28
7202.29
7242.02
7318.81
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
2026
2027
2028
灰色预测
(万人)
6428.00
6417.92
6461.63
6505.63
6549.93
6594.54
6639.45
6684.66
6730.18
6776.01
6822.16
6868.62
6915.39
6962.48
7009.90
7057.64
7105.70
7154.09
7202.81
7251.86
7301.24
7350.96
7401.02
7451.42
7502.16
7553.25
7604.69
7656.48
7708.62
7761.11
7813.96
7867.18
7920.75
与实际值相差
灰色神经网络(万
与实际值相差值
(万人)
-15.89
-28.87
-36.23
-29.81
-16.81
-3.24
12.38
24.93
35.16
45.05
53.49
61.09
67.82
60.05
-81.23
-96.66
-73.91
7.89
2.17
11.73
-15.76
(万人)
0
-47.08
-40.37
-26.37
-12.12
-1.31
10.95
21.86
32.48
43.91
54.06
62.92
70.19
62.28
-79.63
-95.96
-74.17
6.81
0.52
9.84
-17.57
人)
6412.11
6436.13
6465.77
6502.19
6545.24
6592.61
6640.88
6687.73
6732.86
6777.15
6821.59
6866.79
6913.02
6960.25
7008.30
7056.94
7105.96
7155.17
7204.46
7253.75
7303.05
7352.42
7401.92
7451.66
7501.73
7552.22
7603.22
7654.78
7706.94
7759.68
7812.99
7866.83
7921.10
由表中数据可得,灰色神经网络模型模拟出来的数据更接近真实数据值,所
以采纳基于 GM(1,1)模型与 BP 神经网络模型的组合模型更贴近实际值。(2)每
年新增二胎数。全面二胎政策实施之后,根据调查统计湖南有意愿生二孩的育龄
妇女所占比率为 5.13%。
将湖南统计局查询到的 1996-2015 年的育龄妇女人数统计数据作为检验样
本,通过灰色预测法得到的 1996-2015 年的预测值作为输入样本,不断训练神
经网络,从而获得合理的权值或阈值。在此基础上,预测 2018-2028 年的人口
总数,所得的图形见图 2。同样的方法得到表 2。
4
图 2 育龄妇女人口预测
表 2:2018-2028 湖南育龄妇女人口数量
年份
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
育龄妇女(万
人)
926.625
932.571
938.301
942.804
941.784
955.839
958.482
962.841
968.085
972.453
976.425
981.549
988.77
995.088
1024.512
灰色预测 灰色神经 年份 育龄妇女 灰色预测 灰色神经
926.625
926.297
932.581
938.908
945.278
951.692
958.148
964.649
971.193
977.782
984.416
991.095
997.819
1004.58
1011.40
8
4
926.606
926.464
932.170
938.998
945.683
952.047
958.187
964.222
970.241
976.300
982.428
988.642
997.818
1005.44
6
1011.94
8
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
1030.95
1036.272
1030.488
1038.396
1044.279
1056.372
1018.266
1025.174
1032.129
1039.132
1046.181
1053.279
1060.425
1067.619
1074.863
1082.215
1089.497
1096.888
1104.330
1111.822
1018.547
1025.240
1032.026
1038.902
1045.864
1052.911
1060.037
1067.240
1074.517
1081.862
1089.272
1096.743
1104.270
1111.849
利用离散累加法,未来十年预测总人口数=未来十年灰色神经网络+育龄妇女
灰色神经网络*5.13%*10.9%
最后算求得得人口预测如表 3 所示
人数(万)
7407.887686
7457.668377
年份
2018
2019
5
2023
2024
2025
7660.954747
7713.157126
7765.939768
2020
2021
2022
7507.779448
7558.310882
7609.352658
2026
2027
2028
7819.292646
7873.17573
7927.488993
表 3:全面开放二胎政策下 2018-2028 年湖南人口总数
2.4 湖南人口结构分析
我们根据湖南统计局的人口年龄性别有关数据,制作了人口性别年龄金字
塔。以及出生率死亡率和自然增长率曲线图
从上图 2000 和 2010 年湖南的人口金字塔我们可以看到,湖南人口的年龄结
构属于“钟型”的缓慢增长型。各年龄组人口数差别不大,只是在高龄部分才有
比较急剧的减少。自中国实行计划生育基本政策以来,湖南人口的增长率不断下
降,人口缓慢增长,但由于人口基数大,湖南人口的总数还是在不断增加的。
图中可以看出高龄人口数量最少,中龄人口数量最多,低龄人口数量居中。
结合人口金字塔和二孩政策,我们可以预见未来三十年的人口发展趋势,主要有
两个方面。
(1)未来人口增长率会降低。年龄构成中,少年儿童比重较小,则将来相
继进入婚龄、育龄的人数必然会减少,出生率会降低;随着文化程度高的父母越
来越多,特别是妇女文化素质的提高,生育率在不断降低;妇女受教育状况及其
社会地位的改善、抚养孩子的成本上升、各种避孕知识和药具的广泛传播和推广,
也使得生育率降低。
(2)未来人口老龄化将会加剧。年龄构成中,中龄人群的比重是最大的,
意味着未来进入高龄人群的基数很大。随着医疗卫生事业的发展,社会保障体系
的日益丰富和完善,人口期望寿命延长,老年人口死亡率下降,将会导致严重的
人口老龄化。
在实现计划生育政策的同时,中国人口年龄结构问题逐渐突出,人口老龄化
问题严重,同时也带来诸如男女比例失衡、子女赡养负担重等很多社会问题,全
面放开二胎政策,对优化我国人口结构、应对人口老龄化问题具有积极作用。另
外,放开二胎,对提高出生率有很大的帮助,低龄人口数量的不断提高,对增加
我国劳动力数量有很大帮助,随着社会的发展和科技的进步,劳动者的能力和素
质也在不断提升,年轻劳动力的成长会慢慢取代年老工作者,同时,提高劳动力
生产效率,这对改变中国现阶段“倒三角”的人口结构具有重要作用。
全面放开二胎政策对中国有积极的影响,也有消极的影响。会加剧人口、资
源、环境的相互矛盾。我国虽然地大物博,但人口基数大,资源对应人口来 说,
无论种类和数量再多,都相对短缺,资源也难以完全满足中国十几亿的人口需求,
6