中国人口增长预测模型的建立与分析
摘 要
为了加快中国的经济建设进程,全面落实科学的发展观,按照构建社会主义和谐社
会的要求,实现人口与经济社会资源环境的协调和可持续发展。我们确定人口发展战略,
必须既着眼于人口本身的问题,又处理好人口与经济社会资源环境之间的相互关系,构
建社会主义和谐社会,统筹解决人口数量、素质、结构、分布等问题。
本文是以《中国人口统计年鉴》公布的部分人口数据为基准(其他部分数据通过网
站查询得到),通过合理的假设和数学模型得到了对于中国人口增长预测的统计模型。
对中国人口做出分析和预测,主要分为如下三个方面:
第一、对人口做短期预测分析;
首先采用灰色系统对人口数量及人口分布即城镇化程度进行预测分析,然后利用人
口发展方程进行改进,将二维(年龄、时间)关系转化为一维关系,求出 01-05 年的各
个年龄段的人口增长率,由此反映出人口数量变化趋势。在此基础上求得 01-05 年总的
人口增长率,再利用灰色系统对 06-07 年的人口增长率进行预测并对结果进行分析。
其次对人口结构进行预测分析。人口结构包括老龄化程度、抚养比、男女出生比例、
育龄期妇女所占总人口比重、生育率,我们分别采用多次逐步回归,灰色系统,拟合等
预测方法对其建立预测模型进行预测分析。
第二、对中国人口做出长期分析和预测;我们建立两个模型进行预测。
模型一、基于人口发展方程原理的改进模型:y=0.6535*K*100/(M+100)-6.19%
这个模型能反映人口数量与人口结构、人口分布之间的关系。从长远来看,城镇化
程度会越来越严重,并且其在很大程度上影响男女出生性别比、老龄化程度、生育率等。
因此利用人口发展方程的原理分别重新建立男女出生性别比、老龄化程度、生育率与时
间、城镇化程度的关系模型,并对此进行长期预测。分析得结论:育龄期妇女的生育率
都随时间而减小,最终趋于稳定值(大约为 19‰);城镇化程度逐渐增大,最后趋于稳
定状态(城市人口所占比重为 28.40%,镇为 31.61%,乡为 39.99%);长期预测中的男女
出生性别比逐渐减小,最终在 113.5 附近趋于平衡。 又由于人口数量受出生率变化的
影响,而男女出生性别比、生育率对出生率影响很大。因此建立人口数量与男女出生性
别比、生育率的关系模型并进行长期预测。结论为:人口数量呈先增大后减小趋势,峰
值出现在 2042 年,届时人口数量将达到最大,为 16.2295 亿。
模型二、基于 leslie 的改进模型:
A A A=t)▽n+X(t
1
2
3
2)-(n
B B B+(t)X
2
1
1
2)-(n
3
(t)X
2
此模型考虑到了生育率的变化,并是针对总人口分布处理的,克服了 leslie 模型
的不足,很适合做长期预测。我们先分别对城、镇、乡进行预测,再综合得出总的预测
结果。得到结论:人口数量先增大后减小,峰值出现在 2040 年,届时人口数量将达到
最大,为 15.869 亿,这与模型一得出的结果比较接近。并且由预测的年龄结构发现,
老年化程度越来越严重,到 2045 年 50-70 岁这一年龄段分布的人口最多。
第三、人口控制:用模型一做出的人口总量预测峰值为 16.2295 亿。这与我国提出
的将人口总量峰值控制在 15 亿左右的战略目标有一定差距。而影响此模型预测结果的
参数主要是育龄妇女的生育率,因此我们通过控制生育率来控制人口数量。
关键词:分析和预测 人口发展方程 灰色系统
leslie 改进模型
1
1 问题的背景
随着中国加入世界贸易组织,进入世界 500 强,我们迎来了更多的机遇,但同时也
面临更加艰巨的挑战。中国要在世界中立于不败之地,林立于世界强林之中,首先必须
注重人口的发展。现在人口素质已成为综合国力竞争的核心,在经济社会发展中占据着
举足轻重的地位。
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。近年来我国
人口发展出现了一些新的特点。例如,老龄化进程加速、出生人口性别比持续升高,乡
村人口城镇化,先天畸形儿比例较高,人口在地区产业间分布不尽合理,人力资源分配
不很完善等,这些因素都影响着中国人口的增长。
为了加快中国的经济建设进程,全面落实科学的发展观。按照构建社会主义和谐社
会的要求,坚持以人为本,推进体制改革,优先投资于人的全面发展:稳定低生育水平,
提高人口素质,改善人口结构,引导人口合理分布。保障人口安全,实现人口大国向人
力资本强国的转变,实现人口与的协调和可持续发展。我们确定人口发展战略,必须既
着眼于人口本身的问题,又处理好人口与经济社会资源环境之间的相互关系,构建社会
主义和谐社会,统筹解决人口数量、素质、结构、分布问题。因此建立一个人口增长预
测的数学模型对中国人口增长的中短期和长期趋势做出预测就显得尤为重要了。
2 问题的重述
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。近年来中国
的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,
以及乡村人口城镇化等因素,这些都影响着中国人口的增长。2007 年初发布的《国家人
口发展战略研究报告》(附录 1)做出了进一步的分析。
关于中国人口问题已有多方面的研究,并积累了大量数据资料。附录 2 是从《中国
人口统计年鉴》上收集到的部分数据。
从中国的实际情况和人口增长的上述特点,以构建社会主义和谐社会,统筹解决人
口数量、素质、结构、分布等问题为出发点,参考附录 2 中的相关数据(也可以搜索相
关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中
短期和长期趋势做出预测,包括人口数量、结构、分布情况等,并且针对预测的结果提
出控制的方法;特别要指出所建模型中的优点与不足之处。
3 基本假设
(1)假设题中所给数据基本真实有效;
(2)假设没有重大的自然灾害发生;
(3)在较近一段时期,政府政策基本不发生重大变化;
(4)在较近一段时期,医疗卫生条件保持不变;
(5)所研究的问题没有太大的人口迁入与迁出;
(6)男性比率之和和女性比例之和的总和在 1 附近。可以近似认为 1。
2
4 模型的符号说明
符号说明
时间
年龄
人口分布函数,表示第 t 年、年龄小于 r 的人口数
时刻t 年龄在区间[
rr ,
dr
]内的人数
时刻t 年龄 r 的人的死亡率
第t 年在
rr ,
dr
内单位时间死亡的人数
乡的老龄化人口占总人口的比率
第 r 年龄段的人口数量百分比
婴儿出生率
女性性别比函数
女性在单位时间内平均每人的生育数量
时刻 t 单位时间内平均每个育龄女性的生育数
第i 年龄段人口数量的比值(加权值)
第i 年龄段人口的死亡率。
5 模型分析建立及求解
dr
),(
符号
t
r
),(
trF
),(
dr
trp
),(
tr
),(
trptr
W
R
)(t
f
)(rk
)(rb
)(t
ip
id
5.1 中短期人口预测
5.1.1 模型预处理
首先,我们做如下处理:
第一,鉴于人口的增长率只有 0 岁婴儿的出生能够表示,我们将 0 岁婴儿分为一类。
而育龄妇女的年龄分布为 15—49 岁,且 20—29 岁之间的生育率尤为高,之后在我国计
划生育等政策制度的影响下,生育率有所控制,由此我们把这一期间的人口分为初始生
育期、生育旺盛期、生育控制期三类。而老年人又有较高的死亡率,所以结合中国统计
年鉴的分类标准,把 65 岁以上的人群定义为老年人。综上原因,我们把年龄段分为如
下 7 部分: 定义 0 岁为婴儿期,1-14 岁为幼年期,15-19 岁为初始生育期,20-29 岁为
生育旺盛期;30-49 岁为生育控制期;50-65 岁为转向老年期;65 岁以上为老年期。
第二,通过 EXCEL 计算,各年市、镇、乡各年龄组的男性比率与女性比率的总和在 1
附近。由于是统计数据,所以稍有偏差,以下我们可以近似认为男、女比率之和为 1。
第三,本题要求对人口做中短期与长期预测。进行中短期预测时,由于政府政策在
短时期内基本不变,人口数量、素质、结构、分布之间的关系不很明显,所以可以忽略
它们之间的相互影响,采取以下方法进行预测。
其次,对于中短期人口的预测,我们从人口分布、数量、结构三方面考虑。
第一,人口数量我们采用人口发展方程模型,把针对人口数量的时间与年龄两个变
量综合成一个变量,从而将二维微分方程转化为一维微分方程,大大改进并简化了模型。
并且用人口增长率变化来反映人口数量的变化。
第二,人口分布的预测,我们进行人口城镇化比例的预测,采用灰色系统的方法。
第三,针对人口结构,我们又进一步从以下几个方面进行了预测:一,老龄化比例
预测,我们采用灰色系统理论进行了预测。二,出生人口性别比预测,我们采用二次逐
3
步拟合的方法进行预测。三,劳动力预测,即人口抚养比预测,我们采用灰色系统进行
预测。四,育龄妇女所占比重的预测,我们同样采用灰色系统。第五,生育率预测,我
们又采用二次逐步拟合。
5.1.2 人口数量与人口分布预测
5.1.2.1 人口数量预测的微分方程
题目所给数据量较少,运用时间序列进行预测需要大量的数据,不合适;而且预计
未来某一时刻会有一个人口高峰值,因此运用灰色系统也不合理。因此我们转向考虑建
立微分方程,借鉴人口发展方成模型,把以人口数量为因变量的两个自变量——时间与
年龄综合成一个变量,从而将二维微分方程转化为一维微分方程,大大改进并简化了模
型。并利用此求出各年的人口增长率,用人口增长率的变化来反映人口数量的变化。
我们引用人口发展方程,设
),(
trF
数。将人口密度函数定义为:
),(
trp
是在第t 年、年龄小于 r 的人口数,即人口分布函
F
r
dr 表示时刻t 年龄在区间[
),(
trp
rr ,
dr
,
]
tr 为时刻t 年龄 r 的人的死亡率,其含义是:
),(
),(
),(
trptr
dr
表示第t 年
内的人数。记
在
rr ,
为了得到
dr
内单位时间死亡的人数 。
),(
trp
满足的方程,考察第t 年、年龄在
dr
rr ,
1
dr
dr
,这里
1,
dr
r
内的人到时刻 dt
t 的情
。而在 dt 这
dr 1
dt
况。他们中活着的那一部分人的年龄变为
r
drdt
。
段时间内死亡的人数为
),(
),(
),(
trp
trptr
dr
于是
1
设 R 为第 r 年龄段的人口数量百分比,即
),(
),(
trptr
,
)
t
dt
dr
(
rp
dr
将二维变量化为一维变量,即
第t 年中,第 r 年龄段的人口数量百分比为
省去。
,(
trp
R
/)1
R
drdt
R
),(
trp
(
rp
/)1
),(
,(
trp
trp
1(*),1
(
t
rp
(
1(*)1
/))1
ru
。对模型进行简化,
,1
(
t
ru
。在
)(
rp
,从而将变量t
),(
trp
/))
以第 t 年为例,方程有一个定 解条件 :出生的婴儿数量占总人口百分比记 作
,称婴儿出生率。设女性性别比函数为 )(rk ,年龄在
),0(
f
t
p
的女性人数
)(
)(
,将这些女性在单位时间内平均每人的生育数量记作 )(rb ,设育龄区为
rprk
为
1 rr ,则 )(t 的直接含义是时刻t 单位时间内平均每个育龄女性的生育数。由此得到以
,
]
[
下微分方程组:
)(
t
dr
rr ,
dr
2
r
f
)(
t
(
rp
1(*)1
)(
t
r
2
r
1
(
ru
)(
/))1
rp
),(
),(),(
trptrktrh
dr
这个连续型人口发展方程描述了人口的演变过程,但为进一步简化模型,设 dr =1;
以后,立
即一岁为一个年龄段;将连续方程离散化。从这个方程确定出密度函数
即可以得到各个年龄的人口比值(见附件 1),即人口比值分布函数。
),(
trp
运用连续方程离散化的思想,利用等式:净人口增长率=出生率-死亡率,出生率即
n
为 )(t
f ,死亡率为
1
i
应年龄段的死亡率。
p *
i d
i
,其中 ip 为第 i 年龄段人口数量的比值(加权值), id 为相
5.1.2.2 三种类型人口净增长率的求解
结合上述微分方程组,根据人口净增长率=出生率-死亡率,且出生率=各年市、镇、
乡的女性比率与育龄妇女生育率的乘积之和,死亡率=各年男性比率 男性死亡率+女性
4
比率 女性死亡率,求出 2001—2005 年城市、镇、乡三种类型的人口净增长率。
表 1
2001-2005 年市、镇、乡三种类型人口净增长率(单位:%)
年份
类型
2001
2002
2003
2004
2005
城市
镇
乡
4.6862
6.3451
5.6611
3.4502
5.1742
4.9072
2.9174
5.7916
4.9384
4.2779
5.3374
4.4701
3.5108
4.0971
2.9958
我们考虑分别采用灰色系统,多元逐步回归,时间序列分析等三种方法对三种类型
的人口进行净总人口增长率的预测。但是,通过比较分析得知在这三种方法中,灰色系
统预测效果最好。下面我们以城市人口净增长率为例,对运用灰色系统的预测进行较为
详细的介绍:
灰色系统是指部分信息已知而部分信息未知的系统,灰色系统理论所要考察和研究
的是对信息不完备的系统,通过已知信息来研究和预测未知领域从而达到了解整个系统
的目的。具有能够利用“少数据” 建模寻求现实规律的良好特 性,克服了资料不足或
系统周期短的矛盾。
灰色系统 GM(1,1)模型是依据系统中已知的多种因素的综合资料,按微分方程
拟合去逼近,进而外推,达到预测的目的。这种拟合得到的模型是时间序列的一阶微分
方程,因此,简记为 GM(1,1)模型。
我们利用 2002—2005 年的实际值(3.4502,2.9174,4.2779,3.5108),通过 MATLAB
程序(见附件 2)运行得到如下结果:
表 2
2002-2005 年 GM(1,1)灰色系统预测值与实际值比较
年份
2002
2003
2004
2005
预测值
3.3142
3.4595
3.6112
3.770
实际值
3.4502
2.9174
4.2779
3.5108
残差 q
-0.1360
0.5421
-0.6667
0.2588
相对误差ξ 1(%)
3.9430
18.5818
15.5841
7.3716
由上述表格利用相对误差计算得知相对平均误差为 11.3%,平均误差在 10%左右,
误差率较小,通过检验。与此同时预测得到 2006 年市人口净增长率为 3.9349%;2007
年为 4.1075%。同理可预测得到镇人口净增长率 2006 年为 3.9349%;2007 年为 4.1075%。
乡人口净增长率 2006 年为 3.0676%,2007 年为 2.6847%。见表 3
表 3 各类型人口净增长率预测值表
年份
类型
城市
镇
乡
2006
3.9349%
4.2996%
3.0676%
2007
4.1075%
4.0203%
2.6847%
由上表观察得知,从 2006 年到 2007 年,市人口净增长率从 3.9349%增到 4.1075%,
增长了 0.1726 个百分点;而镇人口净增长率下降了 0.2793 个百分点;乡人口净增长率
下降了 0.3829 个百分点,总体下降了 0.4896 个百分点。
5
由此可见,我国人口在这两年内虽然会增加,但是人口净增长率将会逐渐减小并趋
于稳定。且可以看出城镇化趋势越来越严重。鉴于这种情况,下面我们对人口分布的城
镇化比例进行预测。
5.1.2.3 求解城市、镇、乡三种类型所占人口总数的比重
根据题给附件的 EXCEL 表中 2005 年中国人口 1%调查数据,通过计算得到市、镇、
乡三种类型占人口总数的比重,见下表 4。
表 4 三种类型所占比重
年份
类型
2001
2002
2003
2004
2005
城市
镇
乡
0.2420
0.1297
0.6283
0.2616
0.1880
0.6129
0.2602
0.1522
0.5876
0.2582
0.1536
0.5882
0.2772
0.1712
0.5516
运用灰色系统,通过 MATLAB 程序(附件 1.1)运行得到各类型人口所占总人口的比
例预测值表如下。
表 5 各类型人口所占总人口的比例预测值表
年份
类型
市
镇
乡
2006
27.58%
18.80%
54.08%
2007
28.06%
20.59%
52.42%
由上表可知,从 2006 年到 2007 年,市人口所占比例由 27.58%增长到 28.06%,增
长了 0.48 个百分点;镇人口所占比例由 18.80%增长到 20.59%,增长了 1.79 个百分点;
乡人口所占比例由 54.08%增长到 52.42%,减少了 1.66 个百分点,总体增长了 0.61 个
百分点。
分析城镇化比例预测值表及以上数据,可知该增长点主要是由于生产力的快速发
展,各镇无法满足当地人民的生活需要,城镇人口大量涌入城市,进一步造成城镇化比
例越来越大。但是,从乡村人口所占比例来看,呈现负增长趋势,可见,我国的政策改
革使得城镇化趋势有所缓解。这与近年来人们返璞归真,走进大自然的思想还是很吻合
的。因此可见,我们的模型能够反映政府政策的发展动态,以及人民的思想变化,还是
较好的。
5.1.2.4 计算总人口的净增长率趋势
根据总人口净增长率等于市、镇、乡各类型人口净增长率与对应所占比例增长率的
乘积之和,计算出总人口的净增长率趋势。即 2006 年总人口净增长率=市人口净增长率
城市人口比例+镇人口净增长率 镇人口比例+乡人口净增长率 乡人口比例。2007 年
的总人口净增长率的计算方法类似。从而计算得到 2006 总人口净增长率为 3.5524%,
2007 年的总人口净增长率为 3.3874%。
从以上数据及图表分析得知,中短期总人口净增长率逐渐减小并趋于稳定。出现这
一现象的原因之一是我国实施计划生育政策,直接导致总人口净增长率下降;另外,我
国社会主义经济持续增长,国民受教育程度越来越高,更多的人加入到晚婚晚育的行列,
6
且封建残留的思想——生女孩不好,已经基本得到缓解,致使越来越多的人生育一胎化,
使更替水平趋于稳定,进而使总人口净增长率下降并趋于稳定。
由此可见,要从根本上解决总人口不断增长的趋势,还得进一步实施邓小平提出的
“科学是第一生产力”的理念,提高全体国民的素质,加强推行计划生育的政策,鼓励
优生优育、晚婚晚育等。
5.1.3 人口结构预测
5.1.3.1 老龄化发展程度的预测
根据附件 2 所给数据,通过 EXCEL 分别计算得到 2001—2005 年市、镇、乡三种类
型老年人口(65 岁以上人口)所占的比率,即求得三种类型的老龄化人口比重。
表 6 市、镇、乡及全国的老龄化人口比重
年份
2001
2002
2003
2004
2005
2006
2007
市
7.69
8.15
8.83
8.42
7.99
8.477
8.555
镇
6.16
6.62
6.6
7.44
7.39
7.83
8.15
乡
6.67
6.93
7.19
7.88
8.73
9.001
9.508
全国
6.85
7.21
7.53
7.95
8.3
8.68
9.06
下面以乡的老龄化人口占总人口的比重为例,运用多元逐步回归的方法,最终确定
建立一次回归模型如
aW
bt
其中,W 是指乡的老龄化人口占总人口的比率,t 表示时刻,b 表示时刻 t 的系数。
通过 SAS 程序(附件 1.2)得到结果如下:
表 7 模型的检验参数表
方差来源
组内平方和
误差平方和
总平方和
自由度
1
3
4
平方和
2.57049
0.19471
2.76520
标准差
2.57049
0.06490
F 值
39.60
Pr〉F
0.0081
从表 1-2-2 中我们可见 Pr 值为 0.0081,远远小于 0.05,由此可见此模型整体拟合
效果较好,可以进行下一步的拟合。
表 8 各变量的检验参数表
变量
intercept
x1
估计值
5.959
0.507
标准差
0.2672
0.08056
T 值
22.30
6.29
Pr〉|t|
0.0002
0.0081
从表 1-2-3 中我们可见两个变量的 P 值小于 0.05,说明两个因素对 W 有显著性的关
系,由它得到乡老龄化的预测模型为:
y
.0
507
*
t
.5
959
7
通过上述预测模型计算得到 2006 年乡老龄化人口的预测值为 9.001%,2007 年老龄
化人口的预测值为 9.508%。
同理,运用多次逐步回归对城市和镇的老龄化人口占总人口的比率进行预测,得到
如下结果:城市老龄化人口的模型为:y=0.087*t +7.955,并通过预测模型计算得到 2006
年老龄化人口的预测值为 8.477 %,2007 年老龄化人口的预测值为 8.555%;镇老龄化人
口的模型为; y=0.328*t +5.858,并通过预测模型计算得到 2006 年老龄化人口的预测值
为 7.83 %,2007 年老龄化人口的预测值为 8.15%。
表 9 老龄化人口分布表
类型
年份
城市
镇
乡
预测模型
2006 年预测值
2007 年预测值
y=0.087*t +7.955
y=0.328*t +5.858
y
.0
507
*
t
.5
959
8.477 %
7.83 %
9.001%
8.555%
8.15%
9.508%
结合上述计算的城镇化人口比例,运用公式:
总老龄化人口占总人口的比率=市老龄化人口的比率 城市人口比例+镇老龄化人口
的比率 镇人口比例+乡老龄化人口的比率 乡人口比例。
计算得到 2006 年总老龄化人口比率为 8.6775%,2007 年总老龄化人口比率为
9.0619%。
图 1 市、镇、乡及全国的老龄化程度图
由以上计算及图表分析,城市老龄化程度有一定的波动性,这与乡镇大量人口涌入
城镇以及环境污染的条件下,城市大量人口有返璞归真,接近自然的思想休戚相关。这
一对矛盾的统一体使得城市老龄化人口有一定的波动性。乡镇老龄化程度有一定程度的
增长,这与我国医疗保健水平的提高导致死亡率降低,以及出生率降低致使老龄化程度
相对较高有紧密的关系。
8