logo资料库

基于LESLIE矩阵预测模型.doc

第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
资料共23页,剩余部分请下载后查看
关于中国人口增长趋势的研究 【摘要】 本文从中国的实际情况和人口增长的特点出发,针对中国未来人口的老龄化、出生 人口性别比以及乡村人口城镇化等,提出了 Logistic、灰色预测、动态模拟等方法进行 建模预测。 首先,本文建立了 Logistic 阻滞增长模型,在最简单的假设下,依照中国人口的历 史数据,运用线形最小二乘法对其进行拟合, 2007 至 2020 年的人口数目进行了预测,对 得出在 2015 年时,中国人口有 13.59 亿。在此模型中,由于并没有考虑人口的年龄、 出生人数男女比例等因素,只是粗略的进行了预测,所以只对中短期人口做了预测,理 论上很好,实用性不强,有一定的局限性。 然后,为了减少人口的出生和死亡这些随机事件对预测的影响,本文建立了 GM(1,1) 灰色预测模型,对 2007 至 2050 年的人口数目进行了预测,同时还用 1990 至 2005 年的 人口数据对模型进行了误差检验,结果表明,此模型的精度较高,适合中长期的预测, 得出 2030 年时,中国人口有 14.135 亿。与阻滞增长模型相同,本模型也没有考虑年龄 一类的因素,只是做出了人口总数的预测,没有进一步深入。 为了对人口结构、男女比例、人口老龄化等作深入研究,本文利用动态模拟的方法 建立模型三,并对数据作了如下处理:取平均消除异常值、对死亡率拟合、求出 2001 年 市镇乡男女各年龄人口数目、城镇化水平拟合。在此基础上,预测出人口的峰值,适婚 年龄的男女数量的差值,人口老龄化程度,城镇化水平,人口抚养比以及我国 “人口 红利”时期。在模型求解的过程中,还对政府部门提出了一些有针对性的建议。此模型 可以对未来人口做出细致的预测,但是需要处理的数据量较大,并且对初始数据的准确 性要求较高。接着,我们对对模型三进行了改进,考虑人为因素的作用,加入控制因子, 使得所预测的结果更具有实际意义。 在灵敏度分析中,首先针对死亡率发展因子 θ 进行了灵敏度分析,发现人口数量对 于 θ 的灵敏度并不高,然后对男女出生比例 进行灵敏度分析得出其灵敏度系数为 0.8850,最后对妇女生育率进行了灵敏度分析,发现在生育率在由低到高的变化过程中, 其灵敏度在不断增大。 最后,本文对模型进行了评价,特别指出了各个模型的优缺点,同时也对模型进行了合理性分 析,针对我国的人口情况给政府提出了建议。 关键字:Logistic 模型 灰色预测 动态模拟 Compertz 函数 1
目录 一、问题重述 ..................................................................................................................3 二、符号定义与说明 ......................................................................................................3 三、模型假设 ..................................................................................................................3 四、问题分析 ..................................................................................................................4 1 问题背景的理解:...................................................................................................4 2 问题分析: ..............................................................................................................4 五、模型建立及求解 ......................................................................................................4 1 模型一 阻滞增长模型 .............................................................................................4 1.1 模型建立 ........................................................................................................4 1.2 模型求解 ........................................................................................................5 1.3 模型的分析与优化.........................................................................................6 2 模型二 GM(1,1)灰色预测模型 ...............................................................................7 2.1 模型建立 ........................................................................................................7 2.2 模型求解 ........................................................................................................7 2.3 结果分析 ........................................................................................................8 3 模型三 基于计算机模拟的动态模型 ......................................................................8 3.1 数据处理 ........................................................................................................8 3.1.1 取平均消除异常值 ...............................................................................8 3.1.2 对人口死亡率拟合 ...............................................................................9 3.1.3 2001 年市镇乡男女各年龄人口数目 ....................................................9 3.1.4 城镇化水平拟合 ...................................................................................9 3.2 模型的建立及求解....................................................................................... 10 3.2.1 模型建立............................................................................................. 10 3.2.2 模型求解............................................................................................. 11 3.3 模型三的改进 .............................................................................................. 17 六、模型评价 ................................................................................................................ 19 七、模型灵敏度分析 .................................................................................................... 19 1 人口死亡率 Compertz 函数中死亡率发展因子 θ 的灵敏度分析 .......................... 19 2 模型三男女出生比例灵敏度分析.......................................................................... 20 3 模型三妇女生育率灵敏度分析 ............................................................................. 21 八、模型的合理性分析: ............................................................................................. 21 九、给政府的建议 ........................................................................................................ 22 【参考文献】 ...................................................................................................................... 22 【附件】 ............................................................................................................................. 23 2
一、 问题重述 中国是世界上人口最多的国家,人口多,人均占有资源相对不足,是我国的基本国 情,人口问题一直是制约中国经济发展的首要因素。因此,计划生育是我国的一项基本 国策。近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口 性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的发展。因此, 对中国人口做出分析和预测是一个重要问题,这将为中国经济和社会发展决策提供科学 依据,同时对于加速推进我国现代化建设的宏伟大业有着极为重要的现实意义。 根据附录 2 的数据进行建模,同时要参考中国的实际情况以及人口增长的上述特点, 对中国人口增长的中短期和长期的趋势做出预测,比如未来的人口数目、性别比例、人 口结构等,特别要指出模型的优点和不足。 二、 符号定义与说明 符号 符号定义 单位或备注 x(t) z(t) μ(t) y(t) i k qi (t) wi (t,k) mi(t,k) bi(t,k) bi (t) t 年的全国人口总数 t 年的城镇化比例 t 年人口死亡率 t 年老龄化比例 i =1,2,3 分别表示城、镇、乡 k =0.1.2....90 分表表示人的年龄 t 年 i 地男女的出生比例 t 年 i 地年龄为 k 的女性数量 t 年 i 地年龄为 k 的男性数量 亿 (﹪) (‰) (﹪) (﹪) 万 万 t 年 i 地年龄为 k 的妇女生育率 k 只取 15.16.17...49(‰) t 年 i 地各自的总和生育率 (‰) 三、 模型假设 1.不考虑我国人口向国外搬迁,同时也不考虑国外人口向国内搬迁; 2.不考虑战争、灾害、疾病对人口数目的影响; 3.假设在一年内,各个地区,各个年龄段的死亡率不会发生变化; 3
4.假设在一年内,处于生育年龄的妇女生育率不会发生变化; 5.由于当前男女出生比例有失调的现象,故假设在 2020 年之前男女出生比例为 116,在 2020 年之后调整到 107。 四、 问题分析 1 问题背景的理解: 新中国成立 50 多年来,我国人口发展经历了前 30 年高速增长和后 20 年低速增长两 大阶段:从建国初期到上世纪 70 年代初,中国人口再生产由旧中国的高出生、高死亡 率进入高出生、低死亡率的人口高增长时期,1950-1975 年人口出生率始终保持在 30‰ 以上, 最高达到 37‰。 70 年代以后,人口过快增长的势头得到迅速扭转,人口出生率、自然增长率、妇女 总和生育率有了明显下降,人口出生率由 70 年代初的 33‰大幅度下降到 80 年代的 21‰, 妇女总和生育率也由 6 下降到 2.3 左右。 90 年代以来,随着我国经济高速发展,人民文化和健康水平逐步提高,计划生育工 作的不断深入, 20-29 岁生育旺盛人数年均超过 1 亿的情况下, 人口出生率依然呈现在 大幅下降的趋势,到 2000 年底人口出生率从 1990 年的 21.06‰下降到 14.03‰,自然 增长率由 1990 年的 14.39‰下降到 7.58‰, 妇女总和生育率也下降到 2 以下。 进入 90 年代末期, 我国人口再生产实现了低出生、低死亡、低增长的历史性转变, 我国用 20 多年时间完成了国外近 200 年的历程。 2000 年底全国总人口为 12.6743 亿,到 成功实现了“九五”计划将人口控制在 13 亿的奋斗目标。 中国政府自 1980 年在全国城乡实行计划生育基本国策以来成果卓著,据国家计生委 “计划生育投入与效益研究”课题组的研究成果,20 年共少生 2.5 亿个孩子。若从 70 年代算起,至今至少少生 3 亿人口,这有效地控制了人口的快速增长,为中国现代化建 设、全面实现小康打下坚实的基础, 这同时也是对世界人口的增长和控制做出了杰出贡 献。但是由于中国人口基数大,人口增长问题依然十分严峻,1990-1999 年每年平均净 增人口约 1300 万,这仍然对我国社会和经济产生巨大的压力。在我国现代化进程中, 必须实现人口与经济、社会、资源、环境协调发展和可持续发展,进一步控制人口数量, 提高人口质量,改善人口结构。 2 问题分析: 本题需要结合中国的实际情况和人口增长的特点来对中国人口增长的中短期和长期 趋势做出预测。 首先,我们从简单模型入手,利用已有年份的人口总量数据预测将来的人口总量的 变化趋势,从总体上对人口发展做出预测。 其次,把人口的增长特点考虑在内,利用动态模型并进行计算机模拟,得到符合中 国实际情况的模型,包含了老龄化水平、性别比例、城镇化等更细致的结果。 最后,我们对每个模型的预测结果进行对比,评判其各自的优点及缺点,并对政府 部门提出一些建设性的意见。 五、 模型建立及求解 1 模型一 阻滞增长模型 1.1 模型建立 针对未来中国的人口总数,我们建立简单的人口总数预测模型——阻滞增长模型(具 4
体建立方法请参考[1])。 我们得到如下等式: 人口增长率函数: r(x) = r(1 - x xm t 时刻人口数目函数: =x(t) ) ........................................ (1) xm .................................(2) 1 +  m -1  e-rt x  x0  rdx dt xmx 单位时间内人口增量方程:..........................(3)= r - st , s = 1.2 模型求解 首先,我们利用方程(3)以及 1990 年到 1999 的中国总人口数据(数据见附件 1) 用 MATLAB 软 件 对 方 程 ( 3 ) 进 行 线 形 最 小 二 乘 法 拟 合 , 得 到 r = 0 . 0 5 ,86 。则人口总量函数为: xm= 14753  10 万)( 14753 x(t) = 14753-0.0568t1+(- 1)  e 11433 .......................................(4) 然后,我们用(4)式,得出计算结果,并与实际数据作比较,分别得到阻滞增长模型 拟合中国人口数据的结果(表 2)和阻滞增长模型拟合曲线(如图 1): 年份 1990 1991 1992 1993 1994 1995 1996 1997 实际人口(亿) 11.43 11.58 11.72 11.85 11.99 12.11 12.24 12.36 计算人口 x(亿) 11.43 11.57 11.72 11.85 11.98 12.11 12.23 12.35 年份 1998 1999 2000 2001 2002 2003 2004 2005 实际人口(亿) 12.48 12.58 12.67 12.76 12.85 12.92 13.00 13.08 计算人口 x(亿) 12.46 12.57 12.67 12.77 12.86 12.96 13.04 13.13 年份 2006 实际人口(亿) 13.14 计算人口 x(亿) 13.21 表 2 阻滞增长模型拟合中国人口数据的结果 5
图 1 阻滞增长模型拟合曲线一 可以看出,这个模型拟合时虽然初始的一段(1990 年至 2002 年)吻合得不错,但 是最后一段(2003 年至 2006 年)不大好。 1.3 模型的分析与优化 在上述模型中,我们并没有把 2000 年到 2006 年的实际数据参与函数的拟合,目的 是为了用它们作模型的检验。我们用模型计算的数据和这一段的实际数据比较,来检验 模型是否合适,经计算得到 2000~2006 年人口计算与实际数据的相对误差(如表 3): 2000200120022003200420052006 年份 相对误差(%) 00.0780.0780.310.310.380.53 表 3 2000~2006 年人口计算与实际数据的相对误差 从表中可以看出,误差均比较小,所以可以认为该模型是相当满意的。 经过上面的分析求解,我们应当把 2000 年到 2006 年的实际数据加进去重新拟合, 得到新的 x(t ) 如下: 14208 x(t) = 14208-0.067049t1+(-1)  e 11433 ............................................(5) 我们用(5)式对未来 14 年进行预测,得到阻滞增长模型预测 2007~2050 年的人口 数据(如表 4)和阻滞增长模型拟合曲线二(如图 2): 年份 预测人口值(亿) 年份 预测人口值(亿) 年份 预测人口值(亿) 年份 预测人口值(亿) 年份 预测人口值(亿) 年份 预测人口值(亿) 200720082009201020112012 13.19 13.25 13.31 13.36 13.41 13.46 201520162017201820192020 13.59 13.63 13.67 13.70 13.73 13.76 202320242025202620272028 13.84 13.86 13.89 13.91 13.93 13.94 203120322033203420352036 13.99 14.01 14.02 14.03 14.04 14.05 203920402041204220432044 14.08 14.09 14.10 14.10 14.11 14.12 2047204820492050 14.13 14.14 14.14 14.15 表 4 阻滞增长模型预测 2007~2020 年的人口数据 2013 13.51 2021 13.79 2029 13.96 2037 14.06 2045 14.12 2014 13.55 2022 13.82 2030 13.98 2038 14.07 2046 14.12 6
2 模型二 GM(1,1)灰色预测模型 图 2 阻滞增长模型拟合曲线二 2.1 模型建立 由于人的出生和死亡是随机的,因此我们利用灰色预测模型中的累加效果,尽量减 小这种随机影响,在此我们采用模灰色 GM(1,1)模型(具体讲解请参考[3])。为了使预 测效果更佳,并不直接用总人口序列建模,而是首先求出各年净增人口序列,即 1990~ 2005 年各年净增人口数据(如表 5),然后应用净增人口序列建模计算净增人口预测值。 年份 1990 1991 1992 1993 1994 1995 1996 1997 人口总数(亿) 11.43 11.58 11.72 11.85 11.99 12.11 12.24 12.36 净增人口数(万) 1629 1490 1348 1346 1333 1271 1268 1237 年份 1998 1999 2000 2001 2002 2003 2004 2005 人口总数(亿) 12.48 12.58 12.67 12.76 12.85 12.92 13.00 13.08 净增人口数(万) 1135 1025957884826774761768 表 5 1990~2005 年各年净增人口数据 2.2 模型求解 原始样本序列为: q 0 = 1629 1490 1348 1346 1333 1271 1268 1237 1135 1025 957 884 826 774 761 768  通过灰色 GM(1,1)模型,我们得到未来第 t 年的较 1989 年(1989 年人口总数为 11.27 亿) 的累积人口净增量(记 1990 年 t=1,1991 年 t=2,之后以此类推)  q(1) (t) = 32954.4 - 31325.4* exp(-0.049579* (t - 1)) ...............................(6) 0110 利用 q   t  = q   t  - q   t -1 以及(6)式,得到人口的的净增长预测值 q    t  后,利 0 用 x(t) = q   t   x(t -1) 迭代可得出未来第 t 年的人口数量(记 1990 年 t=1,1991 年 t=2, 之后以此类推)为 x(t) = 145660 - 31325.4*exp(-0.049579*(t -1)) .................................(7) 我们由(7)式预测从 2007~2050 年中国人口总数,得到灰色 GM(1,1)模型预测 2007~ 7
2050 年的人口数据(如表 6): 年份 20062007200820092010201120122013 预测人口(亿) 13.149 13.217 13.283 13.345 13.404 13.460 13.513 13.564 年份 20142015201620172018201920202021 预测人口(亿) 13.613 13.659 13.703 13.744 13.784 13.822 13.858 13.892 年份 20222023202420252026202720282029 预测人口(亿) 13.925 13.956 13.985 14.013 14.040 14.066 14.090 14.113 年份 20302031203220332034203520362037 预测人口(亿) 14.135 14.156 14.175 140194 140212 14.229 14.246 14.261 年份 20382039204020412042204320442045 预测人口(亿) 14.276 14.290 14.303 14.316 14.328 14.340 14.350 14.361 年份 20462047204820492050 预测人口(亿) 14.371 14.380 14.389 14.398 14.406 表 6 灰色 GM(1,1)模型预测 2007~2050 年的人口数据 2.3 结果分析 对我国 2006 年实际总人口数进行检验性预测,预测值为 13.149 亿,实际值为 13.1448 亿,相对误差为 0.03% 。然后进行后误差检验,检验合格后的模型即可用于预测。 对 1990~2005 年数据进行检验,得到 1990~2005 年人口计算与实际数据的相对误差(如 表 7): 年份 19901991199219931994199519961997 相对误差(%)00.0233 0.016 0.1207 0.1001 0.0735 0.0008 0.0857 年份 19981999200020012002200320042005 相对误差(%) 0.1371 0.1399 0.1286 0.0995 0.0568 0.0054 0.0169 0.0107 表 7 1990~2005 年人口计算与实际数据的相对误差 S1=246.9858,S2=8.0308,C=S2/S1=0.0325<0.35,表明模型预测的精度很高。根据 灰色系统理论,当发展系数 a  (-2,2) 且 a  0.3 时,所建 GM(1,1)模型可用于中长期预测. 但是由于中国的人口发展特点并不能保证很长时间预测的准确性,比如对中国 100 年后 的人口数量便难以预测。 3 模型三 基于计算机模拟的动态模型 3.1 数据处理 在此模型中,我们综合考虑人口的出生死亡率、出生人口性别比例、城镇化水平等 因素,把数据做如下处理: 3.1.1 取平均消除异常值 附录 2 中的数据是根据实际情况调查得知的,但是在某些年份,可能由于某些自然灾 害、意外事故等因素,导致人口死亡率上升,出生率下降。为了排除这些意外因素对人 口发展造成的异常波动,我们把 2001 到 2005 年五年的所有数据作平均化处理,即从 0 至 90 岁的各个年龄的各种比率做对应的平均;同时对于每一年的抽样调查人数也修正,首 先求出每一年抽样的城镇乡男女人数各自占该年总抽样人数的比例,之后将其代入 s(t) = a + bt ( s(t) 为第 t 年比例,记 2001 年 t=0,2002 年 t=1,之后以此类推)拟合,得到 其各自的拟合函数,并且经检验得到每一个的欧氏距离数量级均为 103 ,可知这个修正 比较满意。 8
分享到:
收藏