logo资料库

数学建模范文人口增长和老龄化分析.pdf

第1页 / 共19页
第2页 / 共19页
第3页 / 共19页
第4页 / 共19页
第5页 / 共19页
第6页 / 共19页
第7页 / 共19页
第8页 / 共19页
资料共19页,剩余部分请下载后查看
中国人口问题 摘要 本文通过对现有政策下中国未来人口的预测,来分析中国的人口结构,性别比例等 影响人口变化的因素及人口指标,并针对发现的问题提出合理化的建议。 针对问题一,根据所查找到的数据,采用 Logistic 模型进行粗略预测,后改进使 用 Leslie 人口预测模型进行人口预测,预测出在“全面二胎”政策下,中国未来人口 的变化趋势,根据第六次全国人口普查统计数据,结合生育率,死亡率等相关数据综合 分析,求解出在“全面二孩”政策下未来 50 年的人口趋势。从而分析生育水平低,人 口老龄化等问题。 针对问题二,寻找所需因素,建立多元回归模型。利用生育政策,人均 GDP,城市 化率来对生育模式和人口发展建立方程,代入数据拟合参数,反代入已知的生育政策数 据得到系数值,联立方程进行求解。 针对问题三,根据不同的因素对我国未来人口影响的程度,通过各种渠道查找了人 均 GDP、城市化率、总生育率的相关数据。通过拟合多元回归模型的相关系数,建立总 生育率和人均 GDP、城市化率、生育政策的多元回归模型。预测这些因素对人口增长是 负作用,因此促进人口增长应该降低生育成本。 针对问题四,对于本文的预测结果,可以大致了解未来人口的发展趋势,对政府部 门的报告主要是从预测的结果,出现某些情况的原因以及应对发现问题的措施和建议来 汇报。 关键词: Logistic 模型 Leslie 人口预测 人口老龄化 多元回归模型 1
一、 问题重述 1.1 问题的背景 在全面两孩政策正式实施之前,卫计委牵头进行了全面两孩政策影响生育的预测研 究。根据最后完成的《实施全面两孩政策人口变动测算总报告》,在 2016 年放开全面两 孩,预计 2017 到 2021 年 5 年间增加两孩出生数将为 1719.5 万人,平均每年增加 340 万左右。其中,2017 年出生人口总量将达到 2109.9 万人,2018 年达到峰值,为 2188.6 万人。 国家统计局 2018 年 01 月 18 日公布数据显示,去年全国出生人口数量和人口出生 率双双下降。 1.2 需解决的问题 (1)在现有政策下建立模型预测中国未来 50 年人口的变化趋势。通过计算一些主 要人口指标定量分析未来我国可能面临哪些严重的人口问题。 (2)分析影响我国人口变化的主要因素,研究这些因素未来的变化情况,并建立人 口增长与这些因素之间的模型。 (3)通过以上模型分析如何针对各因素的特点提出有效促进人口合理增长的方法。 模拟并检验你的模型和结果,定量分析并研究未来我国需要采取何种应对政策才能逐步 调节我国人口数量、结构达到合理水平并能持续地发展下去。请提出你们建设性的建议, 并分析其合理性和可行性。 (4)依据你的研究给政府相关部门写一份 800 字左右的报告。 二、 问题分析 2.1 问题一的分析 问题一首先要求我们对未来 50 年的人口趋势进行预测,考虑自然资源、环境等因 素对人口增长的阻滞作用,采用 Logistic 模型,构造 Logistic 阻滞模型方程进行拟合 求解器相关系数,得到具体的方程之后,代入各个年份即可获得所需预测人口,但是这 种预测方式无法对人口年龄结构和男女性别比例等进行考虑。所以无法对未来的人口老 龄化和人口负增长进行预测,改进模型,使用 Leslie 人口预测模型,寻找所需要的同 时间人口的年龄分布,不同年龄段的死亡概率,生育概率,男女比例。根据这些求解 Leslie 矩阵,获得各年龄段的预测值。之后对死亡率进行数拟合,结合预测数据得到的 自认增长率,可以求解出生率。再通过 Leslie 模型所得出的年龄结构,分析老龄化和 低生育率问题。 2.2 问题二的分析 对于问题二,问题二需要我们自行选择因素,因为选择的因素同所求数据之间的关 系可以进行探索,所以进行多元回归分析,对生育政策,人均 GDP,城市化率进行模型 公式的建立,因为生育政策难以进行直接的数量量化,所以这里需要引入虚拟变量的概 念。查找数据进行拟合。待定参数,在得到参数之后进行构造生育模式概率函数,人口 发展方程组,进行求解,对未来人口变化情况进行分析。 2.3 问题三的分析 对于问题三,根据问题二可知人均 GDP、城市化率、生育政策对总生育率的影响我 们可将这三个因素进行拟合,得到总生育率的多元拟合函数。可根据总生育率预测我国 未来人口增长趋势,分析人均 GDP、城市化率、生育政策对人口增长的影响。 2
2.4 问题四的分析 根据对人口结构和人口数量的研究的结果,切合实际,对政府部门写一篇总结报告。 三、 模型的基本假设 1. 假设研究的时间内不会发生大型灾难,战乱。 2. 假设预测时间内国民经济稳定,不存在较大的经济波动。 3. 假设预测的年份没有人口迁移带来的人口数量变化。 4. 假设所有数据均真实可靠,符合统计的要求。 符号 h t 四、 符号说明 符号说明 人口增长率 人口的最大数量 生育模式 年龄 死亡率 女性存活率 最小生育年龄 城市化率 单位 个 岁 五、 模型的建立及求解 5.1 问题一 5.1.1 问题一的模型建立 以下方程组: (1)Logistic 模型 Logistic 模型,主要是考虑自然资源、环境等因素对人口增长的阻滞作用,在指数 增长模型上改进得到的,其中阻滞作用主要影响人口增长率 r,r 岁人口的数量 x 的增 加而下降,设 为人口数量对增长率的影响,设 表示时刻 t 时的人口数量,得到 设 是 的线性函数,即: 设人口最大数量为,当人口达到最大承载量则不再增长即此时 r=0,带入 得到 得到阻滞增长模型: 3
得到 相关系数类似的,表示一个随机变量与多个随机变量关系的数字特征,用来反映回 归模式说明因变量变化可靠程度的一个统计指标,一般用符号“R”表示,可定义为已 被模式中全部自变量说明的自变量的变差对自变量总变差的比值。 t 可决系数t的定义 对于该 Logistic 阻滞增长模型有:t 令t无限逼近与 1,利用该拟合系数判断拟合的效果是否理想。 需要注意的是,对于 Logistic 阻滞增长模型,它的人口最大数量为需要在计算 式提前进行预设,人口最大数量为对于 Logistic 阻滞增长模型的数据预测和输出是 策情况和t做出。 具有直接影响的,因此我们可以使用最优化法和迭代进行梯度上升来寻找最优参数。 对这个系数进行梯度上升或梯度下降寻求拟合的最适应结果。判断依据可以考虑实际政 对于该模型在本问题中的运用,首先需要根据所寻找到的实际人口数据,以 1990 年为初始年份,以每五年为一个单位,做出其在 1990 年到 2015 年的实际曲线和 Logistic 模型曲线。根据该模拟曲线可以得到相关信息,做出预测。 对于该问题,需要的是线粗略选择一定范围数据的到一个大致的相当对合适的系数, (2)Leslie 人口预测模型 Leslie 人口预测模型是指预测人口按年龄组变化的离散型模型,它克服 Logistic 模型只考虑人口总数的缺陷,能够更好地用于预测人口比例结构,并且本题需要具体分 析在现有政策下人口老龄化程度,人口性别比,人口抚养比,人口老化指数等。模型原 理是以性别分组,由于男女性别比 1:1,在此研究女性某一初始阶段的分年龄别人口数 作为一个列向量,通过年龄别生育率,年龄别死亡率构建 Leslie 矩阵并乘以年龄别人 口数的列向量得到预测女性年龄人口的列向量,通过男女比例推算出总人口数。 首先将人口进行分组,以年龄段作为依据,将年龄离散化,大小均等得分成 m 个年 龄组,同时考虑到不同时间人口的年龄分布,需将时间同时离散化为时段,间隔可与年 龄组的间隔相同,时间段 t=0,1,2,3…k…,设在时间段 k 第 i 个年龄组的女性数量为 ,i=1,2,3…m-1,设第 i 个年龄组的女性生育率为,女性的死亡率为,存活率 为 tt ,i,,…,m t t tn 4 则上式可化为
得到 Leslie 矩阵 当矩阵 L 和年龄组初始向量都已知时,可以预测任意时段 k 的女性人口的分布结构。 对 Leslie 模型分析: 通过以上内容可以得到: 对于以上模型论述,补充条件:,,,ͳ…ǡ ,,,ͳ…,且不全为。 矩阵的任意特征根都小于。 当 k充分大时有 。 态,各个年龄组的人口数近似按照-1 的比例增长。 当,人口数最终递增。 当,人口是最终递减。 当,人口数保持稳定。Logistic 阻滞模型和 Leslie 模型的对比 当时间充分大时,女性人口的年龄结构向量趋于稳定状态,即年龄形态趋于稳定状 因为 Leslie 模型需要有各年龄段一年中的死亡概率和生育概率作为建模的前置条 件,所以要保证这些数据的准确性。之所以选用 Leslie 模型进行与预测,是因为它的 模型对年龄结构有着确切的处理,Leslie 矩阵的运算过程中包括了对于初始信息的每一 年的动态考虑,即每一年的年龄结构变化都有着自己的变动分析,这是 Logistic 阻滞 模型单单进行拟合出像一个公式进行代入出现结果而没有的优点。Leslie 模型对年龄结 构的考虑,使得该模型对于人口负增长情况甚至是“雪崩”情况的出现在预测中存在了 出现的可能性,较之 Logistic 阻滞模型更为灵活。 对于该模型在本问题中的运用,需要注意的是对男女和年龄结构都要进行分类,因 此前期数据的采集和处理过程比较繁琐。 (3)建立模型计算出生率死亡率指标 在上述模型进行求解得出预测数据后,可以较为轻易地得到未来五十年的自然增长 率的相关数据,但是未来五十年的出生率和死亡率的数据仍然需要我们通过计算得到。 根据论文题目中所给的数据分析,集合所搜查到的信息,可以发现。国家二胎政策 对与人口自然增长率的影响并不显著,只一点可以在 2013 年的“单独二胎政策”施行 后人口增长率没有太大变化的数情况上得以印证。事实上,除了 16 年达近 13 个千分点 的水平,十年来的生育率都保持在 12 个千分点的水平。 5
年份 05 06 07 表 1 05 年到 16 年中国人口出生率 08 09 10 11 12 13 14 15 16 12.4 12.09 12.10 12.14 11.95 11.90 11.93 12.10 12.08 12.37 12.07 12.95 出生 率 所以说生育率已基本趋于稳定。但是伴随着人口老龄化趋势,出生率和死亡率也一 定会有所变化。如今其实我们已经迈入人口老龄化社会。近些年的人口死亡率也有了细 微提升态势。 05 06 07 表 2 05 年到 16 年中国人口死亡率 13 09 10 11 12 08 14 15 16 6.51 6.81 6.93 7.06 7.08 7.11 7.14 7.15 7.16 7.16 7.11 7.09 年 份 死 亡 率 利用 SPSS 对出生率死亡率进行出图,发现相对来说死亡率较为稳定,对死亡率在 SPSS 上进行拟合回归分析,可以得到今后的死亡率数据。然后利用出生率,自然增长率, 死亡率的关系进行二推一,获得数据。 5.1.2 问题一模型的解答 根据国家统计局 1990-2017 年每年的人口数量,运用 MATLAB 进行 Lositic 模型建 立,比较拟合程度,通过最优化法,选取最合适的拟合曲线和拟合数据,进行分析获取 预测数据。通过拟合得到的数据经过分析,发现其在随着时间延长,其人口总数趋于稳 定。其人口总数在较长时间后逼近 其人口最大容量为 Lositic 模型求解公式为: t 根据该公式,所解得的函数图像为一随时间延长逐渐趋于稳定的递增函数。 6
图 1 Logistic 阻滞模型效果图(未进行最优化) 根据实际情况,因为在上世纪 60 年代到 90 年代出现激增,之后又有明显的下滑, 这导致在本世纪 30 年代左右开始,人口极有可能将进入一个逆增长阶段,但是仅 仅通过 Logsitic 阻滞模型无法得到一个有效的求解方案。根据所寻找到的实际人口数 据,以 1990 年为初始年份,以每五年为一个单位,做出其在 1990 年到 2015 年的实际 曲线和 Logistic 模型曲线。根据该模拟曲线可以看出,利用 Logistic 模型曲线在拟合 预测未进行最优化处理,选择数据不当的情况下,很容易同实际情况出现较大的误差, 这种误差除了单单靠寻找最佳可决系数是无法消除的,曲线也以此无法充分拟合。 进行最优化处理,对于这部分的最优化方法有很多,对本模型我们采用迭代处理, 首先输入一个估计的最大容量对这个容量值进行递增和递减,通过比较得出最优解。 7
图 2 Logistic 阻滞模型效果图(进行最优化) 经过 Logistic 阻滞模型预测得出,在未来我国人口将会稳定在 14.7 亿人左右。 Logistic 阻滞模型预测欠缺了对我国人口年龄结构的考虑,因此并不适用与会出现 老龄化等状况的人口增长并不稳定我国人口预测上。所以对求解方案进行优化,选用 Leslie 模型进行进一步分析。 Leslie 模型的运用需要更过的更详细的信息来提供对预测的支持。其中最重要的是 对同一时间下不同年龄的人口的生育率和死亡率进行分析,这些数据需要我们付出耐心 去寻找或者推算。因为人口老龄化和人口“雪崩”的可能性的确存在所以说我 Leslie 模型具有更好的适应性。在进行年龄分层和各年龄段死亡概率生育概率数据统计后,进 行矩阵构造,求出一系列的所需数据,完成模型构造,进行求解做出预测模型。 8
分享到:
收藏