人口预测模型(经典)(26页).doc





《人口预测模型(经典)(26页).doc》由会员分享,可在线阅读,更多相关《人口预测模型(经典)(26页).doc(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-中 国 人 口 预 测 模 型摘要本文对人口预测的数学模型进行了研究。首先,建立一次线性回归模型,灰色序列预测模型和逻辑斯蒂模型。考虑到三种模型均具有各自的局限性,又用加权法建立了熵权组合模型,并给出了使预测误差最小的三个预测模型的加权系数,用该模型对人口数量进行预测,得到的结果如下:单位:(万人)年份20062007200820092010预测值134840.9137027.351377785.7139360.4140857.4其中加权系数为:0.24282,0.34055,0.41663。其次,建立Leslie人口模型,充分反映了生育率、死亡率、年龄结构、男女比例等影响人口增长的因素,并
2、利用以1年为分组长度方式和以5年为分组长度方式预测短期和长期人口增长,得如下数据:年份2006200720082009201020112012人数(万)130990131230131430131620131800132000132220年份2016-20202021-20252026-20302031-20352036-20402041-20452046-2050人数(万)144000148000150000150000151000150000149000然后对Leslie人口模型进行了改进,构建了反映生育率和死亡率变化率负指数函数,并给出了反映城乡人口迁移的人口转移向量。最后我们BP神经网络
3、模型检验以上模型的正确性关键字:一次线性回归 灰色序列预测 逻辑斯蒂模型 Leslie人口模型BP神经网络一、问题重述1. 背景人口增长预测是随着社会经济发展而提出来的。由于人类社会生产力水平低,生产发展缓慢,人口变动和增长也不明显,生产自给自足或进行简单的以货易货,因而对未来人口发展变化的研究并不重要,根本不用进行人口增长预测。而当今社会,经济发展迅速,生产力达到空前水平,这时的生产不仅为了满足个人需求,还要面向社会的需求,所以必须了解供求关系的未来趋势。而人口增长预测是对未来进行预测的各环节中的一个重要方面。准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和
4、实用意义。2. 问题人口增长预测有短期、中期、长期预测之分,而各个国家和地区要根据实际情况进行短期、中期、长期的人口预测。例如,中国人口预期寿命约为70岁左右,因此,长期人口预测最好预测到70年以后,中期4050年,短期可以是5年、10年或20年。根据2007年初发布的国家人口发展战略研究报告(附录一)及中国人口年鉴收集的数据(附录二),再结合中国的国情特点,如老龄化进程加速,人口性别比升高,乡村人口城镇化等因素,建立合理的关于中国人口增长的数学模型,并利用此模型对中国人口增长的中短期和长期趋势做出预测,同时指出此模型的合理性和局限性。二、问题的基本假设及符号说明问题假设1 假设本问题所使用的
5、数据均真实有效,具有统计分析价值。2 假设本问题所研究的是一个封闭系统,也就是说不考虑我国与其它国家的人口迁移问题。3 不考虑战争 瘟疫等突发事件的影响4 在对人口进行分段处理时,假设同一年龄段的人死亡率相同,同一年龄段的育龄妇女生育率相同。5 假设各年龄段的育龄妇女生育率呈正态分布6人类的生育观念不发生太大改变,如没有集体不愿生小孩的想法。7.中国各地各民族的人口政策相同。符号说明-第t时间区间内第i个年龄段人口总数-第t时间区间内第i个年龄段人口总数占总人口的比例-第t时间区间内第i个年龄段中第k年龄值人口总数占总人口的比例-第t时间区间内各年龄段人口总数的向量-第t时间区间各年龄段人口总
6、数向量转移矩阵-第t时间区间内第i个年龄段人的生育率-第t时间区间内第i个年龄段人的死亡率-第t时间区间内第i个年龄段中第k年龄值的死亡率-第t时间区间内第i个年龄段人的存活率- 第t时间区间男性人数与女性人数的比值-第t时间区间内第i个年龄段育龄妇女的生育率m-每个年龄段上年龄值的数目三 问题分析本问题是一个关于人口预测的问题,与以往不同,本问题需要根据中国特殊的国情去研究,我们根据对问题的分析并结合实际情况认为对人口产生主要影响的因素有以下四个:生育率、死亡率、年龄结构、男女比例。在这里需要说明的是对于人口产生影响的一些因素,如经济发展状况,生态环境情况、已婚夫妇对生育所持的态度、医疗技术
7、的发展等,我们认为它们对人口的增长是通过作用于以上四个指标而间接发挥作用的。而对于诸如战争爆发、疾病流行等突发因素,由于其不可预测性,我们不考虑1生育率生育率代表育龄妇女生育人口的能力,从一定意义上讲生育率的高低控制着人口增长率高低,通常来说生育率越高人口增长率越高,所以说生育率是人口增长的源头。生育率的影响因素很多,首先是年龄因素,不同年龄段的育龄妇女的生育率不同,通常20岁至30岁的育龄妇女的生育率最强;此外是地域因素,受政策因素、观念认识、周边环境等影响乡村育龄妇女的生育率高于城市育龄妇女的生育率;还有其它因素的影响,比如大规模疾病会降低育龄妇女的生育率。2死亡率死亡率表示一定时期内一个
8、人口群体中死亡的人数占该人口群体的比值,和生育率一样死亡率的高低同样控制着人口增长率高低,如果说生育率是人口增长的源头,则死亡率是人口增长的汇点。同样影响死亡率的因素很多,首先不同年龄段的死亡率不同,通常老年人和刚出生的婴儿的死亡率较高;从长远来看,随着医疗水平的提高,整个人口群体的死亡率将会成下降趋势;此外一些突发事件,如战争、疾病等,将会使使那一段的人口死亡率大幅度提高。3年龄结构年龄结构反映了总体人口在各年龄段分布情况,年龄结构蕴涵的信息量很大,从其中我们可以实现对很多问题的分析,比如从年龄结构我们可以分析出社会的老年化程度,此外从年龄结构我们可以判断出不同时间段人口出生的情况,比如年龄
9、结构不仅反映了总体人口在各年龄段分布情况,而且考虑到不同年龄段人口生育率、死亡率不同等情况,我们可以在年龄结构中有效反映这些差异4男女比例男女比例反映了总体人口中男性与女性人数的比较关系,男女比例值能反映出体人口中男性与女性人数是否协调,男女比例主要受男女出生比和男女死亡率的影 响,男女出生比正常范围在103107,也就是说出生100个女儿的同时会有103 107个男儿出生,但是在现实社会中,女性死亡率低于男性,所以男性与女性人数大致相等,社会维持在一个稳定状态。但目前我国男女出生比超过110,这不仅将导致男女比例失调,还会对人口的预测产生影响,所以在人口预测时必须将男女比例问题考虑进去。考虑
10、到人口预测分为中短期预测和长期预测,两类预测因为涉及的时间长短不同,所以考虑的因素不同,采用的方法不同。对于中短期预测,我们假设生育率、死亡率、年龄结构、男女比例均维持在同一稳定水平,这样我们采用方法有很多,。 对于长期预测,我们需要考虑生育率、死亡率、年龄结构、男女比例等因素随时间变化,此外城乡人口迁移对城乡人口结构产生影响,尽管以上因素短期内积累效应较小,但在长期中必须考虑。在预测方法上我们选用了基于以往人口数据的一次线性回归,灰色、时间序列预测,逻辑斯蒂模型和基于年龄结构并生育率、死亡率随时间Leslie人口模型出 生 率年龄结构按影响增长因素建立模型型男女比例Leslie人口模型死 亡
11、 率中国人口预测模型按人口统计量建立模型一次线型回归逻 辑 斯 蒂灰 色 预 测熵权法组合模型中短期长 期BP神经网络模型 四 数学模型4.1.熵权组合模型有关于人口增长预测的模型很多,比如灰色GM(1,1),移动平均数法,指数平滑法,一元线型回归,马尔萨斯人口模型,宋健人口模型等等,但是每种预测方法的精度往往也不同。组合模型和单个模型比起来,具有较高的预测精度,组合预测的关键就在于确定各个预测方法的权重。本文将从一个新的角度进行研究,即从信息论的观点出发,根据各个体预测方法误差指标的信息熵,确定组合预测模型的权重,进行人口组合预测模型。本文选用了一元线性回归法,逻辑斯蒂模型法,灰色GM(1,
12、1)模型法对中国人口增长进行预测。而1978至2005年的数据见本文表一。.4.1.1灰色预测模型1.模型建立 灰色系统是指部分信息已知,部分信息未知的系统。灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模。由于生成的模型得到的数据通过累加生成的逆运算累减生成得到还原模型,再有还原模型作为预测模型。 预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。灰色预测模型建立过程如下:1) 设原始数据序列有n个观察值,通过累加生成新序列 ,利用新生成的序列去拟和函数曲线。2) 利用拟合出来的函数,求出新生序列的预测值序列 3) 利用累减还
13、原:得到灰色预测值序列: (共nm个,m个为未来的预测值)。将序列分为和,其中反映的确定性增长趋势,反映的平稳周期变化趋势。利用灰色GM(1,1)模型对序列的确定增长趋势进行预测2 模型求解根据2006全国统计年鉴数据整理得到全国历年年度人口统计表如表1.表1:全国历年年底的人口统计年份1978年1980年1985年1989年1990年1991年1992年总人口/万人9625998705105851112704114333115823117171年份1993年1994年1995年1996年1997年1998年1999年总人口/万人11857119850121121122389123626124
14、761125743年份2000年2001年2002年2003年20042005年总人口/万人126743127627128453129227129988130756根据上述数据,建立含有20个观察值原始数据序列:利用Matlab软件对原是数列进行一次累加,得到新数列为,如表2:表2:新数列误差和误差率拟核值108504109773111056112354113668114997116343误 差-9799.1-3921.81647.81978.32154.62173.62175.0误差/-9.93-3.701.461.731.861.861.84拟核值117702119079120471121
15、879121879123304124746误 差2147.72042.51918.21746.61456.61039.9538.3误差/1.791.691.571.411.170.830.42拟核值126204127680129173130683132211133757误 差-53.3-720.1-1456.4-2223.4-3001.3-3010.4误差/-0.04-0.56-1.13-1.71-2.30-2.421、 利用表2,拟合函数,如下: 2、 精度检验值 c0.3067 (很好) P0.9474 (好)3、 得到未来20年的预测值: 表3:全国历年年底的人口统计未来20年预测值年份
16、2006年2007年2007年2008年2009年2010年2011年总人口/万人135321.2136903.4138504.1140123.5141761.9143419.4145096.2年份2012年2013年2014年2015年2016年2017年2018年总人口/万人146792.7150245.5152002.2153779.4155577.4157369.5159236.8年份2019年2020年2021年2022年2023总人口/万人161098.7162982.2164887.8166815.7168766.24.1.2一元线性回归法 根据表一中的数据,本文建立一元线性回归
17、模型进行预测;为人口数 单位:万人 为年份。利用Matlab软件,用麦夸特法进行回归拟合,得到拟核值及回归方程,如下: 表八 一元线性回归模型拟合值104546.9106119.3107691.6109264110836.4112408.8113981.2拟合值115553.5117125.9118698.3120270.7121843.1123415.5124987.8126560.2128132.6129705131277.4132849.7134422.1 由此,建立如下的一元线性回归方程 相关系数:R0.9359 4.1.3 逻辑斯蒂模型(Logistic growth model)考
18、虑自然资源和环境对人口的影响,并以记自然资源和环境条件所能允许的最大人口数。把人口增长的速率除以当时的人口数称为人口的净增长率。如果人口的净增长率随着的增加而减小,且当时,净增长率趋于零。因此人口方程可写成 其中为常数,此模型就叫逻辑斯蒂模型。我们把1978年至2005年全国历年年底总人口的数值组成一个观察矩阵,其中的每一个数值称之为观察值。本文利用spss软件,得出与观察值一一映射的拟核值,残差值和cook距离,见下表: 表九 用spss软件得到各观察值所对应的拟核值,残差值和标准残差拟合值97077.7101458.9105412.6108940.84112057.91114787.4 1
19、17159.2 残差-818.74-2753.91438.353763.152275.081035.5111.73标准残差-0.7505-2.05480.30512.56991.55370.70980.0080拟合值119206.2120962.7122462.4123737.3124817.2125729.2126497.3残差-689.28-1112.76-1341.41-1348.34-1191.28-968.25-711.37标准残差-0.4707-0.7540-0.9009-0.8985-0.7899-0.6410-0.4720拟合值127142.9127684.4128138.01
20、28517.4128834.5129099.2残差-399.93-57.47314.93709.501153.451656.76标准残差-0.2670-0.03870.21470.49060.81010.941从新数据得到 F372.3471 p值0.001本文建立逻辑斯蒂模型: 相关系数R0.98884.1.4. 组合模型建立1、熵权法的概念及基本步骤熵权法是一种决定指标的方法,我们知道,综合指标取决于单个指标数的确定,一般情况下的权重是根据经验来确定的,但是这种确定权重的方法缺少科学根据,也不能保证确立的综合指标能反映原始指标的大部分信息,且权重的确立因人而异,所以其应用受到了限制,而熵权
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人口 预测 模型 经典 26

限制150内