基于bayesian层次时空模型的我国老龄化分析与预测-李俊明.pdf
《基于bayesian层次时空模型的我国老龄化分析与预测-李俊明.pdf》由会员分享,可在线阅读,更多相关《基于bayesian层次时空模型的我国老龄化分析与预测-李俊明.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第33卷第8期2016年8月统计研究Statistical ResearchV0133,No8Aug2016基于 Bayesian 层次时空模型的我国老龄化分析与预测李俊明内容提要:本文首次利用Bayesian层次时空模型,以1995-2014年全国省级人口统计数据为基础,分析了近20年来我国老龄化在空间和时间上的变化规律。研究发现:我国高老龄化地区分布已形成x型地理空间分布结构,东部地区为主,西部地区为辅,总体老龄化率呈上升趋势;四川、重庆、辽宁、安徽、湖北和湖南等6个地区不仅是老龄化热点区域,而且老龄化增速也快于全国平均水平,特别是四川I和重庆,老龄化程度和增速都是全国最高;中西部地区老龄
2、化程度虽然低于全国平均水平,但增加速度却高于全国平均水平;北京、天津、上海、江苏、浙江和广东等6个高老龄化地区的老龄化率趋于平稳或增速放缓;预测“全面二孩”政策情境下我国2030年老龄化率为1319(1110,2094)。关键词:Bayesian层次模型;老龄化;时空统计分析DOI:1019343jcnki111302c2016,0801 l中图分类号:C812 文献标识码:A 文章编号:10024565(2016)08008906Space-time Variation of Chinese Aging Based on BayesianHierarchy Spatio-temporal M
3、odelLi JunmingAbstract:Based on provincial series statistical population data from 1995-2014,this paper investigates the spatiotemporal variation of Chinese aging during last 20 years,by employing Bayesian hierarchy spacetime model and linearregression model firstlyThere are 5 new findingsThe spatia
4、l structure of high aging rate has formed as Xshaped,witheastern region playing a main role and western region playing a subsidiary roleSix provinces,such as,Chongqing,Sichuan,Liaoning,Anhui,Hubei,and Hunan,are the old aging hot spots,and increase faster than the national averageEspecially,Chongqing
5、 and SichuanS increasing annual augmenters of aging rate are 039 and 034 percent pointrespectivelyThe aging degree in middleeastern regions is lower than nations increase and the rate is faster than nationsThere are six high aging provinces,egBeijing,Shanghai,Jiangsu,and Zhejiang,whose increasing ra
6、te are to bestable or lower than nations,experiencing a slower increasing processAccording to our prediction,Chinese aging ratewill be 1319(1 1102094)if the universal two-child policy has been implementedKey words:Bayesian hierarchy model;Aging;Spacetime statistical analysis一、引言人口老龄化是一个国家或地区经济社会发展到一
7、定阶段的一种必然趋势,目前已成为全世界普遍关注的问题。11。根据1956年联合国人口老龄化及其社会经济后果划分的标准,将65岁以上的人口称为老龄人口,一个国家或地区的老龄人口占比超过7,则称其为老龄化社会。根据2010年第六次全国人口普查数据计算,我国老龄化率已达887,已经步入老龄化社会国家行列。老龄化问题也已成为我国当代三大人口问题之一。围绕我国老龄化问题,国内很多学者已经开展了一些相关研究。谢安3。研究了我国人口老龄化总体变化特征,指出我国老龄化具有速度快,规模大的特点。李秀丽和王良健。41利用方差分解等方法研究了我国老龄化的区域差异,认为东、中、西部地万方数据90 统计研究 2016年
8、8月区老龄化呈现“高、中、低”的特点,且各地区间和东部地区省际间差异有减少趋势,总体省际间差异不断扩大。王志宝等o利用第四、五、六次全国人口普查数据分析了我国老龄化存在的地区差异和特征,认为各省区人口老龄化演变阶段差异大,将全国划分为四类不同的人口老龄化类型。孙蕾等M1基于人口普查的省级人口数据,利用面板数据模型,研究了我国老龄化程度地区性差异,研究认为各地区老龄化水平成呈上升趋势,但增幅有异。赵儒煜等H。以2000-2010年的年鉴统计数据为基础,从空间计量经济学的角度研究表明,我国人13老龄化的区域溢出效应非常显著,存在显著空间异质性,人口老龄化较高地区主要集中在长三角和环渤海地区,全国老
9、龄化增速有所放缓。已有研究主要以人口普查数据为基础,采用古典统计模型或计量经济学模型分析我国老龄化问题。古典统计是基于大样本推断总体,把未知参数看作一个未知的固定量,缺点是过于依赖样本信息,如果样本有偏或样本稀疏,则会使参数估计出现偏差。而Bayesian统计是把未知参数也看作是随机变量,并充分利用先验信息,以概率分布的形式给出参数估计,更加符合人类认知自然的过程。特别是对于空间数据而言(同时具有小样本和自相关的特性),基于大样本推断总体的传统统计模型受到更多挑战,而Bayesian层次模型通过引入先验信息,充分考虑各种不确定性,以概率分布的形式估计参数,可在一定程度上克服小样本缺陷。另外,时
10、空交互模型同时考虑空问相关和随机效应,两者的结合Bayesian层次时空模型为时空数据统计分析提供了新的思路和方法。本文首次应用Bayesian层次时空模型,以长时间连续序列人口统计数据(1995-2014年)为基础,分析了我国近20年老龄化的时空演化特征。二、数据和模型(一)数据来源与说明本文研究大陆31个省级行政区域,时间跨度20年:19952014年。人口结构数据来自于相应年份的中国人口和就业统计年鉴,其中,2000年和2010年数据分别源自第五次和第六次全国人口普查,其余年份数据是采用分层、多阶段、整群概率比例抽样方法获得的人口变动抽样调查数据。本文研究的老龄化率是指某地区城镇和农村总
11、体常住人口中,在某一年份年龄在65岁及以上的常住人口所占比重。(二)Bayesian层次时空模型Bayesian层次时空模型将Bayesian层次模型和时空交互模型两者相结合,在一定程度上克服了时空数据小样本和自相关的缺陷,充分利用总体信息、样本信息和先验信息,估计推断时空参数的后验分布。Bayesian层次模型主要包括三个部分:数据模型:l,1 0,P(Y 0,) (1)过程模型:0 DP(0 O) (2)参数(超参数)模型:9P() (3)其中,y代表观测样本,0和分别代表过程参数集和(超)参数域。数据模型主要体现的是样本信息,由似然函数来表达,过程模型反映的是研究问题的变化机理,是链接样
12、本与参数的桥梁,这一点与传统统计思想一致,(超)参数模型则是根据先验信息,给出(超)参数的先验分布形式。根据贝叶斯理论,(超)参数的后验分布可以表示为:P(9,0 Y)z P(Y 0,0)P(0 O) (4)在后验分布的实际计算中,一般会涉及到高维联合概率密度函数的估计问题,目前主流采用基于Gibbs抽样的马尔科夫链一蒙特卡洛(MCMC)法实现。Bayesian层次时空模型是Bayesian层次模型与时空交互模型的结合81。空间自相关性是空间数据的一大特点,并不能满足独立同分布的特征,而且对于某一个空间单元而言,样本数据及其自由度非常有限,基本难以做到大样本抽样,更不能通过大样本估计总体。而B
13、ayesian层次时空模型可以克服这个缺点,通过充分利用先验信息,同时考虑空间的自相关和随机不确定性,以概率分布的形式描述时空过程,Bayesian层次时空模型的三个子模型为:数据模型:Y。P(Y。(0。)l) (5)过程模型:0。=s(i)+理(t)+皿。(i,t)+占。(6)参数(超参数)模型:一P() (7)其中,Y。是时空观测样本值,0。:是时空因变量,s(i)和01(t)分别代表稳态空间相对风险和总体变化趋势,n。(i,t)表示时空交互项,s。是随机噪声,是(超)参数集。考虑到老龄化人口观测数据属于计数数据,且个人老龄化概率不完全相同,会存在过度散布情形,因此本文采用泊松一伽马混合模
14、型,等效于负二项万方数据第33卷第8期 李俊明:基于Bayesian层次时空模型的我国老龄化分析与预测 91分布模型一,即:y8Possion(A。u。) (8)“。Gamma(rr。) (9)其中,yy8表示在第i(i:l,2,31)个地区第t年65岁以上的老龄化人口数,A。表示i地区t年的老龄人口数均值,3,。是i地区t年的随机效应参数,r。,是相应的散度系数。9 o。对应的概率密度函数为:肼。rJ=高等斋(忐广”(点广(10,过程模型数学表达式为:log(p5)=a+s。+(bot+秽,)+blit+P。(1 1)其中,p8表示i地区在t年的老龄化率,n代表研究时期内全国总体老龄化固定基
15、础常数,s代表研究时期内第i地区老龄化的空间相对风险参数,bot+。描述了全国老龄化的总体时间变化趋势,由线性变化趋势加随机效应”,构成,允许总体趋势呈非线性变化,blit+代表研究时期内各研究子区域的局部变化趋势,b度量从总体变化趋势中分解出的局部变化程度,若大于0说明其局部变化强度高于总体变化趋势,若小于0说明局部变化强度低于总体变化强度。t+=一t删表示相对于研究时期内中间时点t删的时间跨度,占。是高斯噪声随机变量。本文引入Besag York Mollie(BYM)模型1叫确定参数s。和b,。的先验分布,BYM模型通过卷积运算实现空间结构和非结构随机效应的相互作用,数学表达式为:f(y
16、 I臼,)=n八),。1 0。p) (12)其中,z(Y J秽,9)表示样本似然函数,5。表示时空域,Y。口。9含义同上文。利用条件自回归先验分布表达空间结构随机效应,空间邻接矩阵W采用一阶“皇后”邻接形式,相邻省份的渤,=1,r反之跏。=0,其先验分布形式如式(13)所示:s。I(Sl一mS-)7(rk Bi。B-圭(w。-pfw)】) (13)其中,S。是时空随机变量,r。和P。分别代表时间和空间相关性参数,B。=,一P,w:1 W,是单位矩阵,or,是t时期的总体方差,上述先验分布对应的概率密度函数为:八sI,s2,。,5 r)=八sf sj,52,Si)八s3 sl,s2)八s2 s1
17、)八s) (14)其中,s。,s,s,表示每一时期t对应的空间样本观测值。时间随机效应参数先验分布也采用条件自回归先验形式,时间邻接关系采用一维一阶相邻矩阵,邻接权重为1,否则为0。高斯噪声s。N(盯:),根据Gelman(2006)、1的研究结论,模型中所有随机变量均方差(如盯。盯,)的先验分布都被确定为严格的正值半高斯分布+。(0,10)。在所有参数后验分布计算的基础上,对研究区域进行聚类分析。首先根据各地区老龄化率的空间相对风险的高低分为热点、温点和冷点区域。热点、温点和冷点区域的分类准则是基于Richardson等(2004)纠提出的分类原则:如果某地区的空间相对风险大于l的后验概率P
18、(exp(s,)1 data)大于08,则属于热点区域;若小于02,则属于冷点区域;界于0208之间的区域为温点区域。就本文研究的老龄化问题而言,热点区域老龄化率高于全国总体水平的后验概率大于08,冷点区域老龄化率低于全国总体水平的后验概率小于02,温点区域老龄化率风险与全国总体水平相当。再者,根据各地区老龄化局部变化趋势将其分为强变化、稳定态和弱变化等3种局部趋势状态区域,分类原则还是基于Richardson原则。此外,为了定量评价Bayesian时空分解的稳定组分对整个时空变化过程的解释度,本文计算了方差成分系数,按如下公式计算:。 var(s。+bot +wf)VPC=二二二二一var(
19、s。+bot+口,)+var(bt+“)100 (15)方差成分系数VPC越大,则时空组分分解对时空变化过程的解释度越高,反之亦然。换句话说,方差成分系数的大小反映了总体时空组分对时空变化过程的代表性。(三)Bayesian估计及预测本文估计通过WinBUGS。J实现。为了保证模型运行的收敛性,本文采用了两条MCMC链,每条链的迭代次数均设置为20万次,其中15万次预烧期,5万次估算迭代。收敛性通过GelmanRubin统万方数据92 统计研究 2016年8月计参数5J评估,其值越接近于1,则收敛性越好,本研究中所有参数的GelmanRubin统计值都低于1009,说明该模型收敛性较好。在Ba
20、yesian估计基础上,本文还对2030年我国老龄化水平进行了预测。自2016年起,我国开始实施“全面二孩”政策,尽管这不能改变未来3040年内我国老龄人口的规模,但会使我国总人I=1在2030年出现增长,从而在一定程度上延缓了我国老龄化趋势1。假设P撕。为未实施“全面二孩”政策时2030年末全国总人口数预测值,P:增为实施“全面二孩”政策后2030年末全国总人口增加预测值,P嚣署为未实施“全面二孩”政策情境下2030年全国老龄化率预测值,则实施“全面二孩”政策情境下2030年全国老龄化率预测值尺;器满足公式(16):p naging尺:aging=竺争(16)1 2030匹1 2030增三、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 bayesian 层次 时空 模型 我国 老龄化 分析 预测 李俊明
限制150内