基于BP网络与空间统计分析的山东人口空间分布模式预测.pdf
《基于BP网络与空间统计分析的山东人口空间分布模式预测.pdf》由会员分享,可在线阅读,更多相关《基于BP网络与空间统计分析的山东人口空间分布模式预测.pdf(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 34卷第 6期2009年 11月测绘科学Science of Surveying andM appingVol?34No?6Nov?作者简介:张锦宗(1973-),男,甘肃天水人,聊城大学讲师,北京师范大学人文地理学专业博士。E-mai:lzhuyuxin_ 402 163?co m收稿日期:2008-06-26基 金 项 目:聊 城 大 学 青 年 项 目(X071015)基于 BP网络与空间统计分析的山东人口空间分布模式预测研究张锦宗?,朱瑜馨?,周?杰?(?北京师范大学地理与遥感学院,北京?100875;?聊城大学环境与规划学院,山东 聊城?252059)?摘?要?运用 BP网络对山
2、东省 17地市未来人口总量进行预测,在预测数据的基础上运用空间自相关方法对未来人口的空间分布模式进行分析。研究表明:2005-2010年山东省人口密度的空间分布模式总体呈现?西南-东北?模式,存在着空间集聚现象;2006-2010年 17地市局部空间关联类型基本没有发生变化,西部和南部 8个地区存在着明显的?高-高?集聚;北部 5个地区存在着明显的?低-低?集聚;淄博和青岛存在着两个?高-低?关联的孤立点。?关键词?BP网络;空间自相关;空间模式;空间统计?中图分类号?P208?文献标识码?A?文章编号?1009-2307(2009)06-0162-031?引言人口增长与空间分布是影响区域长远
3、发展的重要因素,我国学者对这两方面的问题也做了许多有益的研究。对于人口总量预测的研究主要有:李永浮等 2006年利用 Logistic曲线拟合和等纬递补灰色理论预测了 2010年北京市流动人口的增长情况 1;陈文权等 2008用 leslie修正模型对中国未来人口进行长期预测 2;毕小龙等 2007年采用 BP神经网络模型对 2002 2015年全国乡镇人口中 0 17岁年龄段的人口进行了预测 3;门可佩等 2007年采用灰色模型理论对中国人口进行了预测4。对于人口空间分布研究主要集中在以下几个方面:?按人口分布的地域结构把区域分为不同的圈层,来探讨人口空间分布及演变 5-8;?用空间相关分析
4、方法、聚类分析方法、核密度估计法等来探讨区域人口空间分布特征 9-11;?通过人口数据空间化方式探讨人口空间分布 12-13。将二者结合起来,陈楠等 2006年采用灰色理论,应用全局自相关和人口集中指数对中国各省市人口空间分布模式进行了预测。本文将基于时间序列的历史数据采用改进了的 BP网络,以地市行政区域为研究单元,对山东省未来人口进行预测,并采用空间统计分析方法对未来人口空间分布模式进行预测分析。2?数据来源本文数据来源于 1993?2001年?中华人民共和国全国分县市人口统计资料?山东省 17地市人口统计数据,利用2005年山东省行政区图在 M apInfo中提取地市行政单元,建立 Re
5、gion?tab图层,利用 M apInfo中提供的对象相邻关系查询,建立空间邻接矩阵。3?技术方法本文以 1992年 2005年历史人口数据建立 BP 网络模型对山东省未来人口总量进行预测,以 2005年山东省 17地市行政区面积为未来行政区面积,以人口密度为指标,采用 Moran?s I和 LocalM oran?s I指数对未来人口空间分布模式进行预测。3?1?BP网络预测方法从预测类型上讲,ANN 预测可分为单变量时间序列预测和多变量时间序列预测,本文以 17个地市人口总量为变量,历史年份的数据为样本,属于多变量时间序列预测。在预测过程中,以 1992年-2004年人口数据为输入,19
6、93年-2005年人口数据为输出,进行网络训练,用绝对误差与相对误差进行精度检验,确定网络模型;然后以 1993年-2005年人口数据为输入,预测输出 2006年人口数据;考虑误差的积 累,对滚动预测 方法进行修正,在进行 2007、2008、2009、2010年人口数据的预测时,分别以 1993年-2006年、1994-2007、1995-2008、1996-2009的人口数据重新训练网络,调整网络模型进行预测。3?2?空间统计分析方法空间统计分析方法是在分析空间关系的基础上进行的数值的相关性关分析。通过实体间同一属性值在不同空间位置上相似程度的判别,来研究一个多边形或点与它最接近的多边形或
7、点的关系,是空间分布特征、选择适宜的空间尺度来完成空间分析最常用的方法。1)空间权重矩阵N 个对象的空间邻近关系可以通过定义一个二元对称空间权矩阵 Wn?n来表达,采用邻接标准或距离标准来度量。本文采用简单的二进制邻接矩阵,即当区域 i和区域 j在空间上存在相邻关系时,空间权重矩阵元素 Wij=1,其他情况为 0。Wij=1区域 i与区域 j空间相邻0其他2)全局空间自相关本文采用 M oran指数。M oran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。其公式为 14:I(d)=?ni?ni?jWij(xi-?x)(xj-?x)s2?ni?ni?jWijM oran?s I指数
8、的计算结果,可分别采用随机分布和近似正 态分 布两 种 假设 进行 检验,标 准化 式 为 Z(I)=I(d)-E(I)VAR(I),期望值 E(I)=-1n-1。当 Z值为正且显著时,表明区域属性值存在正的空间自相关,相似的观测值(高值或低值)趋于空间集聚,当 Z值为负且显著时,表明区域属性值存在负的空间自相关,?第 6期?张锦宗等?基于 BP网络与空间统计分析的山东人口空间分布模式预测研究相似的观测值趋于分散分布,当 Z 值为 0时,观测值呈独立随机分布。3)局部空间自相关对于任何一空间区域单元 i,局部 M oran I的计算公式为:Ii(d)=1s2(xi-?x)?Wij(xj-?x)
9、根据计算出的检验统计量,对有意义的局部空间关联进行显著性检验,检验其在空间上是否为随机分布。当 Ii为正时,则空间区域 i的空间关联可能有两种情况:?高-高?关联与?低-低?关联;当 Ii为负时,则空间区域 i的空间关联也可能有两种情况:?高-低?与?低-高?关联;当 Ii接近于 0时,则说明空间区域 i与其邻域不存在空间关联关系,该空间区域的空间分布呈现随机分布状态 15-17。4?山东省人口空间模式预测4?1?未来人口总量预测依据上述理论与方法,预测 2006-2010年山东省 17地市人口总量(表1)。表 1?山东省 17地市人口总量 BP网络预测结果(单位:万人)20062007200
10、82009201020062007200820092010荷泽889?9 891?4 891?5893895?4 临沂1018?71019?910191020?91020?1荷泽889?9 891?4 891?5893895?4 临沂1018?71019?910191020?91020?1聊城571?4 571?1 571?4571?3572?3 日照282?3282?5 282?2 282?1282?4德州554?3 554?5 553?7555?2555?9 东营181?4181?4181181?4181?7滨州371?7372371?9372372?8 潍坊851?7852?8 852?
11、9 853?3852济南602?1 602?5603601?5604?9 烟台648?2648?4 648?9 648?1647?9莱芜124?5 124?6 124?7124?7124?6 威海258?1256?6 259?2 257?8256泰安552?2 552?4 552?7553?1553?2 青岛745?1744?2 745?9 742?1745?3济宁807808?1 808?3808?4808?6 淄博417?8418?7419418?5418?9枣庄368?6 369?2370369369?64?2?空间分布模式预测4?2?1?总体空间分布模式分析分别计算 2007、2008
12、、2009、2010年 17地市人口密度(具体值略),按时间序列将 17地市人口密度按上四分位数FU、中位数 M、下四分位数 FL四等分。四分散布 DF=FU-FL,令 FU+3DF和 FU-3DF为截断点,位于截断点以外的数据值称为离群值。在离群值区,处于 FU+3DF以外的数据值为高值异常,处于 FU-3DF以外的数据值为低值异常 11。这样,FU、M、FL、FU+3DF、FU-3DF将所有数据分成 6个数据区域,经计算,2006年-2010年间,山东省 17地市没有出现高值和低值异常的空间区域(图 1)。图 1?山东省四分位百分表示图由 图1 可以 看 出,沿 着西 北-东 南方向 可以
13、 将 山东省 17地市划分为 3 个 空 间区域,西 南 地 区的荷泽、济宁、枣庄及济南为高的人口密度区;向东北方向,聊城、泰 安、临沂、青岛为较高的人口密度区;最北为较低的人口密度区。人口密度的这种空间分布模式在一定程度上反映了空间聚集性。为了显示人口空间分布的显著空间聚集和空间孤立,还需进行全局空间自相关和局部空间自相关分析。4?2?2?全局空间相关分析建立的邻接矩阵有如下特征:2个地市邻居数为 1个;1个地市邻居数为 2个;7个地市邻居数为 3个;2个地市邻居数为 4个;4个地市邻居数为 6个;1个地市邻居数为7个。由表 2可知,2006-2010年,17地市人口密度呈正的空间自相关,表
14、明各地市的人口密度水平的空间分布并非表现为完全的随机状态,而表 2?2006-2010人口密度M oran?s I指数年份M oran?s IZ-Value20060?15720?01966520070?15750?01969220080?15560?01952120090?15970?01988820100?15750?019692是表现出相似值之间的空间聚集,即具有较高人口密度的空间区域与具有较高人口密度的空间区域相邻,或者具有较低人口密度的空间区域与具有较低人口密度的空间区 域 相 邻。从 五 年 来 的M oran?s I指数的演变过程看,基本趋于稳定,说明人口密度的空间分布模式变化不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BP 网络 空间 统计分析 山东 人口 分布 模式 预测
限制150内