乡镇级人口统计数据空间化的格网尺度效应分析_以义乌市.pdf
《乡镇级人口统计数据空间化的格网尺度效应分析_以义乌市.pdf》由会员分享,可在线阅读,更多相关《乡镇级人口统计数据空间化的格网尺度效应分析_以义乌市.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 12卷 第 1期2010年 2月地 球 信 息 科 学 学 报J O U R N A LO FG E O-I N F O R MA T I O NS C I E N C EV o l.12,N o.1F e b.,2010收稿日期:2009-08-18;修回日期:2009-11-04.基金项目:国家“863”计划“人口普查与调查信息空间统计管理与分析系统”课题(2006A A120105-2)。作者简介:叶靖(1984-),男,硕士研究生,主要从事遥感、G I S 应用研究。E-m a i l:y e j l r e i s.a c.c n通讯作者:杨小唤(1965-),男,博士,研究员,
2、主要从事遥感、G I S 应用及资源环境时空数据分析等。E-m a i l:y a n g x h l r e i s.a c.c n乡镇级人口统计数据空间化的格网尺度效应分析 以义乌市为例叶 靖,杨小唤,江 东(中国科学院地理科学与资源研究所,北京100101)摘要:格网尺度效应是统计型人口数据空间化研究的基础性问题之一。针对资源环境研究领域和全球变化区域模型对各种尺度的空间型人口数据的需求,人们对人口数据空间化进行了大量研究。综观现有研究成果,缺乏针对具体应用需求的数据源选择方法和对数据产品适宜性的分析。因此,数据在实际应用中,特别是县市、二、三级流域等尺度上的应用中,存在较多的不确定性。
3、本文重点研究人口数据空间化的格网尺度效应分析方法。以浙江省义乌市为例,利用 C B E R S、I R S-P 5卫星影像,提取了研究区土地利用信息;在地理信息系统技术支持下,对乡镇统计人口进行空间化建模,生成 20m至 1k m系列的格网人口数据;通过比较不同格网人口与乡镇统计人口的误差,分析人口数据空间化的格网尺度效应。分析结果表明,采用 C B E R S 数据源进行人口数据空间化,其数据产品即格网人口的适宜尺度是 200m,抽样精度为 76%;采用 P 5数据源进行人口数据空间化,其格网人口的适宜尺度是 100m,抽样精度为 84%。关键词:人口;空间化;格网;尺度效应1 引言人口是生
4、活在特定社会制度、特定地域具有一定数量和质量人的总称。人口的空间分布是指一定时点上人口在各地区的分布情况,是人口过程在空间上的表现形式 1。人类活动是造成生态环境问题的驱动力,而人口数据是反映人类活动影响的最直接的指标之一,随着全球环境问题和可持续发展理念的演化发展,需要将人口数据与各种自然数据和人文数据融合进行综合分析,人口数据必将成为地学领域专业模型构建的重要输入之一 2。人口数据空间化为解决上述问题提供了便利。人口数据空间化,也称人口数据空间分布化或人口分布空间化。即是通过统计型人口数据,采用适宜的参数和模型方法,反演出人口在一定时间和一定地理空间中的分布状态的这一过程。其实质就是创建区
5、域范围内连续的人口密度表面 3。20世纪 90年代初,人们提出“人口数据空间化”的概念 4-5。此后,地理学家运用遥感、G I S等技术手段研究人口数据的空间分布问题,已经取得了一定的进展 6-13。但目前的人口数据空间化模型,多是全球(如 1995年全球 5k m人口数据库 G P W)、全国(如中科院资源环境数据中心制作的 2000年全国 1k m 人口空间数据库)或省域尺度,数据产品的空间格网大小为 1k m或 5k m 14-19。近年来,开始出现利用高分辨率卫星影像进行局部地区(如城区等)人口空间分布模拟的研究成果。综观现有研究成果,缺乏针对具体应用需求的数据源选择方法,缺乏对数据产
6、品适宜性的分析。因此,数据在实际应用中,特别是县市、二、三级流域等尺度上的应用中存在较多的不确定性。本文以浙江省义乌市为例,选择中高分辨率遥感影像 C B E R S 和 P 5为代表,作为人口数据空间化的数据源,通过比较不同的格网人口与乡镇统计人口的误差,分析并确定针对不同遥感数据源进行人口数据空间化,人口格网的适宜尺度;通过村级统计人口验证格网人口的精度,分析并得出不同尺度的遥感数据源进行人口数据空间化,相应数据产品的精度。统计型人口数据空间化的格网尺度效应分析方法,可以为人口等人文要素空间化过程中的数据最适宜尺度选择提供基本方法和案例。2 研究区与数据预处理(1)研究区浙江省义乌市是我国
7、东部经济较发达、人口较密集的县级市。它在行政单元上包含了稠城街道、江东街道、稠江街道、北苑街道、后宅街道、城西街道、廿三里街道共 7个街道,以及佛堂镇、赤岸镇、义亭镇、上溪镇、苏溪镇、大陈镇共 6个乡镇。2007年,全市土地总面积 1105k m2,其中建成区土地面积 73k m2。人口近 72万,国内生产总值约 421亿元。该区域经济发展充满活力,人口增长快,土地利用类型变化快,环境问题突出,用于研究东部等经济发达地区县域人口数据空间化的格网尺度效应,具有一定的代表性。(2)数据源本文采用的数据源主要有 3类:遥感数据、人口统计数据和矢量行政境界数据。遥感数据包括:C B E R S-02卫
8、星 C C D影像 1景,19.5m空间分辨率;I R S-P 5卫星后视影像 6景,2.5m空间分辨率。时间均是 2007年。人口统计数据包括:义乌市 2007年乡镇街道名称、编码及其统计人口数。矢量边界数据包括义乌市乡镇街道界线图和村界线图。(3)土地利用类型提取分别以 19.5m分辨率的 C B E R S 影像和 2.5m分辨率的 P 5影像为遥感数据源,经过影像彩色合成,几何纠正与空间配准,影像融合等一系列预处理,结合研究区的行政境界,通过人机交互提取义乌市 2007年土地利用类型(图 1)。根据研究区实际情况,研究区的土地利用分类参照中国科学院资源环境数据中心“全国 1 10万土地
9、利用分类体系”,分为耕地、林地、草地、水体、居民地、未利用土地 6个一级类。另外,对居民地二级类型中的城镇居民地、农村居民地、建设用地也进行了提取。图 1基于 C B E R S(a)和 P 5(b)的义乌市 2007年土地利用类型F i g.1L a n d u s eo f Y i w ui n2007 e x t r a c t e db yC B E R S(a)a n dP 5(b)提取的土地利用类型中,耕地、城镇居民地和农村居民地信息将作为人口数据空间化模型中的构建因子。(4)人口数据空间化模型构建基于 C B E R S 影像和 P 5影像提取的土地利用类型,选取对人口空间分布影
10、响最直接的城镇居民地、农村居民地和耕地因子,结合义乌市 2007年人口统计数据,以乡镇为样本,构建人口数据空间化模型。假定义乌市内各乡镇同一土地利用类型的人口密度相同,则模型的一般形式为:Pi=nj=1ajsi j 其中,Pi为义乌市 i 乡镇的统计人口数;aj为411期叶靖 等:乡镇级人口统计数据空间化的格网尺度效应分析 以义乌市为例j 类土地利用的人口分布初始系数(人/k m2);si j为 i乡镇 j 类土地利用的面积(k m2);n=3,分别代表城镇居民地、农村居民地和耕地 3种土地利用类型。根据模型,对每个乡镇的人口统计数据,以及城镇居民地、农村居民地和耕地面积按照公式进行线性回归计
11、算,求得各土地利用人口分布初始系数 aj。模型是以假定义乌市内同一土地利用类型人口分布系数相同为前提的,因此,在总数上人口空间数据与人口统计数据必然存在着一定的误差。为确保义乌市内所有格网中的人口数据之和与实际统计人口相等,通过平差对各乡镇的人口分布初始系数 aj进行校正,得到校正后的各乡镇人口分布系数 ai j。校正公式为:ai j=PiP iaj 其中,ai j表示 i 乡镇 j 类土地利用的人口分布系数(P/k m2),Pi为 i 乡镇统计人口数据,P i为根据模型公式反算的 i 乡镇人口数据。由此获得的 ai j因为各乡镇统计人口数不同而存在差异。最后,将土地利用人口分布系数栅格化,并
12、与土地利用面积栅格数据进行栅格计算,将人口统计数据分布到空间,生成人口空间数据(图 2)。按照模型构建方法,以 C B E R S 为数据源生成了 1k m、500m、200m、100m四种尺度的格网人口数据;以 P 5 数据源生成了 200m、100m、50m、20m 四种尺度的格网人口数据。每种遥感数据源均对应了一个系列的人口格网尺度,这些数据将为人口数据空间化的尺度效应分析提供数据支持。3 人口数据空间化格网尺度效应分析基于上述一系列人口空间数据成果,运用空间分析和数理统计方法,通过比较不同的格网人口与乡镇统计人口的误差,分析人口数据空间化的格网尺度效应,即以遥感数据源进行人口数据空间化
13、,数据产品尺度的适宜性分析。3.1 格网尺度效应分析方法本文中的人口数据空间化模型基于乡镇统计人口数据,理论上,乡镇界线套合的格网人口数与统计人口数相等。但考虑空间化过程中栅格计算的两个参数 土地利用人口分布系数和土地利用面积,均是矢量栅格化所得。由于矢量的界线不存在宽度,在栅格化后,其空间边缘位置会发生变化。因此,乡镇界线套合的格网人口数与统计人口数是不相等的,其误差与栅格化后的格网尺度有关。作为建模的核心参数,土地利用面积在不同格网尺度下的误差中起主导作用。误差的计算公式如下:E P=(p o pj-p o pt)p o pt100%其中 E P 为人口误差百分比,p o pj为乡镇格网人
14、口数,p o pt为乡镇统计人口数。图 2义乌市 C B E R S-200m(a)和 P 5-100m(b)人口空间数据F i g.2P o p u l a t i o nd i s t r i b u t i o no f Y i w ub a s e do nC B E R S-200m(a)a n dP 5-100m(b)42地 球 信 息 科 学 学 报2010年3.2C B E R S 数据适宜的格网尺度将乡镇街道界线套合 C B E R S 数据源生成的1k m、500m、200m和 100m格网人口,并与乡镇人口统计数据进行比较,计算格网人口与乡镇统计人口的误差(表 1)。从格
15、网人口乡镇误差均值看,误差均值与格网尺度大小 成正比。误差均值 由 1k m格网 的14.31%逐渐减小到 100m格网的 1.24%。其中,1k m 到 500m误差减少了 56%;500m到 200m误差减少了 76%;200m到 100m误差减少了 19%。也就是说,当格网尺度缩小到 200m时,误差均值已无法明显减小。表 1格网人口与乡镇统计人口的误差(C B E R S)T a b.1T h ee r r o rb e t we e np o p u l a t i o nb yg r i da n ds t a t i s t i c a l p o p u l a t i o n
16、(C B E R S)乡镇街道统计人口1k m 人口误差(%)500m人口误差(%)200m 人口误差(%)100m人口误差(%)稠城街道116 59196 429-17.29124 7446.99118 6401.761173730.67江东街道66 95351 191-23.5466 9930.0667 6201.0066394-0.84稠江街道46 70249 3105.5842 668-8.6448 3283.48472891.26北苑街道44 42445 6622.7939 537-11.0045 4872.3944188-0.53后宅街道51 00174 62646.3250 92
17、4-0.1552 1362.23514110.80佛堂镇79 38675 374-5.0572 892-8.1879 216-0.2179113-0.34赤岸镇39 16539 027-0.3541 2255.2639 7431.47415276.03义亭镇52 83248 906-7.4351 048-3.3852 694-0.26528630.06城西街道39 75353 68435.0447 99620.7339 7780.0639553-0.50上溪镇49 83353 9838.3348 317-3.0448 092-3.4949781-0.11苏溪镇48 30551 5646.755
18、0 4534.4548 174-0.27488901.21大陈镇38 49247 94024.5540 5775.4238 7730.7338340-0.39廿三里街道42 84840 263-6.0340 595-5.2641 751-2.5641423-3.33从格网人口乡镇误差分布曲线(图 3)看,误差曲线与误差 0值线的拟合程度与格网尺度大小成反比。误差曲线最大偏离值由 1k m格网的 50%逐渐减小到 100m格网的 5%。其中,1k m的振幅最大,与 0值线拟合程度最低;500m的振幅较大,与 0值线拟合程度较低;200m和 100m的曲线形态相仿,均是振幅小、与 0值线拟合程度高
19、。也就是说,当格网尺度缩小到 200m时,误差曲线与误差 0值线的拟合程度已无法明显提高。从格网人口乡镇误差分布范围统计(图 4)看,误差分布重心值与格网尺度大小成正比。误差分布重心值由 1k m格网的略大于 10%逐渐减小到100m 格网的小于 5%。其中,1k m 和 500m 的误差分布范围分 散,1k m的误差 分布重心值最 大,500m 的其次;200m和 100m的误差分布范围相似,均是分布范围集中在 5%,分布重心值最小。即当格网尺度缩小到 200m 时,误差分布重心值已无法明显减小。从上分析认为,采用 C B E R S 数据源进行人口数据空间化,其数据产品即格网人口的适宜尺度
20、是 200m。3.3P 5数据源的适宜格网尺度将乡镇街道界线套合 P 5数据源生成的 200m、100m、50m 和 20m 格网人口,并与乡镇人口统计数据进行比较,计算格网人口与乡镇统计人口的误差(表 2)。从格网人口乡镇误差均值看,误差均值与格网尺度大小成正比。误差均值由 200m格网的2.78%逐 渐减小 到 20m格 网的 1.63%。其中,200m 到 100m误差减少了 40%;100m到 50m 误差减少了 1%;50m 到 20m 误差减少了 1%。即当格网尺度缩小到 100m 时,误差均值已无法明显减小。从格网人口乡镇误差分布曲线(图 5)看,误差曲线与误差 0值线的拟合程度
21、与格网尺度大小成反比。误差曲线最大偏离值由 200m 格网的 8%逐渐减小到 20m格网的 4%。其中,200m的振幅较大,与 0值线的拟合程度较低;100m、50m和431期叶靖 等:乡镇级人口统计数据空间化的格网尺度效应分析 以义乌市为例20m 的曲线形态相仿,均是振幅较小、与 0值线的拟合程度较高。即当格网尺度缩小到 100m 时,误差曲线与误差 0值线的拟合程度已无法明显提高。从格网人口乡镇误差分布范围统计(图 6)看,误差分布重心值与格网尺度大小成正比。误差分布重心值由 200m格网的略大于 5%逐渐减小到20m格网的小于 5%。其中,200m 的误差分布范围相对分散,误差分布重心值
22、较大;100m、50m和 20m 的误差分布范围相似,均是分布范围集中在 5%,分布重心值较小。也就是说,当格网尺度缩小到 100m 时,误差分布重心值已无法明显减小。由上分析可知,采用 P 5数据源进行人口数据空间化,其数据产品即格网人口的适宜尺度是100m。3.4 格网人口数据精度验证本文以佛堂镇和苏溪镇的村级统计人口数据为例,验证上述适宜尺度的格网人口空间数据的精度,按人口密度高中低选择 30个村作为抽样样本,分析不同遥感数据源生成的格网人口数据精度。将村级界线套合 C B E R S 数据源生成的 200m格网人口与 P 5数据源生成的 100m格网人口,并与村级人口统计数据进行比较,
23、计算 C B E R S-200m 和 P 5-100m 人口空间数据的精度。由人口空间数据精度表(表 3)可得:C B E R S-200m人口空间数据的抽样误差均值为 24%,即抽样精度为 76%;P 5-100m 人口空间数据的抽样误差均值为 16%,即抽样精度为 84%。表 2格网人口与乡镇统计人口的误差(P5)T a b.2T h ee r r o rb e t w e e np o p u l a t i o nb yg r i da n ds t a t i s t i c a l p o p u l a t i o n(P 5)乡镇街道统计人口200m 人口误差(%)100m人
24、口误差(%)50m 人口误差(%)20m人口误差(%)稠城街道116 591124 4456.74118 4631.61118 3751.531186231.72江东街道66 95367 8801.3867 9751.5367 9031.42678421.29稠江街道46 70248 2513.3248 0332.8547 7752.30478932.42北苑街道44 42445 7793.0544 7840.8145 0981.52451481.63后宅街道51 00152 6913.3152 3842.7152 2202.39523572.52佛堂镇79 38679 044-0.4377
25、966-1.7978 144-1.5678242-1.44赤岸镇39 16541 1645.1039 5510.9939 5911.09395701.03义亭镇52 83251 813-1.9353 1790.6652 471-0.6852627-0.36城西街道39 75338 984-1.9439 064-1.7338 607-2.8838794-2.31上溪镇49 83347 899-3.8851 0772.5050 1750.69502360.69苏溪镇48 30549 3242.1148 6630.7448 7500.92488341.05大陈镇38 49239 6052.8938
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 乡镇 人口统计 数据 空间 尺度 效应 分析 义乌市
限制150内