基于多智能体模型与建筑物信息的高空间分辨率人口分布.pdf
《基于多智能体模型与建筑物信息的高空间分辨率人口分布.pdf》由会员分享,可在线阅读,更多相关《基于多智能体模型与建筑物信息的高空间分辨率人口分布.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、地 理 研 究GEOGRAPHICAL RESEARCH第33卷 第3期2014年3月Vol.33,No.3March,2014收稿日期:2013-03-22;修订日期:2013-09-23基金项目:国家自然科学基金项目(41371499);广东省自然科学基金项目(S2012010010517);中山大学柳林教授千人计划科研启动项目(2011-2014)作者简介:卓莉,女,湖南慈利县人,副教授,主要从事地理信息科学与资源环境遥感研究。E-mail:520-531页基于多智能体模型与建筑物信息的高空间分辨率人口分布模拟卓 莉1,黄信锐1,陶海燕1,王 芳2,谢育航1(1.中山大学地理科学与规划学
2、院,综合地理信息研究中心,广东省城市化与地理环境空间模拟重点实验室,广州 510275;2.广州大学地理科学学院,广州 510006)摘要:自上而下的人口分布模拟模型自动化程度较低,难以分析人口分布成因,且因精细尺度的人口样本较难获取而不太适用于高空间分辨率人口分布模拟。提出了一种基于多智能体模型和建筑物信息的高空间分辨率人口分布模拟模型。首先利用建筑物三维分布数据提取住宅建筑,构建智能体人口分布模拟模型的环境;然后基于统计、调研数据定义智能体属性,确定智能体居住选择行为规则;最后以泰日社区为例进行了居住人口分布仿真模拟。研究结果表明,基于建筑物信息的人口分布多智能体模型,可以获取每栋建筑物上
3、的人口,改进了当前高分辨率人口模拟主要只模拟小区或者居委会人口的不足;多智能体模型具有较高的自动化程度,不仅能获得较好的模拟结果,而且可在一定程度上从微观机理解释宏观居住分布模式,是对传统统计模型的有益补充。关键词:人口分布;人口密度;高空间分辨率;多智能体;建筑物DOI:10.11821/dlyj2014030111前言20世纪以来,世界人口的骤增加剧了全球范围内的资源短缺、环境污染及生态恶化,阻碍了社会和经济的可持续发展,人口问题也因此成为世界面临的核心问题之一1。获取并掌握人口分布信息,尤其是精细尺度的人口空间分布信息,逐渐成为制定区域发展规划、灾害风险防范与救助、经济建设、环境与生态保
4、护等政策的重要科学依据2。获取人口分布信息早期主要是通过区域统计或人口调查,这种方法虽然能获得统计单元上比较准确的人口信息,但耗时长、工作量大、成本较高3,而且忽略统计单元内人口分布的差异,有可能导致许多与人口分布相关分析的不准确。随着遥感、地理信息系统、人工智能、优化计算等新技术方法的发展,人口分布模拟方法也得到快速发展。各国学者相继开展了全球尺度、国家尺度、省级尺度、县级尺度乃至像元尺度的人口分布模拟研究4-33,并形成了一些具有较大影响力的全球人口空间化产品,如哥伦比亚大学国际地球科学信息网络中心的GPW(Gridded Population of the World)人口空间化产品30
5、、美国国家橡树岭实验室建立的LansScan人口空间分布数据产品31等。这些涉及多种空间尺度的人3期卓 莉 等:基于多智能体模型与建筑物信息的高空间分辨率人口分布模拟口分布模拟研究,为灾害、城市规划与管理等领域的相关研究提供了有效的基础数据。但目前仍然存在一些不足:目前的人口估算/分布模拟多采用统计回归方法37,16,17,即用与人口相关的指标建立人口估算模型来获取人口的空间分布。统计回归方法虽然简单,但较依赖于样本,普适性较差。并且在估算小尺度的人口时,通常直接将较大统计单元获得的模型用于小尺度人口估算,较少考虑模型的尺度效应。由于规律往往与尺度相关,较大尺度上存在的规律并不一定适用于较小尺
6、度。因此,这种自上而下的推演存在理论上的不完善。数据处理较多依赖于人工操作,自动化程度相对较低。高空间分辨率人口分布模拟研究较少,主要只估算了社区或者小区尺度上的人口,而对于更精细尺度上的人口估算则较少涉及。多智能体模型采用自下而上的模拟思路,具有强大的复杂计算和时空动态模拟功能,在许多领域都得到了较好的应用34-40。智能体能够模拟人的行为,因此可从模拟人类居住行为的角度获取人口分布。原理上,基于智能体的人口分布模拟不仅能获得宏观上的人口分布模式,而且能在一定程度上从微观角度解释人口分布的成因,有可能改善自上而下统计方法的不足,且具有较高的自动化程度。目前有少数学者开展了相关研究,但主要是模
7、拟居委会、住宅小区上的人口,而对于更精细的尺度则较少涉及。由于高空间分辨率居住人口的分布与建筑物个数、密度、面积、高度、体积、新旧、分布等密切相关16,17,因此本文利用建筑物信息,基于多智能体方法建立自下而上的高空间分辨率居住人口分布模拟模型。2研究方法人口分布具有时空动态特性,为了简化模型,本文暂时忽略其时间动态,主要探讨静态的居住人口空间分布模拟方法。根据已有研究成果,虽然影响精细尺度居住人口分布的因子很多,但建筑物体积是精细尺度人口分布模拟的最优因子16,17。考虑到模型的易于使用与推广,本文着重研究基于建筑物信息的多智能体人口分布模拟模型,并分析模拟效果。建筑物信息主要利用高空间分辨
8、率卫星遥感数据以及立体像对遥感数据,采用面向对象分析方法和立体像对分析方法来获取,这一工作已经在前期研究中完成45。本文将进一步利用前期已获取的建筑物空间分布数据提取出居住建筑物,并对建筑物进行高度层数转换;然后基于多智体原理、人口分布模拟的特点与目标,定义多智能体的属性,确定模拟环境,制定多智能体的居住选择行为规则,以此建立高空间分辨率人口空间分布模拟模型;最后对模拟效果进行分析。2.1 研究区与数据由于已经对上海金汇镇中部的泰日居委会进行过建筑物提取方法的研究45,因此继续选择这一区域,基于已有的建筑物三维分布信息进行高空间分辨率人口分布模拟研究。研究所用的主要数据包括:研究区GeoEye
9、-1高空间分辨率全色与多波段的融合影像、泰日居委会建筑物三维空间分布数据、奉贤年鉴2010、奉贤区地图。研究区的位置概况及GeoEye-1高空间分辨率全色与多波段融合影像(空间分辨率为0.5 m,图1)。由于研究区建筑物三维分布数据包含了所有建筑,而非住宅建筑物理论上不居住人口,因此首先将这部分非住宅建筑物从当前数据中剔除。以建筑物三维分布数据为基础,结合奉贤区地图及实地调查,运用面向对象分类方法剔除工厂厂房、行政办公楼、学校教52133卷地 理 研 究学楼、其他公共设施楼等非住宅建筑物,并用目视判断进行后处理,以保障住宅建筑物提取的准确率。目前高分辨率人口估算多采用建筑物高度信息。考虑到建筑
10、物层数比建筑物高度与人口之间的关系更为密切,而且在模型中使用层数信息可以减少建筑物高度反演误差对人口分布模拟精度的影响,同时也可以使模型运算效率得到一定程度的提高,因此,在模型中用建筑物层数代替常用的高度信息。根据中国住宅建筑层高控制规定,并结合研究区的调研数据,建立楼高与楼层的转换规则(表1),将研究区住宅建筑物的高度转换为层数。研究区反演的建筑物高度最大值为22 m,调研所获得的建筑物最高楼层为6层,由于楼顶的天台,储水池等信息也包含在建筑物高度信息中,因此将17-22 m高的建筑物转换为6层建筑物。为了减少住宅建筑信息提取误差对人口分布模拟精度的影响,对提取的建筑物个数与层数进行精度评价
11、。随机抽取20个样本,以调研数据、街景图作为评价标准,计算住宅建筑物提取个数及楼层信息的正确率n/20(n为住宅建筑物或楼层信息提取正确的个数),计算结果约为93%,精度满足后续人口分布模拟。2.2 基于多智能体的高空间分辨率人口分布模拟模型2.2.1 环境设定因研究区域较小,可认为自然环境大致相同,因此在建立多智能体人口分布模拟模型时,环境因素主要考虑建筑环境,包括住宅价格、建筑密度、楼层、区位、新旧等。其中,住房价格是影响居住选择行为的重要因素,但价格信息相对较难获取,而住房价格往往与建筑物楼层新旧、区位、密度等信息密切相关,因此在建模过程中选择建筑物占地面积、楼层、新旧程度、区位,以及密
12、度这5个指标作为环境图层。环境图层的获取主要基于预处理后的住宅建筑物空间分布数据,为了去除量纲等影响,所有图层均进行归一化处理,归一化处理后的图层见图2。(1)建筑物面积图层。根据公式(1)对居住建筑物面积进行归一化。A,i=AiAmax(1)式中:A,i为建筑物i的面积归一化值;Ai为建筑物i基脚轮廓的面积;Amax为研究区居住建筑物基脚面积最大值;“1,2,n”为不同的建筑物,以下相同。(2)建筑物层数图层。根据公式(2)对居住建筑物楼层进行归一化。表1 研究小区住宅建筑物高度与层数转换规则Tab.1 Transformation rule of buildings height to f
13、loors in the study area高度(m)层数415-728-10311-13414-16517-226图1 研究区位置及GeoEye-1全色与多波段融合影像(2009年2月)Fig.1 Location and Geoeye-1 image of the study area5223期卓 莉 等:基于多智能体模型与建筑物信息的高空间分辨率人口分布模拟F,i=FiFmax(2)式中:F,i为建筑物i的层数归一化值;Fi为建筑物i的层数;Fmax为研究区建筑物层数最大值,为6。(3)建筑物成新度图层。依据我国城乡建设环境保护部批准的房屋完损等级评定标准(1984年)规定,建筑物成新
14、度的确定主要依据房屋的完损等级。房屋的完损等级可划分为5类:完好房、基本完好房、一般损坏房、严重损坏房和危险房,相对应的成新度对应如下:完好房为十、九、八成新;基本完好房为七、六成新;一般损坏房为五、四成新;严重损坏房及危险房为三成新以下。根据2010年7月对研究区的实地调查可知,研究区住宅建筑物主要为完好房、基本完好房和少数一般损坏房。这些不同等级的房屋在GeoEye-1高分辨率全色与彩色融合后的遥感影像呈现出不同的颜色(图1)。因此结合遥感图像、地域建筑特点及调研,采用监督分类方法将住宅建筑物分为:完好房、基本完好房、一般损坏房三类,并根据完损等级与成新度的对应关系,将这三类房屋的成新度a
15、N,i赋值如下:N,i=1(完好房)0.7(基本完好房)0.5(一般损坏房)(i=1,2,n)(3)图2 环境图层Fig.2 Environment layers52333卷地 理 研 究(4)住宅建筑密度图层。住宅建筑密度是指项目用地范围内所有住宅建筑的基底总面积与规划建设用地面积之比。对于建筑物i所在局部区域的密度,则用建筑物i为中心、半径为100 m内的建筑面积与圆面积的比值表示,因此,建筑物i的密度归一化值aC,i可表示为式(4):aC,i=C100iC100max(4)式中:C100i为建筑物i为中心;半径为100米内所有住宅建筑物基底面积的总和;C100max为所有C100i中的最
16、大值。(5)住宅位置优劣程度图层。因研究区较小,环境差异不大,故仅从住宅建筑与工厂、医院等非住宅建筑之间的距离来度量居住位置的优劣。根据上海市城市规划管理技术规定(2010年),居住建筑物与非居住建筑物的离界最小距离为324 m。研究区住宅用地距离非住宅建筑用地的距离一般多于24 m,故设定24 m为居住建筑物与非居住建筑物之间的离界阈值,在离界阈值以内,居住地距离非住宅用地越近,噪声越大,居住优劣程度降低,据此建立建筑物位置优劣程度公式如下:aG,i=1(r24)r24(r23Ei)对于中收入智能体(10)Wi=1(Di12Ei)1-DiEi(Di12Ei)对于高收入智能体(11)式中:A,
17、i、F,i、N,i、C,i、G,i分别为建筑物i的面积、层数、新旧、密度及位置优劣程度的归一化值;b1、b2、b3、b4、b5为权重值;Di为建筑物i的当前人口数。确定权重的常用方法主要有四种42:人为判别法、排序法、比率法和成对比较法。其中,排序法是确定影响因子权重比较简单而有效的方法,使用排序法,公式如下:bj=n-rj+1k()n-rk+1(12)式中:bj为第j个影响因子的归一化权重值;n是影响因子的数量;rj是第j个影响因子在影响因子排序中的序号。不同属性的智能体对环境影响因子的排序不同,对不同属性的智能体分别根据公式(12)计算各影响因子的权重,计算结果见表2所示。(4)智能体的移
18、动规则。目前智能体的移动一般基于理性选择机制,即智能体选择最具吸引力的建筑物居住。然而,现实情况下,智能体在进行居住选择时,由于多种制约往往难以实现最优的理性选择,即在几个满足需求的可供选择目标中随机选择其一。为了比较这两种选择机制的效果,在模型中分别考虑这两种选择机制。理性选择机制下智能体的移动规则为:智能体比较建筑物i的综合吸引力指数Pi与其他建筑物吸引力P,若存在大于Pi的P值,找到P的最大值,智能体移动到P值最大的建筑物上(若存在多个最大值时,随机选择一个);若不存在大于Pi的P值,则智能体不发生移动,但此时产生一个随机因子,使智能体有0.2%的几率随机移动到Uj2中的某个建筑物上。有
19、限理性选择机制下智能体的移动规则为:智能体比较Pi与其他建筑物的吸引力指数P值,当存在大于Pi的P值时,在这些P值中随机选择一个移动到其对应的建筑物上;当不存在大于Pi的P值时,智能体不发生移动,但此时会产生一个随机因子,使智能体有0.2%的几率随机移动到Uj2中的某个建筑物上。2.2.4基于多智能体的人口分布模拟模型常用的多智能体仿真平台有 Netlogo、Swarm、Repast等,这些平台在使用上各有优劣。本文采用Repast多智能体仿真平台,运表2 环境因子对不同属性智能体的吸引力权重Tab.2 Attraction weights of various environment fac
20、tors to agents with different properties低收入中收入高收入b10.20.3330.067b20.20.1330.333b30.20.2670.133b40.20.0670.2b50.20.20.26752533卷地 理 研 究用Java语言进行编程,这种方式具有代码简洁、平台独立等特点。在确定好智能体属性、环境以及不同属性智能体的居住选择行为、以及模型的数据格式后,在Repast多智能体仿真平台上,根据图3所示流程建立了基于建筑物信息和多智能体的高分辨率人口分布模拟 模型。3模型运行及结果分析根据2.2节中所建模型,以2009年泰日居委会为例进行了人口分
21、布模拟实验。金汇镇泰日居委会位于金汇镇东部地区,占地1.4 km2,总户数3875户,常住人口12213人,管辖7个小区,1个老镇区。模型运行前首先需设定一些初始值以及运行结束条件,运行结束后需对模拟结果进行分析,具体如下所述:(1)模型初始化。主要包括不同属性智能体数量的初始化和智能体空间分布的初始化。智能体总数量我们设定为研究年份研究区的统计人口总数,此外根据研究区统计资料47,确定模型中不同属性智能体的数量比为:低收入中收入高收入=131。人口智能体在建筑物i内的初始值Si为区域建筑面积上的平均人口与某建筑物建筑物面积的乘积。(2)运行结束条件。当99%以上的智能体不再发生移动时,模型停
22、止运行。(3)模拟结果。分别用理性选择与有限理性选择机制进行模拟,获得了2010年上海市金汇镇泰日居委会在两种情形下的人口分布模拟结果,分别如图4和图5所示。(4)结果分析。为了对模拟结果进行检验,我们通过实地调查获取了20个建筑物上的人口数量作为模拟结果的参考值,然后找到对应建筑物的模拟结果,根据公式(13)分别计算理性选择与有限理性选择模拟结果的相对误差。样本的参考值、模拟值和相对误差如表3所示。Ei=|Pmi-PtiPti(13)由表3可知,理性选择模型的相对误差绝对值的平均值为17.84%,其中,有80%的模拟值的相对误差在30%以内;而有限理性选择模型的相对误差绝对值的平均值为12.
23、00%,其中,有90%的模拟值的相对误差在30%以内。为了更直观地观察模拟结果误差的分布,以每栋建筑物人口参考值为横轴,以两种选择机制下的模拟结果为纵轴做散点图(图6),从图中可以看出,理性选择在建筑物人口较多(此处为大于60人)的情况下,模拟值大于真实值的可能性增大,这与许多人去竞争“最好”的建筑物有关;而有限理性选择在同样情形下,模拟值大于与小于真实值的概率接近,总体偏离较小。此外,这两种模型都表现出在低值区模拟结果较好,而在高值区模拟结果误差较大,因此还有待于进一步完善模型。总体而言,基于有限理性选择机制的模拟方法获得的模拟结果精度更高,更接近现实分布。图3 MAS人口分布模拟模型运行流
24、程图Fig.3 Flow chart of the multi-agent system based populationdistribution model5263期卓 莉 等:基于多智能体模型与建筑物信息的高空间分辨率人口分布模拟4结论与讨论4.1 结论基于建筑物三维空间分布数据,首先通过剔除非住宅建筑物以及楼高楼层的转换获取建模所需的居住建筑物密度、楼层、区位等信息,然后根据多智能体基本原理建立了基于多智能体的人口分布模拟模型,最后以此模型模拟了2009年上海市金汇镇泰日居委会的人口空间分布,获得了较好的结果。相比同类型的研究,本文具有以下特色:(1)基于多智能体的自下而上的人口分布模拟
25、方法,不仅改善了自上而下人口分布模拟方法存在理论不完善的缺陷,而且有利于从微观上探索人群的居住选择行为,具有一定的创新性。这种自下而上的模拟思路不是仅局限于多智能体的方法,也可以运用其他一些自下而上的模拟方法,不是仅局限于建筑物上的人口模拟,对于像元尺度的模拟也有一定的借鉴意义。(2)人口分布模拟的结果精细到了单个建筑物,空间分辨率较高,在当前的人口分布模拟研究中还不多见。这种高分辨率的人口分布模拟结果,更能体现人口居住的空间局部差异性,反映人口的真实分布状况,此外也为需要高空间分辨率人口分布数据的部门或相关研究提供了一个较好的数据源。(3)方法自动化程度较高,在完成模型的构建之后,只需要少量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 智能 模型 建筑物 信息 空间 分辨率 人口分布
限制150内