基于复杂网络视角下省际人口迁移空间格局及趋势研究-李毅.pdf





《基于复杂网络视角下省际人口迁移空间格局及趋势研究-李毅.pdf》由会员分享,可在线阅读,更多相关《基于复杂网络视角下省际人口迁移空间格局及趋势研究-李毅.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第34卷第9期 统计研究 Vol34No92017年9月 Statistical Research Sep2017基于复杂网络视角下省际人口迁移空间格局及趋势研究+李毅刘雅楠金勇进内容提要:本文提出一套省际人口迁移空间格局及演变趋势研究系统,以省级行政区和迁移人口构建复杂网络模型,应用群集发现和互信息节点重要性评估的算法对人口迁移空间格局进行分析,同时引入人口迁移选择指数改进链路预测算法来预测迁移人口的潜在趋势。在此基础上,以第六次全国人口普查数据为例进行实证分析,其结果与已有的研究及我国省际人口迁移空间格局的现实状况相符,验证了这套方法的实践性和应用价值。关键词:省际人口迁移;复杂网络;空间
2、格局;链路预测DOI:1019343jcnki1 11302c201709006中图分类号:C812 文献标识码:A 文章编号:10024565(2017)09005609Complex Network Modeling Spatial Pattern and Trend ofInterprovincial Migration“Yi Liu Yanan Jin YongjinAbstract:This paper proposes a set of spatial analysis and prediction system on interprovincial migrationIt bui
3、hs the complex network model with provinciallevel region and migrantsIt also applies the communitydetection algorithm and the node importance evaluation method to analyze the spatial pattern of interprovincialmigrationThen it introduces the migration preference index tO improve link prediction algor
4、ithm SO as to predictthe potential trends of the interprovincial migrationBased on the sixth nationwide population census data,theresults are consistent with the existing research and the real spatial patterns of ChinaS interprovineial migration,which indicate the practicality verification of the me
5、thodKey words:Interprovincial Migration;Complex Network;Spatial Pattern;Link Prediction一、引言人口迁移一直都是国内外备受瞩目的问题。在世界上大多数国家,人口迁移发生在个人或家庭寻求新居住地来满足他们的特定需求,这种迁移改变了他们的收人状况和生活方式。20世纪以来,随着我国社会经济的发展和城镇化进程的加快,人口的迁移和流动已经成为非常普遍的现象。因此,准确把握省际人口迁移的空间结构特征及演变趋势,将对我国社会经济的稳定和持续发+本文获中国博士后科学基金资助项目“基于网络辅助信息下空间抽样设计研究”(2016M
6、600154)、全国统计科学重点研究课题“基于移动通信大数据的流动人口精细化挖掘研究”(2015433)、北京市社会科学基金重点项目“基于北京市地理分布的空间抽样设计研究”(14JGA022)、山西省高等学校哲学社会科学研究项目“基于山西省社会经济地域的空间抽样设计和决策优化研究”(2017329)、山西省高等学校创新人才支持计划资助项目(晋教科20163号)资助。万方数据第34卷第9期 李毅等:基于复杂网络视角下省际人口迁移空间格局及趋势研究 57展有着极为重要的意义。人口迁移理论最早可追溯到G E Ravenstein(1885)的迁移定理(Law of migration)心,1938年
7、RHerberle对迁移定理进行深化,首次系统提出“推力一拉力”理论:人13迁移是受迁入地拉力与迁出地推力相互作用的结果o。G K Zipf(194614 J,194951)将牛顿的万有引力定律引入“推力一拉力”模型,最早提出引力模型:M。,=K(PiPf)D;,其中Mif为人13推拉力,Pi、P,分别为迁人地和迁出地的人口数,D:为迁入地到迁出地的距离,K为模型系数,o为距离衰减参数。1970年Tobler W提出“地理学第一定律”进一步证实人口迁移更倾向于短距离迁移,也就是说人口迁移与距离成反比1。1970年A G Wilson基于最大熵原理修正引力模型,提出空间相互作用模型7:Mi=Ai
8、BfDiD以dif),其中,Mu为迁入地涯0迁出地J的迁移人数,0i是i地总迁出人口,Dj是J地总迁人人I:1,Ai和召i分别为满足迁人迁出约束条件的平衡因子。厂(dii)为距离衰减参数。Wilson模型用统计特征“平均人”描述人口迁移的宏观运动,奠定了引力模型坚实的理论基础,进而推动了其在人口研究和实践中的广泛应用。另一种观点认为人口迁移与地理距离没有直接关系,地理距离仅是影响人口迁移的代理变量。在20世纪60年代修正引力模型开始使用,许多学者尝试用其他变量来代替距离,主要研究集中于用社会经济理论等微观角度分析人口迁移原因、机制,其基本假设是:移民所在地条件与所期望地条件之间不平衡导致迁移婶
9、o。基本表现形式为:lnMii=Z,概+卢。lnD。+侥lnPi+卢3InP,+肪lnY,+卢,fn一+:,3inf几xm+颤zn岛+e#,式中Y变量为收人,其他变量包括失业率,城市化率,各种气候相关变量,各种公共支出及税收相关变量,还包括人口迁移拉力特征的变量,如年龄、入学年龄等。这种修正引力模型在人口迁移的研究中具有里程碑的意义,模型被不断修正扩展,从更微观的角度加入了迁移发生的原因、影响因素和规模等虚拟变量。随着我国经济社会迅速发展,省级行政区之间联系变得更复杂,人13迁移连续数据不易得到,同时引力模型存在局限性,主要在于其参数在空间上差异性显著,即不同区域使用相同引力模型所得结果会产生
10、较大偏差,这些成为人口迁移空间格局研究的障碍。许多学者研究发现我国省际人口迁移空间格局呈现出无标度特性、小世界现象以及群集结构的特征,是最典型的复杂网络一o,其主要思想是将省际人口迁移空间格局的各个省份及省际间迁移人口的关系转化为网络的节点和边,以网络的形式描述真实空间格局中各省份问的关系。因此,可以推测复杂网络分析方法在人口迁移空间格局分析中占有重要地位,然而鲜有涉及人口迁移空间格局的复杂网络方法,特别是针对潜在未来可能发生的人口流动预期网络的研究。基于上述现状,本文以省级行政区和迁移人13构建复杂网络模型,首次应用群集发现和互信息节点重要性评估算法对人口迁移空间格局进行分析,聚焦人13迁移
11、网络的拓扑结构,找出网络中的核心省份以及人口迁移省份之群,同时引入人口迁移选择指数来改进链路预测算法对人口迁移趋势进行分析,以探索省际预期潜在的人口迁移空间格局。同时也可以说明,运用复杂网络理论对人口迁移机制的有益探索,为人口迁移研究提供了一种理论方法。二、省际人口迁移网络分析省际人13迁移网络指依托于省际网络并以各省份为节点、人13迁移流向和流量连线构成节点间关系的网络结构。本文用图G=(V,E)的方式对省际人口迁移网络进行描述,其中,G为省际间人口迁移网络,V(G)为所有省份的集合,E(G)为所有省份之间连接的集合。省份v的度dv是指与此省份v所连接的边的数量,vV。万方数据58 统计研究
12、 2017年9月(一)省际人口迁移空间格局分析群集结构(cluster structure)是复杂网络中最常见属性之一。本文定义省际间人口迁移空间格局为群集结构,记为:省际人口迁移网络G中确定n(1)个群,C=C,C:,C。,使得各个群内省份组成的集合覆盖所有省份集合V。也就是说,省际间人口迁移网络中各省份被划分为不同的群,群内部的省际人El迁移紧密,而群间的省际人口迁移较为稀疏。如图1所示,发现和分析这些空间模式可以更好地来理解省际间人n迁移网络的结构和功能- 7lr一。“ 、乡 (a)随机网络 b)经群集发现算法划分后的网络群集结构图1群集发现本文采用FastNewman群集算法发现省际人
13、口迁移空间格局引,其基本思想为:求解Q函数最大化的优化算法,首先将网络中的各省份节点看作一个单独的群,计算出评价网络群集性的Q函数,然后选出使得Q函数增加值最大化的群集进行合并,直到全部省份被合并为同一群时停止。其中,Q函数指被划分群集结构的省际人口迁移网络与随机网络的差异程度,其公式如下:Q=引K面M,一2 (1)其中,K为省际人口迁移网络中集群个数,M为省际人口迁移网络中的总边数,Ms表示集群S中连边的总数,ds表示集群S中所有省份的度之和。Fast-Newman算法具体步骤如下:(1)省际人口迁移网络的初始群数为n个:f12M, 省份i向省份,人口迁移 ,。 【0, 其他i=ki2M (
14、3)其中,肘为省际人口迁移网络中的总边数,ki为省份i的度,e。表示第i个群与第J个群内省份所产生的边数占总边数M的比例,口i表示与第i个群内所有省份的连边占总边数M的比例。(2)根据贪婪算法的原理,朝着增加值AQ最大化的方向,对已连边的群进行合并,并计算合并后的AQ:AQ=8i+8i一2ai口,=2(e“一口。ctj) (4)(3)每次合并后,群i与群,的行和列相加,同时e。进行相应更新;(4)返回步骤(2),不断合并群结构,使得AQ最大化。(二)省际人口迁移中心枢纽分析省际人口迁移网络实质上为非同质拓扑结构,这就意味着网络中每个省份的重要程度是不同的1 0。,一些重要省份作为中心枢纽会在省
15、际人口迁移中越发活跃。本文采用无向加权网络的互信息节点重要性评估方法来分析省际人口迁移的中心枢纽,网络的边权值由两省份间迁移人口的数、1,誓、一弼万方数据第34卷第9期 李毅等:基于复杂网络视角下省际人口迁移空间格局及趋势研究 59量表示。因为网络中各省份边权值不同,所以同一省份连接每条边的概率分布不同。每个省份的边的概率与该省份边权值有关,因此假设省份i的所有连边中,边(i,)所占的概率为:P。=W(i,J)S(i) (5)其中,形(i,)为省份i与省份,间的迁移人口数,S(i)为与省份i连边的各个省份所产生的迁移人口数。假设省份i到省份J的互信息为,(i,),记为:地护雌)-ln(毒):f
16、n器岫器:fn器,撕与撕直接相连【 0 【0 【0, 其他假设省份i的信息量,(i)是省份i与其他省份间的互信息之和,记为:川)=刖) (7)所有省份按照信息量从大到小排序,排位越靠前的省份说明其重要性越强,也就是说该省份在人口迁移网络中处于枢纽地位的可能性越大。(三)省际人口迁移的趋势预测本文应用基于偏好连接指标(Preferential Attachment,PA)的链路预测方法来分析省际人口迁移趋势121,通过已知人口迁移网络结构预测尚未产生连边的两个省份之间产生连接的可能性(见图2) 刀气 J 黔心1,说明省份i的人口倾向于选择J省份为迁移目的地趋势高于全国平均水平;若,。1则两省份间
17、存在连边,i1则两省份间不存在连边,由此得到的连边集合E 7(G)与省份集合万方数据60 统计研究 2017年9月y(G)构成了人口迁移偏好网络G。其次,计算有向人口迁移偏好网络G(y,E 7)的偏好连接指标。省份的度可分为出度和人度,省份i的出度F是指省份i向其他省份的边的数目,省份i的人度F是指其他省份指向省份i的边的数目。通常来说单个省份的出度与人度并不相同,利用这一非对称性将PA指标扩展到有向人口迁移偏好网络。对于从省份i指向省份j的有向边ei,来说,其PA值定义为:s=,=七O。“:l:=F。(i)术F。(J) (9)其中,r。(i)=zV,e一E为省份i迁入的省份组成的集合,r。(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 复杂 网络 视角 省际 人口 迁移 空间 格局 趋势 研究 李毅

限制150内