基于广义接近中心性识别网络中多个有影响力的传播源-刘换利.pdf
《基于广义接近中心性识别网络中多个有影响力的传播源-刘换利.pdf》由会员分享,可在线阅读,更多相关《基于广义接近中心性识别网络中多个有影响力的传播源-刘换利.pdf(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、IIIIIL LIIIIII LIIIIlllllll L LIIIIItlIlIII LIIY321 5449墨缒狄孽硕士学位论文学校代码:10357密 级;保密期限:基于广义接近中心性识别网络中多个有影响力的传播源ldentjfying MultiPIe InfluentiaI SpreadersBased on Genera Ii zed C I oseness Centra|i ty学 号姓 名一级学科二级学科指导教师完成时间A14201021刘换利数学应用数学张海峰教授2017年2月万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,
2、除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:文囊猿销 签字日期: 和门 年,月2-3日学位论文版权使用授权书本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权安徽大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权
3、书)学位论文作者签名:烫】欤刽 导师签名:签字曰期:20 11年f月幻日 签字日期: lSZ彳久下j缘0,停_办弘知,万方数据摘要IIIIH l U II I II III I IIlY321 5449近年来,对复杂网络的研究已经受到计算机、数学、经济学、传播学和生物学等不同学科领域的关注,网络的结构与动力学是复杂网络科学的两个最基本问题。对于网络结构的探测包括:网络的社团划分,关键节点的识别,链路预测等,其中许多学者都致力于网络中有影响力传播源识别的研究,即找到网络中的一个或者多个节点使得这些节点对网络的影响最大。这一课题在实际生活中对抑制疫情扩散,加速信息传播和推广新产品等都具有重要战略意
4、义。本文主要研究的是寻找一组节点使得这一组节点对网络的影响最大。一个节点到网络中所有节点距离和越小则这个节点越重要,由此我们想到当一组节点到网络中所有节点距离和最小时这组节点对整个网络来说比较重要。基于此思想本文主要有以下两方面工作:1由节点的接近中心性推广到一组节点到所有节点的距离越短越好,进而提出广义接近中心性。因此寻找一组最重要节点的问题转化为寻找目标函数的最优解,之后我们证明可以用Kme&DS聚类模型近似求目标函数的最小值。2用single-contact SIR模型和all-contact SIR及谣言传播模型在实际网络上进行模拟实验,并与度、介数、K一核、着色、最优渗流等方法进行比
5、较分析。结果表明:广义接近中心性指标在signal-contact SIR模型、allcontact SIR模型和谣言传播模型上都表现出较好的结果。关键词:复杂网络:多传播源:广义接近中心性;K-means万方数据Abst ractIn recent years,the study on the complex network has become a hot topicin many disciplines,such as computer science,mathematics,economics,commu-nication,biology and SO onThe structure
6、and the dynamics on the networksare the two fundamental problems in the complex network fieldWith regard-ing to the detection of the structures,which includes the community detec-tion,identifying the key nodes,the link prediction,and SO forthEspecially,howto identify one or more influential spreader
7、s in networks has attracted muchattention,since this issue has significant applications,such as how to curb thespread of the epidemic,accelerate the dissemination of information and pro-mote new productsIn this thesis,we mainly study how to find a set of nodes tomaximize their influence on the netwo
8、rkInspired by the definition of closenesscentrality for a node,which highlights that the importance of a node is charac-terized by the distance of the node to the all other nodes,the smaller distanceleads to the more importance of the nodeSo we proposed a generalized close-ness centrality index for
9、a set of nodes,which emphasize that the set of nodesare more important if their distances to other nodes are smallerBased on thisidea,our thesis includes the following two aspects:1We first put forward a generalized closeness centrality index character-ized by an objective functionTherefore,the prob
10、lem of finding a set of the mostimportant nodes is transformed into the optimal solution of the objective function,then we prove that the minimum value of the objective function can beapproximately obtained by Kmean clustering2The simulation experiments are implemented on actual networks usingsingle
11、-contact SIR model,all-contact Sir and rumor propagation model,and theresults are compared with the methods such as degree,betweenness,Kshelldecomposition method,coloring and optimal percolationThe results show thatthe performance of generalized closeness centrality index is generally betterthan the
12、 other centrality indices,no matter of the singlecontact SIR model,II万方数据all-contact SIR model,and the rumor propagation modelKeywords:complex network;multiple spreaders;generalized closeness centrality;KMeansIII万方数据目 录第一章绪论11 引言12识别有影响力的传播源应用前景,13多源传播的最近研究成果,14本文内容及章节安排第二章 复杂网络基本概念及识别有影响力的传播源的主要方法2
13、1引言22复杂网络相关理论与概念,2,21复杂网络的含义,222网络的统计特性23识别多源传播的方法24本章小结,第三章 广义接近中心性及仿真实验 1331 引言,1332广义接近中心性1333仿真实验与结果分析,1734本章小结,26第四章总结与展望 2741总结,27IV4444672万方数据4,2展望。27参考文献致谢攻读硕士学位期间的学术活动及科研成果V293435万方数据第一章绪论第一章 绪论弟一旱 硒比11 引言我们是不是每天都通过邮件、手机、电话、社交网络平台与我们的朋友保持联系?虽然道路越来越宽,我们是不是仍然每天体验拥堵的交通?在炎炎夏日,我们是不是体验过由于局部故障导致的大
14、范围停电?各种传染病(艾滋病,禽流感,非典型肺炎)如何在人类和动物之间传播开来的?我们应该用什么样的免疫策略?为什么谣言传播的很快?怎样的策略是好的营销策略?这些生活中随处可见的例子与我们的复杂网络研究息息相关。网络模型在我们的生活中处处可见,如传统的论文引用网【1】、新陈代谢网【2】、电力网【3】、交通网【4】等加上之后由于社交网络的广泛使用出现的如:国内的人人网|5】、美国的FacebookN等。研究这些网络可以给我们的生产生活带来极大便利,如:抑制疾病、谣言的传播,切断某些线路避免大面积停电,避免局部金融危机引发全球经济动荡等。然而这些问题的解决都需要我们寻找网络中一个或者多个重要节点,
15、控制这些对整个网络有重要影响的节点使我们解决问题更为方便快捷。12识别有影响力的传播源应用前景网络中的传播过程一方面依赖于网络的拓扑性质【718】,另一方面受动力系统影响【9_12l。在传播过程中寻找有影响力的传播者是一个重要课题,初始感染的源节点在网络中的位置对病毒、谣言、新闻等在整个网络的传播范围有重要影响。寻找网络中有影响力的传播者的问题即是寻找网络中影响力较大的单个或者一组节点。寻找单个有影响力的传播源即是关键点识别,寻找多个有影响力的传播源即是寻找一组他们相互之间的影响小,对整个网络的影响大万方数据安徽大学硕士论文:基于广义接近中心性识别网络中多个有影响力的传播源的节点。识别网络中有
16、影响力的节点在许多领域都有应用。在国家政治安全领域比如:恐怖组织网络【13,如果能正确的分析各个节点在网络中的影响力,就能找到具有最大影响力的节点进而有助于快速定位并捉拿恐怖组织的关键人物,更好的维护全球人民安全和政治稳定;在人类社会生活领域比如:随着全球社交网络的迅猛方展,全球有至少四分之一的用户活跃在社交网络上,研究这些社交网络有助于挖掘网络中的核心用户,在谣言发生时能更有效的进行遏制,净化网络空间,也可以利用这些核心用户进行新产品的宣传和推广;在医药领域比如:因为一些传染病疫苗不仅价格不菲,并且数量极其稀少,让每个人都能够接种相应的传染病疫苗是不可能的。怎样最大程度上利用数量稀少的传染疾
17、病疫苗?对甲型流感、艾滋等一些严重的传染疾病,如果首先能够对那些在网络中有重要影响力的节点接种疫苗,就可以达到相对比较好的治疗效果,在分配甲型流感等成本相对较高的疾病疫苗时,尤其对于那些经济落后的发展中国家和地区而言,这种做法可能是最有效的。因此识别网络中有影响力的节点具有广泛的应用前景。13 多源传播的最近研究成果到目前为止,国内外关于寻找网络中具有影响力的传播源已经取得了不少的研究成果。对于单源传播,我们只需找一个在网络中重要性最高【14,15的节点即可。对于多个有影响力的传播源的识别则要求传播源之间尽量比较分散以减少传播源之间的相互影响。在40多年前Corley and Chang【16
18、】开始研究在有向网络中寻找一组影响最大的节点,他们认为当把一组重要节点移除后将导致指定节点对之间的最大流量大幅度减少;之后Corley and Sha【1 7】认为在有权有向网络中,当一组重要节点移除后将导致指定节点对之间的最短距离增加;Flaviano18,19等人提出最优渗流理论,他们认为对网络影响最大的一组2万方数据第一章绪论节点即是移除这组节点之后对网络连通性破坏最大的一组节点;Cook和Karp12021】等人之后提出了反馈集的概念,这些都是基于网络的拓扑结构提出的寻找网络中的多个有影响力的传播源方法。Domingos和Richardson22,23】首先提出了顾客购买特殊产品的可能
19、性是产品内在性质和其他顾客影响力的函数,这个首先开启了研究功能型的影响最大化问题。之后Kempe,Kleinberg andTardos24基于动力传播系统提出了节点变成活跃节点受他邻居节点影响,所以有线性阈值模型【25-2T和独立串联两种广泛应用的模型【28,29】。14本文内容及章节安排本文以复杂网络理论为基础,通过阅读大量相关文献,研究了许多识别网络中多个传播源的方法,在此基础上,提出了新的多源传播的方法:广义接近中心性的模型,并在四个网络上进行验证,都取得了较好的效果。本文主要章节内容安排如下:第一章:主要介绍了复杂网络中多个有影响力的传播源的研究意义和应用前景以及研究现状,最后给出了
20、本文的章节安排。第二章:首先介绍了复杂网络的定义,以及网络中包含的节点、度、边等的概念,在这个基础上,之后介绍了几种网络模型即规则网络、ER随机网络、小世界网络和无标度网络随后介绍了聚类系数、同配系数等。然后介绍了几种经典的节点重要性排序算法,包括特征向量中心性、接近中心性、介数中心性、K一核分解等最后重点介绍了着色和最优渗流和度折扣理论。第三章:介绍广义接近中心性模型,并用KMeans聚类方法对我们提出的广义接近中心性算法迸行近似求解,最后在Email、PB、Power、Router四个网络上进行仿真实验和结果分析。第四章:对本文的工作进行了小结,提出展望。3万方数据安徽大学硕士论文:基于广
21、义接近中心性识别网络中多个有影响力的传播源第二章 复杂网络基本概念及识别有影响力的传播源的主要方法21 引言网络虽然只有点和边两个因素组成,但是网络是相当复杂的。首先对于点来说,网络中的点可能代表不同类型的个体,比如对于学生选课这样一个二分网络,节点既可以代表学生类,又可以代表课程;另外网络中的点可能具有混沌或分岔等复杂非线性行为动力系统。其次网络中的边连接错杂混乱,并且随着时间的推移网络中的边连接情况可能也会发生变化。网络的复杂性决定了对于同个问题,不同研究思路就会有不同的方法,对于寻找网络中有影响力的传播源我们就可以提出许多种方法,在这一章中我们从不同的方面列出了主要的6中方法。22复杂网
22、络相关理论与概念221 复杂网络的含义自然界和人类社会中存在大量的复杂系统都可以通过形形色色的网络加以描述。一个典型的网络是由许多节点和连接两个节点之间的边组成,其中节点(也可以称为顶点)代表真实系统的不同个体,边则表示个体间的关系。如果两个个体之间有某种特定的关系,则节点之间有一条边。反之,则不连边。有边相连的两个节点是邻居。一个具体网络可抽象为一个由点集y和边集E组成的图G=(K E)。节点数记为N=Iyl,边数记为M=IEI。E中每条边都有y中一对节点与之相对应。如果节点对(忱,)与(,忱)对应同一条边,则该网络称为无向网络,否则称4万方数据第二章 复杂网络基本概念及识别有影响力的传播源
23、的主要方法为有向网络。如果给每条边都赋予相应的权值,那么该网络就称为加权网络,否则该网络称为无权网络。本文所研究的网络都是无权无向网络,因此下文所提到的网络均指无权无向网络。我们生活中常见的网络大体可以分为四类:第一类是技术网络如;电力网络、交通网络等;第二类是社会网络如:人际关系社会网络【30】、Facebook、,Twitter等;第三类是信息网络如:万维网、论文引用网等;第四类是生物网络如:蛋白质交互网32】、新陈代谢网络【33】等。在复杂网络中我们通过对实际网络的结构进行研究可以把网络分为规则网络,ER随机图,小世界网络,无标度网络四类。(1)规则网络【34】全局耦合网络:网络中任意两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 广义 接近 心性 识别 网络 中多个有 影响力 传播 刘换利
限制150内