基于社交网络的信息传播模型分析-黄宏程.pdf
《基于社交网络的信息传播模型分析-黄宏程.pdf》由会员分享,可在线阅读,更多相关《基于社交网络的信息传播模型分析-黄宏程.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第33卷第9期2016年9月计算机应用研究Application Research of ComputersV0133 No9Sep2016基于社交网络的信息传播模型分析黄宏程,蒋艾玲,胡敏(重庆邮电大学通信与信息工程学院,重庆400065)摘要:随着社交网络的蓬勃发展,网络舆论的控制变得越来越重要。信息传播模型能够揭示信息传播的规律,从而达到对传播过程进行预测的目的,因此社交网络信息传播模型的研究具有重要意义。针对经典传染病模型的不足进行了分析,结合社交网络的网络拓扑特点,考虑了网络中用户的不同感染状态,引入感染用户的衰减函数,提出了适合社交网络的信息传播模型。在真实email网络中进行模型
2、仿真,对比分析了不同模型的结果,研究了模型中各个影响因子对传播过程的影响。结果表明,不同的模型参数反映了传播趋势的差异,模型反映出的传播规律更符合信息在现实网络中的传播过程。关键词:社交网络;信息传播;传染病模型中图分类号:TP39307 文献标志码:A 文章编号:10013695(2016)09273805doi:103969jissn10013695201609040Analysis of information diffusion model on social network,Huang Hongeheng,Jiang Ailing,Hu Min(School of Communica
3、tionInformation Engineering,Chongqing University of PostsTelecommunications,Chongqing 400065,China)Abstract:With the development of sucial network,keeping control of the opinion in the network becomes more and more importantThe information diffusion model can show the laws of information spreadingth
4、us it can achieve the aim of forecastingthe propagation processso the research on the information diffusion model for the social network is extremely significantThispaper analysed the shortness of classic infeetious model and the characteristics of social networks topologytook into accountthe differ
5、ent infection status of the users and introduced a decay funcfion about infected usersfinallyit proposed an idonna-tion dissemination model for social networkThe model was simulated on the real e-mail data and compared witll other modelsit also investigated the effect of influencing factors on propa
6、gation processThe simulation results show that different parametersreflect the different spreading trends,the propagation model is more exactly close to the laws of information spreading in the realsocial networksKey words:social network:information diffusion;SIR model0 引言互联网的普及和高速发展给人们带来了新的获取信息的方式和
7、途径,网络带来的便利也让人们越来越依赖网络。哈佛大学的心理学教授Milgram在1967年创立了六度分割理论。1l,为社交网络的出现奠定了基础。社交网络通过聊天工具、博客和社区共享等途径扩大社交圈,最终形成一个庞大的网络社交圈。社交网络关系结构可以是现实世界中朋友、同事、亲属等双向关系。,也可以是拥有某类兴趣用户的单向关注结构。国外的社交网络如Facebook是全世界最大的社交网站,截止到2014年7月,其用户数量已经超过22亿1。国内的社交网络的发展也愈发迅速,如常见的新浪微博、腾讯微博等。社交网络作为复杂网络的一种,将网络用户定义为节点,利用用户之间的连边关系进行信息的传播,其网络拓扑具有
8、明显的小世界特性和无标度特性,因此信息在网络中传播阈值几乎为零5 J。另外,由于社交网络中的信息多种多样,大部分情况用户不为自己的言论负责,这也导致部分敏感信息在社交网络上的传播舆论导向以及扩散面积、速度等均难以控制。信息传播模型能够对信息传播的过程和趋势进行描述,从而达到对社交网络中的突发信息扩散过程进行预测的目的,能够为政府控制舆论、发布价值信息等工作提供参考。由此可以看出,社交网络中的信息传播模型具有极其重要的研究意义。在目前的社交网络信息传播模型的研究中,通常通过设计合理的传播机制并建立信息传播模型,但建模的方式和侧重点却各有不同。由于医学中的传染病发展变化模式与现实中信息传播极其相似
9、,所以在早期信息传播模型主要沿用传统的传染病模型,包括SI(susceptible infective)、SIS(susceptible infective susceptible)、SIR(susceptible infective removal)模型坤。在后续的模型研究进程中,很多研究者将这些传统模型进行了改进,以此来更好地揭示信息在社交网络中的传播规律,而SIR模型是信息传播模型研究中应用最广泛的一种。2011年,Woo等人o 7J在SIR模型的基础上提出了网页论坛的话题传播模型,以此来评估一个话题的最大参与人数以及对整个论坛的传染力度;而后一年,该小组就此研究点继续提出了eventd
10、rivenSIR模型【8 J,通过评估论坛中帖子的影响力来分析事件的影响收稿13期:20150622;修回13期:20150805 基金项目:国家自然科学基金资助项目(61371097);重庆市科委基础和前沿研究项目(cstc2014jcyjA40039);重庆市教委科学技术研究项目(KJl400402)作者简介:黄宏程(1979),男,河南南阳人,副教授,博士研究生,主要研究方向为信息处理、复杂网络(huanghccqupteducn);蒋艾玲(1991一),女硕士研究生,主要研究方向为社交网络;胡敏(1971一),女,副教授,硕士,主要研究方向为复杂网络万方数据第9期 黄宏程,等:基于社交
11、网络的信息传播模型分析 2739力度,并与SIR模型进行对比,结果表明文献提出的模型比起SIR模型更符合论坛中事件的热门程度。Gong等人一1分析了无标度网络中的传染扩散机制,考虑了网络中节点的个人警觉性对感染概率的影响提出了新的无标度网络传染模型。在2012年,Wang等人叫考虑了社会加强因素对传播的影响,在SIR模型的基础上提出了在线社交网络中的谣言传播模型CSR(eredulOUS spreader rationals)。在2013年王辉等人o改进了CSR模型的传播规则和传播动力学方程,考虑个人接受阈值对接受概率的影响,提出基于移动社交网络的谣言传播模型。张彦超等人引结合复杂网络和传染病
12、动力学理论,构造了一个基于社交网络的信息传播模型,并对模型进行数值仿真。BorgeHohhoefer等人1引将社交网络中用户的活跃度和对信息的感知度加入到信息传播模型中,使模型更符合现实的社交网络信息传播过程。Garg等人4 o结合sI传染病模型对社交网络的传播行为和过程进行了分析。通过对现存模型的分析可知,社交网络中的信息传播模型存在很多问题:a)在传播过程中,参与传播的用户对信息的态度千差万别,而现存模型往往忽略了这一差异性;b)均匀网络的传播规则与计算方式运用于社交网络是不合理的,必然与现实传播过程存在较大差异,一些研究者结合复杂网络知识进行了相关研究,但大多考虑了全局性传播机理,没有考
13、虑网络中个体用户的局部传播与全局的差异性;e)沿用传统传染模型中对感染者的接触式转换,没有考虑信息的生命周期,不符合社交网络信息传播的现实情况。本文针对上述问题,基于复杂网络理论,建立传播动力学微分方程组,考虑了模型中参数的影响并在真实的网络中进行模型仿真,使建立的模型更好地描述信息在社交网络中的传播过程,为社交网络中的舆论控制研究奠定基础。1 基于社交网络的信息传播模型通过以上分析可知,经典的传染病模型并不适用于描述社交网络中的信息传播过程,本文提出的基于社交网络的信息传播模型描述如下。11 网络用户状态分类将社交网络中每个用户定义为一个节点,用户之间的关注关系定义为边,从而将社交网络结构转
14、换成一个具体的可知的网络拓扑。当信息从某个或者某几个节点开始向整个网络传播时,由于网络中用户所拥有的知识、兴趣的不同,导致对同一信息存在不同的心理状态,从而产生与第一时刻发布信息的用户即初始传播用户相同或不同的言论,使信息传播的走向出现不同的情况,所以本文将网络中的用户可能存在的状态进行分类:a)S状态易感染用户,指可能接收到信息但还未接收信息的用户;b),。状态感染用户,指与初始传播用户具有相同观点的用户,参与信息的传播;c)L状态感染用户,指与初始传播用户具有不同观点的用户,参与信息的传播;d)R状态免疫用户,指已经接收到信息但对信息不感兴趣,选择忽略或者参与过但已经不再参与信息传播的用户
15、。12传播机理在社交网络中,用户的状态随着信息传播的过程发生转变,从而对整个传播过程产生影响。由于社交网络的拓扑结构在短时间内容易发生小范围局部变化,所以本文的传播模型假设:在信息发布和传播过程中,网络的拓扑结构不发生变化,即网络中用户数及关系是固定的。基于上述假设,结合网络中用户的不同状态,用户状态转换机理即信息传播机理如图1所示。根据图1中的网络用户状态转换机理,联系经典SIR传播的微分方程推导原理,本文模型用微分方程可以表示为掣=Al(邮(c)_d(睨(f)柏(f)+岛(1)拍)Taid(t)砌删刊屯()一州舢川(1),v掣=咄s(f)_A2(f)sm,s(f)、,掣=d()EIo(小)
16、ms(I)其中:代表网络中总用户数;S代表S状态易感染用户数;,n代表L状态感染用户数;厶代表L状态感染用户数;R代表尺状态免疫用户数;A。、A:、卢。、卢:代表易感染用户的被感染概率渺。代表易感染用户忽略信息的概率;d代表感染用户由于信息的生命周期限制而逐渐衰减的衰减函数。基于模型的图形及数学表达,模型的具体传播机理如下:a)当一个s状态用户浏览到邻居L状态用户发布的消息时,S状态用户以A的概率发生状态转换。当A,的值大于感染阈值8时,转换为L类感染用户。b)当一个s状态用户浏览到邻居L状态用户发布的消息时,s状态用户以A:的概率发生状态转换。当A:的值大于感染阈值占时,转换为厶状态用户。c
17、)当用户A同时浏览到L、,d状态两种感染用户发布的消息时,比较A。、A:的大小。当A。A:,用户A转换为L状态;当A,1)。如前文传播机理所述,当每种感染概率的值满足相应的条件时,用户状态发生改变。122信息忽略概率由于网络中用户的兴趣和知识背景等差异,对信息的感知能力和态度都不同。对于社交网络,用户对信息的忽略可有很多方面的原因,可能是用户不在线没有浏览到信息,或者用户对信息不感兴趣不参与转发传播,也可能由于用户活跃度不高不经常参与转发信息等。在本文模型中,在用户社会性方面不作重点研究,因此通过设置一个信息忽略阈值来判断用户是否参与信息的传播,从而揭示用户对待信息的态度影响整个信息传播过程的
18、变化规律。当信息忽略概率值大于阈值时,用户A从易感染状态转换为免疫状态,不参与信息的传播。123感染状态用户衰减函数在经典的SIR传播模型中,感染用户接触免疫用户,则以一定概率转换为免疫状态,停止信息的传播行为。现有的一些传播模型沿用了这一机制。在社交网络中,免疫用户指不参加信息的转发传播的用户,即此类用户对整个传播过程已经不产生影响。因此,结合社交网络的现实情况,免疫状态用户并不能够使感染状态用户转换为免疫用户,说明传统模型的这种机制并不适合社交网络。研究发现,信息存在一定的生命周期,信息在网络中的传播通常经历萌发、爆发、消亡的过程。造成某条信息在网络中消亡的原因有很多,可能是因为用户对信息
19、的新鲜感消失,也有可能是由于其他信息对前一条信息的传播覆盖。Zhao等人ois引入了谣言传播者遗忘机制来代替传统模型的接触转换机制;另外文献16中考虑了信息的传播延迟,并运用Parato分布函数来作为传播者的退化函数。Parato分布函数源自意大利的瑞士经济学教授Vil能doParet,冈0被提出时很多经济学家采用它对各种收入数据进行拟合研究分析;在后续的研究中,Pareto分布族的应用已经推广到社会科学、经济科学、环境科学等诸多领域并发挥了重要的作用。本文的信息传播模型中引入广义Pareto分布族中的Parato(I)分布函数作为感染用户衰减函数。d(n)=l一万1 (8)其中:a代表感染用
20、户衰减的速度(a0),a越大,衰减越快。在本文模型中,从用户第一次接收到信息并转换为感染状态开始,随着传播层级n的增大,d(n)逐渐增大,当d(凡)大于转换概率r(用户状态的变化分为转换或者保持原状两种情况,因此转换的概率为。O5,从而本文中r取05)时,感染用户转变为免疫状态。2数值模拟及结果分析21模型仿真在一个真实的email网络中进行模型的仿真验证。在初始状态设置中,网络中只存在两个感染状态用户,即L和厶,其余节点全部为易感染用户。运用社会网络分析软件gephi画出网络拓扑图以及初始感染用户在用户中的位置如图3所示。图3中,红色点表示初始,。状态用户,绿色点表示初始L状态用户(见电子版
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 社交 网络 信息 传播 模型 分析 黄宏程
限制150内