话题下微博信息传播拓扑构造研究(精品推荐).docx
《话题下微博信息传播拓扑构造研究(精品推荐).docx》由会员分享,可在线阅读,更多相关《话题下微博信息传播拓扑构造研究(精品推荐).docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、话题下微博信息传播拓扑构造研究随着互联网的普及,论坛、微博、微信等新媒体已经成为人们获取和信息的重要渠道,而微博已经成为舆情传播的主要平台,研究微博上舆情信息的传播情况具有重大社会意义,文章基于话题研究微博信息的传播特点。首先,通过对话题传播经过中新增用户数和介入话题用户的累计概率分布的统计,研究用户对话题转发的介入度,总结出话题传播经过,包括产生期、爆发期和衰亡期;接着利用话题中用户的转发关系,整理出话题传播的拓扑构造,通过测量传播拓扑构造中的平均途径、网络直径和聚类系数,并与无尺度网络进行比拟,对话题传播拓扑构造进行进一步的分析,总结出传播网络具有小世界特性,这些特性能够加快话题在网络中的
2、传播速度并扩大传播范围。文章研究话题传播的拓扑构造,为研究网络上的微博舆情提供了基础。关键词:微博;话题;信息传播;拓扑构造随着互联网和互联网终端的迅速普及,涌现出了很多便捷的互联网应用,如电子商务、社交网络、微博等。从美国的Twitter到我国的新浪、腾讯,微博在中国乃至全世界迅速普及。据统计,中国的微博总注册量已经超过5亿人次,天天更新的信息量已经超过1亿条。微博流行的原因主要在于它让人们信息的门槛大大降低,任何人都能够发表内容而且不必具有专业的文学撰写水平,这知足了群众快速沟通共享信息的需要。作为一种实时的沟通、信息共享工具,用户能够在任何时候任何地点微博信息,和别人互动,此外微博用户还
3、能够关注其他用户,使得微博平台成为了一个宏大的社会化网络。微博的普及、海量的信息以及庞大的用户群体,使得它也成为了一种实时信息来源工具,并且成了一种有着宏大社会影响力的社会媒体,近几年一些重要的社会热门话题都是由微博平台率先报道出来的。研究话题在微博平台上传播的经过和构成的网络拓扑构造,是对微博平台上用户行为、用户影响力等进行研究的基础。目前对微博平台上拓扑构造的测量和研究很多,GUO1等人对新浪微博上的用户进行分析,发现用户网络拓扑构造有很强的动态性,用户关注间的关系表现出马太效应;微博用户网络中存在着影响力宏大的用户,这些用户成为“核心,这些核心加速了话题在微博网络上的传播。WANG2等人
4、对微博上的信息传播进行研究,提出了一个微博的信息瀑传播模型,测量了微博的转发数分布,指出其分布情况能够用一个广延指数模型来表示。CHA3等人通过对入度、转发和引用的比照研究,发现用户的转发行为主要受微博本身价值的影响,而且对于名人和微博大V的微博应用明显要多于其别人。WEBBERLEY4等人对微博传播的深度和范围进行了研究,其目的针对一条微博,传播深度表示其最长的转发途径;传播范围表示其介入转发的用户群体数量;他们通过Twitter的数据进行验证,实验结果显示一条微博的平均最长转发途径为1.8,表示大多数消息被转发2次左右;平均转发规模在六左右,这和6度空间理论比拟符合。平亮5等人基于网络中心
5、性对微博平台上信息的传播进行研究,通过分析微博用户的点度中心度、中介中心性和接近中心性三个属性,证实了点度中心度能够衡量用户传播和获取信息的能力,中介中心性表示用户控制信息传播的能力,接近中心性能够衡量信息传播到其他用户的速度,这几个参数都能够间接用来表示用户的个人影响力大小。MISLOVE6等人对Flickr、YouTube、LiveJournal和Orkut四种社交网络的拓扑构造进行研究,对社交网络的幂率特性、小世界特性以及无标度属性进行了验证。CHA7等人在MISLOVE的基础上对Flickr上的图片拓扑构造进行研究,发现其中的信息传播需要依靠关键节点,并且时间可能较长。CHENG8等人
6、对YouTube进行了测量,分析了上面的用户行为特征、社会网络拓扑构造等,总结出了YouTube特有的统计行为方式。GUO9等人在对三种不同的分享型网络博客、书签分享、知识问答网上的用户行为进行测量研究时,发现用户的使用时间长短不服从指数分布,用户的奉献服从广延指数模型而不是服从幂率分布,证实了这种分享型网络并不是由少数核心节点所支配。CHUN10等人利用用户之间的交互信息,如留言、评论等进行研究,发现利用这些信息构成的网络构造特征与好友关系构成的拓扑构造类似,并且二者的分布极为类似,得到了与Mislove一样的结论。袁毅11对微博的用户网络构造、信息传播途径以及影响因素进行研究,他们跟踪一条
7、微博,采集所有相关的评论数据和用户数据,同时获取相关用户的好友关系。研究将信息传播归为3种类型:偶发型、偶遇时机型和强势节点照应型。其中的强势节点越早参加转发经过,越有利于信息的扩散;另外,一个用户的微博转发数量与该用户的粉丝数有一定的相关性。本文通过跟踪腾讯微博话题,采集相关话题下的所有用户数据,根据用户间话题数据的转发关系,整理出话题在整个网络上传播的拓扑构造,测量话题传播拓扑构造的性质,总结拓扑构造的特征。相比于传统的通过好友关系和跟踪一条微博构成的网络拓扑构造,这种通过转发关系建立的拓扑构造愈加完好,能够展现出整个话题的扩散速度和范围,更有利于舆情信息的监测和控制。1微博数据采集1.1
8、微博爬虫设计为了获取实验数据,本文针对腾讯微博设计了一款微博主题爬虫,根据特定主题获取微博网络上的微博信息和用户信息。本文设计实现的腾讯微博数据爬取系统从功能上主要分为API爬虫、Web爬虫以及分布式控制三个模块。其中,API爬虫模块通过微博平台的开放API实现对微博用户信息的采集,主要用于获取用户的个人好友关系、转发关系等;Web爬虫通经过序模拟阅读器进行Web页面阅读的经过,用于获取用户的微博信息,主要是对特定页面的源代码信息进行解析,进而获取相应的微博数据,该模块主要采集微博内容信息和微博相关属性信息;分布式控制模块根据指定的分布式任务分配策略从数据库中读取关键字,控制爬虫的爬取策略和速
9、度。API爬虫和Web爬虫以数据库作为信息交互的媒介,通过为这两个爬虫设置适宜的线程数来到达两者之间的供需动态平衡。爬虫系统的设计框架如图1所示。为了采集微博平台的话题传播信息,并保证数据的安全性,爬虫系统部署在四川大学网络与可信计算研究所的科研网络环境中,该科研网络利用文伟平12等人和王永娟13等人的的信息安全风险评估技术对网络安全性进行评估,并根据评估结果对网络进行改造升级,从软件层面保证数据信息的安全性;其基础设施安全防护借鉴卿斯汉14所阐述的身份鉴别经过,加强基础设施保护措施,从硬件层面保证数据安全性。程序运行的服务器配置为:MicrosoftWindowsServer2003Ente
10、rpriseEdition;Intel(R)Xeon(R)CUPE55062.3gHz;8G内存。为了提高数据的采集效率,爬虫系统采用了分布式的爬行策略并行爬行。为了避免爬虫系统被腾讯微博平台识别为恶意程序而被封禁,保证爬虫系统的连续运行,爬虫系统的爬行间隔设置为5分钟。数据的采集时间为2014年7月至9月,系统持续跟踪了这段时间内的所有话题。图1爬虫系统设计框架1.2数据采集结果系统天天监测排名前10的话题,由于天天的话题有重复,在数据采集期间一共获取话题数量207个,获取与所有话题相关的微博信息超过870万条,用户总量超过400万。首先对话题的性质进行分析,通过统计发现,话题主要分为娱乐性
11、质、社会性质和其他性质。娱乐性质的话题主要和娱乐界的事件、人物相关,例如某个明星开演唱会等;社会性质的话题主要和社会事件、人物相关,例如某地发生灾祸或者草根爆料事件等;除了这两种话题之外的其他话题属性比拟模糊,所占比例很小。表1是这3种性质话题的统计结果。从表1中能够看出,社会性的话题数量占比为17.39%,而娱乐性话题的数量占比为73.91%,用户比例表示相应话题下所有介入话题讨论或转发的用户占采集用户总量的百分比。在话题数量差距宏大的前提下,介入话题的用户数量却基本一样,甚至社会性的话题介入人数还要略高于娱乐性的话题。从话题的平均持续时间能够分析出原因,对于娱乐性的话题,其平均持续时间为4
12、天,比第三性质的话题持续时间还短,远小于社会性话题持续时间,讲明用户群体固然对娱乐性质的话题关注度较高,但是没有持续跟踪的热情,但是对社会性质的话题有很高的持续跟踪热情。话题在持续发展的经过中,随着其影响范围逐步扩大,会吸引更多用户介入其中,这和话题的传播特点有关。根据采集的数据,从中选择了“云南昭通市鲁甸县地震和“江苏昆山工厂发生爆炸这两个社会性的话题微博数据作为实验数据集,对话题传播的特点进行分析,测量话题传播经过中通过转发构成的拓扑构造。2话题传播的拓扑构造2.1话题传播的特点微博平台是由关注与被关注的机制连接起来的社交关系网络,是人们在现实生活中社交关系在互联网上的映射和扩大。信息在微
13、博上的传递大多数是通过转发方式来实现的。微博上话题传播的第一个特点是话题传播的间接性,信息不直接传递给用户,而是首先通过几个微博用户进行转发,然后关注这些用户的粉丝会选择性地对这些信息进行转发,这样经过层层转发,信息间接地传递给受众。根据YANG15等人对Twitter的研究发现,其中有接近25.5%的内容是从朋友的推文中转发而来。在采集到的腾讯微博中去除个人心情相关的博文,只统计和话题相关的博文,统计结果显示,转发博文所占比例的平均值高达54.7%。但是话题转发率高,并不代表该话题就能够大范围地传播以及产生宏大影响,话题能否产生宏大影响和话题本身以及受众的偏好有直接关系。根据研究人员对Fac
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 话题 下微博 信息 传播 拓扑 构造 研究 精品 推荐
限制150内