欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    39所985高校微博互动分析(共12页).docx

    • 资源ID:14222065       资源大小:677.78KB        全文页数:12页
    • 资源格式: DOCX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    39所985高校微博互动分析(共12页).docx

    精选优质文档-倾情为你奉上39所985高校微博互动分析基于新浪官微互动频次(南京大学地理与海洋科学学院 梁延文 )摘要:本文以39所985高校的新浪官微为研究对象,基于985高校官微间的互动频次构建了互动分析的多值矩阵和互动网络。运用社会网络分析方法揭示了39所985高校的微博网络“明星高校”,并进一步分析了影响力大小的影响因素和微博互动中的派系。结果如下:1.上海交通大学不论是入度、出度还是总点度都处于最高地位,39所985高校微博互动网络的核心是上海交通大学;2.高校的微博影响力大小与微博活跃度(微博总量)和高校排名均有正的相关性;其中,微博活跃度(微博总量)与影响力的相关性很强;高校排名与入度有较强的相关性,即排名高的高校入度都较高;但高校排名与总的影响力并没有很强的相关性;3. 39所高校网络紧密,并没有较明显的派系划分;但派系分析进一步了佐证上海交通大学处于绝对的网络核心地位;高校互动中存在一定的地域分割。关键词:新浪微博;社会网络分析;985高校;影响力;派系1. 本文研究视角和问题本文以39所985高校的新浪官方微博作为研究对象,抓取了39所985高校的全部微博信息(自第一条微博至2017年4月30日截止),利用社会网络分析方法,意图解决以下两个问题:(1)影响力分析。通过分析高校间管微的互动频数,分析高校间联系的紧密性,寻找微博影响力较高的“明星高校”并判断微博影响力大小的影响因素。(2)派系分析。在影响力分析的基础上进行派系分析,判断各高校微博互动中是否存在“小圈子”2. 数据获取与矩阵构建本文以39所985高校的新浪官方微博作为研究对象,利用八爪鱼采集器抓取了各高校官微自微博开通的第一条微博到2017年4月30日截止的所有微博信息,采集的微博数据为:高校名、微博时间、微博正文、微博引文。最终,39所985高校共抓得32万多条数据,数据采集总平均成功率为97.7%(见表1)。 表1 微博数据采集结果 表2 微博数据采集结果(逆序排列)数据采集完成后,将“+高校名”视作一次互动,利用编写的python程序,进行互动频次统计,并构建互动多值矩阵(高校排列顺序为字母自动排序),微博互动不考虑自环,故对角线均取0(见表3)。表3 微博互动多值矩阵3. 数据处理4.1 影响力分析本文采用PAJEK和UCINET软件对上述多值矩阵进行分析。其中,考虑到入度、出度均具有实际意义,即入度表示被其他高校的频次,出度表示其他高校的频次,故用PAJEK做点度分析,用UCINET做派系分析。利用PAJEK对多值矩阵进行分析,所绘制出的社会网络关系图如图1所示。图1中,每一个结点表示一所高校,他们之间的连线表示存在着”与”被”的关系。箭头从结点A指向结点B,表示A”B;反之,箭头指向A,表示A被。图1 PAJEK微博互动图(1)密度。密度指的是一个图中各个点之间联络的紧密程度,固定规模的点之间的联系越多,该图的密度就越大。在社会网络分析中,密度已经成为最常用的一种测度。经过PAJEK分析(微博互动不考虑自环),985高校官微社会网络的密度为0.5776,平均点度44(见表4)。密度值较高,说明该网络之间的结点交流比较密切,联系较紧密。表4 多值矩阵密度图从表4还可以看出,该网络中共有856条弧,不存在边,是一个紧密的有向网络。(2)点度中心性。中心性是一个重要的个人结构位置指标,评价一个人重要与否,衡量他的职务或地位的优越性或特权性,以及社会声望等常用这一指标。点度中心性常用来衡量谁在团体中成为最主要的中心人物,拥有高点度中心性的人,在这个团体中也具有一个主要的地位。本文选用点度中心度(Degree Centrality)来衡量团体中最重要的中心高校,即明星高校。拥有越高点度中心性的高校,其影响力越大,“明星度”越高。第三部分构建的多值矩阵是有向矩阵,其点度中心性包括点入度、点出度和总点度(总点度=点入度+点出度)。点入度表示某用户被其他用户“”的程度。点出度表示某用户“”其他用户的程度,表5为点出度表,表6为点入度表。 表5 点出度 表6 点入度结果显示,点出度最大的是上海交通大学和天津大学(点出度为35),其次是山东大学(点出度为33),出度前五的学校共9所,分别为上海交通大学、天津大学(35),山东大学(33),东南大学、兰州大学(32),中山大学(31),大连理工大学、东北大学、重庆大学(30);点入度最大的是也是上海交通大学(点入度为35),其次是厦门大学、山东大学和天津大学(点入度都为32)。入度前五的学校共12所,分别是上海交通大学(35),厦门大学、山东大学、天津大学(32),南开大学、西安交通大学(31), 清华大学(30),北京大学、复旦大学 、南京大学、武汉大学、浙江大学(29);在39所985高校中中,上海交通大学的数和被数都最高。国防科学技术大学的点出度和点入度都为0,其既没有他人,也没有被他人所,在网络中成为了孤立的节点。点度综合排名前五的学校有五所,分别是上海交通大学(70)、天津大学(67)、山东大学(65)、西安交通大学(60)和中山大学(59)(见表7),表8按多值矩阵顺序列出了各高校的各点度值。 表7 总点度 表8 各高校相关点度值39所985高校的总点度值最小为0,即国防科技大学是一个孤立的点,最高为上海交通大学,总点度(all)是70。网络的平均点度为44,故按下表将总点度分为3个区间,即核心、中间和边缘。由PAJEK分析得核心区间有4所高校;中间最多,共22所;边缘有13所,代表高校有北京航空航天大学(见表10)。并在PAJEK中作图(见图2)。总点度取值范围类型类型编号备注60,7040,600, 40核心中间边缘123用黑色圆表示用深灰色圆表示用浅灰色圆表示表9 点度区间与类型表10 各区间高校分布图2 高校社会网络图如图,越往圈外,其总点度越低,影响力越弱。综上,微博中的“明星高校”是以上海交通大学为代表的第一圈层高校,即上海交通大学(70)、天津大学(67)、山东大学(65)和西安交通大学(60)。图3 核心圈层高校网络图4 中间圈层高校网络图5 边缘圈层高校网络在图2的基础上,再添加高校的微博总数作矢量值,得图6图6 添加微博总数后的高校社会网络图从图形观察,微博数量越多,似乎越处于网络的核心位置,但复旦大学、清华大学等高校微博数量也较多,却处于边缘。高校所处位置与哪些因素有关?(3)相关性分析。 在统计学中,两种现象之间的关系往往用相关系数(correlation coefficients)来衡量。相关系数的取值范围是-1.1,相关系数为正,表示表示一种特征的高得分与另一种特征的高得分相关。相关系数为负,意味着一种特征的高得分与另一种特征的低得分相关。此处用斯皮尔曼等级相关系数(Spearman Rank Correlation),斯皮尔曼相关系数分析的是顶点的某种特征(如入度)与另一种特征是否相符,判断标准如下(数值均代表绝对值):相关系数绝对值区间相关程度0,0.05)0.05,0.25)0.25,0.6)0.6,1.0不相关弱相关中度相关强相关表11 相关性判断标准本文选取微博总量和高校排名两个因素来进行相关性检验,判断高校微博影响力与高校微博活跃度(微博总量)和高校排名是否相关。高校互动网络是一个有向网络,故点度同样选取入度、出度和总点度进行分析。.1) 影响力与微博总量a.入度与微博总量Spearman Rank Correlation-First partition: 2. F:南京大学社会网络分析PAJEK做课程作业39所-input.clu (39)Second partition: 1. F:南京大学社会网络分析PAJEK做课程作业39所total.clu (39)Spearman Rank Correlation Coefficient: 0.74003Number of vertices used: 39入度与微博总量的斯皮尔曼相关系数为0.74,属于正的强相关,即入度与微博总量有正的强相关性关系。b.出度与微博总量Spearman Rank Correlation-First partition: 3. F:南京大学社会网络分析PAJEK做课程作业39所-output.clu (39)Second partition: 1. F:南京大学社会网络分析PAJEK做课程作业39所total.clu (39)Spearman Rank Correlation Coefficient: 0.68153Number of vertices used: 39出度与微博总量的斯皮尔曼相关系数为0.68,略低于入度,但也属于正的强相关,即出度与微博总量有正的强相关性关系。c.总点度与微博总量Spearman Rank Correlation-First partition: 4. F:南京大学社会网络分析PAJEK做课程作业39所-all.clu (39)Second partition: 1. F:南京大学社会网络分析PAJEK做课程作业39所total.clu (39)Spearman Rank Correlation Coefficient: 0.75795Number of vertices used: 39总点度与微博总量的斯皮尔曼相关系数为0.76,数值最高,是正的强相关关系。综上,高校微博影响力大小与微博总量呈正的强相关性关系,即高校微博越活跃(微博数量越多),其影响力越大。2)影响力与高校排名首先,根据中国校友会2017年全国985高校排名,按排名由高到低,采取百分制,差去2的原则生成39所985高校的得分,排名越高,得分越高(国防科大为估算)。 从入度、出度和总点度进行相关分析。a.入度与高校排名Spearman Rank Correlation-First partition: 7. F:南京大学社会网络分析PAJEK做课程作业39所-input.clu (39)Second partition: 6. F:南京大学社会网络分析PAJEK做课程作业39所-rank.clu (39)Spearman Rank Correlation Coefficient: 0.61382Number of vertices used: 39入度与高校排名的斯皮尔曼相关系数为0.61,属于正的强相关,即入度与高校排名有正的强相关性关系,高校排名越高,入度越大,即被的频次越高。b.出度与高校排名Spearman Rank Correlation-First partition: 8. F:南京大学社会网络分析PAJEK做课程作业39所-output.clu (39)Second partition: 6. F:南京大学社会网络分析PAJEK做课程作业39所-rank.clu (39)Spearman Rank Correlation Coefficient: 0.09479Number of vertices used: 39出度与高校排名的斯皮尔曼相关系数为0.09,属于弱的正相关,即其他高校的频次与高校排名没有强烈的正相关性。c.总点度与高校排名Spearman Rank Correlation-First partition: 9. F:南京大学社会网络分析PAJEK做课程作业39所-all.clu (39)Second partition: 6. F:南京大学社会网络分析PAJEK做课程作业39所-rank.clu (39)Spearman Rank Correlation Coefficient: 0.36108Number of vertices used: 39总中心度与高校排名的斯皮尔曼相关系数为0.36,属于中度正相关。即高校排名对其影响力有一定正的影响,但不是很强烈。综上,高校微博影响力大小与高校排名呈正的中等相关性关系,高校排名对其影响力的影响不强烈。故现在可以回答图6中的问题,即可以将高校分为三类(下文中出现的(X1,X2,X3),X1=圈层编号;X2=高校排名;X3=微博总量):A. 微博总量主导型如天津大学(1,74,15844)、重庆大学(2,40,9928),这类学校虽然高校排名较后,但是由于其微博总量很大,如天津大学的微博总量为15844,总量排第二;重庆大学的微博总量排第14位。导致其更靠近网络的中心,获得了更大的微博影响力。B. 高校排名主导型如中山大学(2,78,4320),其微博总量很小,但高校排名较高,故处于网络较中心的位置。C. “总量很大互动很少”型这一类高校的特征是微博总量和高校排名都较大,但却处于网络的边缘,如复旦大学(3,94,7910)、清华大学(3,98,6934),这类高校处于网络边缘的原因是由于其虽然总量很大,但其中互动次数很少,如复旦大学其他学校的次数只有9次,清华大学只有2次,故处于网络的边缘。本文按入度与出度的差值来衡量高校的微博互动的主动性,按此将高校分为三类:微博主动者(差值<-5)、均衡参与者(差值-5,5),和被动者(差值>5),按坐标轴越往下,主动性越弱。结果如下图。可以看到,北大和复旦是最高的被动者,这也佐证了清华和复旦处于网络边缘的分析。4.2 凝聚子群分析这一部分用UCINET进行分析。实际上,4.1中已经分析得该网络的密度约为0.58,较为紧密,故有向分析时的凝聚子群并不明显,本文用UCINET将多值矩阵截断为二值矩阵后进行凝聚子群分析,即无向网络的凝聚子群分析。第一步,二值化处理。将互动次数8次以上(含8)的二值化为1即有互动关系,小于8的二值化为0,即没有互动关系,得到二值化矩阵,对角线不予考虑。 第二步,进行弱成分分析第三步,进行派系分析通过派系分析,共得到10个子群:10个派系并不存在明显的地域或其他关系,但每一个派系中都有上海交通大学,可见,上交处于绝对的网络核心地位。用NetDraw可视化如下上海交通大学处于绝对的网络核心地位。高校微博互动中存在一定的地域分割,如大连理工-东北大学的孤岛;西北工业大学只与西安交大有联系;四川大学、电子科技大学和重庆大学集中在一起等。5.结论与讨论5.1 主要结论(1)影响力1) 综合以上分析,上海交通大学不论是入度、出度还是总点度都处于最高地位,故39所985高校微博互动网络的核心是上海交通大学;2) 高校的影响力大小与微博活跃度(微博总量)和高校排名均有正的相关性;其中,微博活跃度与影响力的相关性很强;高校排名与入度有较强的相关性,即排名高的高校入度都较高;但高校排名与总的影响力并没有很强的相关性;(2)派系1) 39所高校并不存在较明显的派系划分;但派系分析也进一步佐证上海交通大学处于绝对的网络核心地位;2) 高校互动中存在一定的地域分割;5.2 讨论本文存在的主要问题是以高校的微博总量为矢量值在可视化时并不能很好的体现真实的入度与出度的差别,如清华和复旦虽然总量大,但有效数据少,这在可视化中没有很好的体现;专心-专注-专业

    注意事项

    本文(39所985高校微博互动分析(共12页).docx)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开