基于模体的汽车行业站点网络复杂性测度-骆琪.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于模体的汽车行业站点网络复杂性测度-骆琪.pdf》由会员分享,可在线阅读,更多相关《基于模体的汽车行业站点网络复杂性测度-骆琪.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第43卷第6期2017年6月北京工业大学学报JOURNAL OF BEIJING UNIVERSITY OF TECHNOLOGYVol.43 No.6Jun. 2017基于模体的汽车行业站点网络复杂性测度骆 琪,何喜军(北京工业大学经济与管理学院,北京 100124)摘 要:为了研究大规模网络结构复杂性测度方法,并针对汽车行业站点网络布局与结构功能优化提出对策,基于万维网页面链接数据,构建汽车行业站点网络拓扑结构图.借助VOSviewer聚类算法及Gephi检测并划分网络社团结构,解析基于主题搜索的汽车行业站点内容分类体系及功能结构,并利用Pajek验证各内容社团结构的小世界性,基于Rand
2、-ESU算法检测各社团的模体结构,提出基于模体的网络结构熵算法测度各社团的复杂性.最后,得出汽车行业站点网络社区中模体结构具有同构性,导致社区结构的信息传播功能具有相似性,模体规模与模体信息传播途径多样化对网络结构复杂性影响的显著性较高.关键词:模体;复杂性;结构熵;汽车行业站点网络中图分类号: C 93文献标志码: A文章编号: 0254 -0037(2017)06 -0889 -08doi: 10.11936/ bjutxb2016080065收稿日期: 2016-08-31基金项目:北京市自然科学基金资助项目(9172002)作者简介:骆 琪(1979 ),男,助理研究员,主要从事产业复
3、杂网络方面的研究, E-mail:luoqi bjut. edu. cnComplexity Measure of Automobile Industry SiteNetwork Based on MotifLUO Qi, HE Xijun(College of Economics and Management, Beijing University of Technology, Beijing 100124, China)Abstract: In order to provide the methods for measuring the complexity of huge scale n
4、etworks and putforward the countermeasures for structural layout and optimization of automobile industry site network, theautomobile industry site network topology was built based on the linked data of WWW pages. Theclustering algorithm of VOSviewer and software Gephi were used for community detecti
5、on, and the resultdemonstrates the content classification system, the functional structure and the small-world property ofautomobile industry site networks. The Rand-ESU algorithm was used for motif detection, and thenetworks structure entropy algorithm based on motif was proposed to measure the com
6、plexity of eachcommunities. The results of empirical analysis show that the network motifs structure is isomorphic amongthe different communities of automobile industry site network, which have led to the function similarity ofinformation dissemination in different communities, and the motifs size,
7、the diversified channels forinformation transmission have an important impact on complexity of networks structure.Key words: motif; complexity; structure entropy; automobile industry site network“互联网+ ”时代,传统汽车销售模式面临新的机遇与挑战,构建汽车行业站点间的关联网络,研究基于互联网主题搜索的汽车行业站点内容分类体系,以及行业站点网络的复杂性结构特征,提出基于模体的网络复杂性测度方法,对汽车
8、行业站点网络结构布局、功能优化以及复杂性治理具有重要意义.万方数据北 京 工 业 大 学 学 报2017年网络复杂性的测度一方面要关注网络结构的整体特征,同时也要关注其局部特性,Girvan等1提出社团的概念,即网络中的顶点可以分成组,组内顶点间的链接比较稠密,组间顶点链接比较稀疏.社团是了解整个网络结构和功能的重要途径2-4.借鉴此观点,将汽车行业站点网络进行社团划分进而分析社团结构的复杂性特征,并通过站点内容解析得出以主题链接为依据的内容分类体系,为研究汽车行业站点网络的功能结构提供依据. Shenorr等5、Milo等6提出网络模体的概念,认为模体是网络的基本拓扑结构之一,介于个体和社团
9、之间,能从局部刻画网络链接的模式并识别网络拓扑结构和动态特性7.因此,综合考虑网络的社团和模体特征,能够全面分析网络结构性质及网络功能.在模体探测算法方面,Wernicke等8提出了Rand-ESU算法进行模体检测,Meira等9提出了一种快速的模体检测方法,并可应用于4、5模体的检测. Wang等10提出了通过抽样算法利用少量可测节点评估大规模网络的模体性质. Zhang等11提出了动态模体的识别方法,并得出了影响力和持久性会对组织互动与决策产生影响. Wegner等12提出了一种网络模体分析的信息论方法,将模体定义为一种网络总信息量最少的子图覆盖. Kim等13提出了一个快速有效的模体计算
10、实例,能够减少计算时间并消除早期算法中的重复枚举粒子.罗眉等14采用模糊聚类方法建立了任务-资源模糊聚类分析模型,用平均距离表示模糊集的隶属度,并定义了模糊相似系数,设计了资源聚类算法.在模体应用方面,Huang等15-16定义了桥模体和砖模体,并研究了不同类型模体对复杂网络结构的影响. Salehi等17在囚徒困境博弈下,研究了模体结构与合作之间的关系. Topirceanu等18利用模体的主要功能解释了在线社交网络形成的驱动力,并验证了facebook等社区网络之间的结构区别.Kiremire等19提出利用模体可以确定网络拓扑结构之间的结构相似性.宋宁宁等20检测了股票网络中的模体结构,研
11、究股票购买行为.刘亮等21-22将网络模体引入工程复杂系统和国家关键交通网中,辨识网络的模体特性,为局部结构设计和建设提出建议规则.缪莉莉等23研究了科学家合作网的模体结构,分析合作机制. Topirceanu等24提出基于网络的模体模型,可以为研究社会网络复杂性提供基础.近年来,熵作为表征网络状态复杂性和无序程度的重要概念,在测度网络复杂性方面应用广泛,例如度分布熵25、网络结构熵26分别基于边和点的差异性测度复杂结构特征,蔡萌等27引入网络流的概念,综合考虑径向测度和中间测度,提出网络结构熵的概念,同时考虑了点和边的差异性.石福丽等28将熵与模体结合,以节点度及类别为基础提出了超网络模体熵
12、的概念,用于度量军事通信网络的功能复杂性.武玉英等29提出了基于模体的网络结构熵,测度汽车企业合作网络的复杂性.由于汽车行业站点网页间链接网络庞大,网络全局复杂性测度很难系统深入地了解局部结构和功能特征,因此,将汽车行业站点网络进行社团划分,然后构建基于模体的社团网络结构熵模型,一方面研究社团结构复杂性特征,另一方面基于模体结构研究网站信息传播路径及对复杂性的影响,可为大规模行业站点网络的复杂性测度和信息传播路径及特征剖析提供方法及思路.1 社团结构划分及复杂性测度方法1. 1 社团结构划分及模体检测利用可视化工具VOSviewer,通过聚类算法对网络进行社团检测.通过Gephi软件计算模块度
13、,对网络进行社团划分,并利用FANMOD软件,采用Rand-ESU算法对网络中模体存在性进行检测,为网络结构特征分析与复杂性测度提供支撑.1. 2 基于模体的网络结构复杂性测度在费尔德曼等提出的基于点和边差异性的网络结构熵30基础上,既考虑节点和边在全局网络中的宏观特性,又考虑点和边的局部特征,提出基于模体的点差异性和边差异性的网络结构熵,测度网络结构的复杂性.其中基于模体的点差异性代表网络中与某节点的模体顶点度不同的节点数,基于模体的边差异性表示网络中模体结构之间相互关系的差异性.计算步骤如下:1)计算基于模体的点差异性,公式为Si = nj =1fjSMji ,i =1,2, ,N, j
14、=1,2, ,n式中:i为网络节点数量;N为网络的规模;M为网络的模体;j为网络中模体种类数量;fj为第j类模体在网络中出现的频率;SMji为网络中与节点i的某类模体顶点度不同的节点数SMji = 1 - p(kMji )N式中节点i的某类模体顶点度kMji为包含节点i的098万方数据 第6期骆 琪,等:基于模体的汽车行业站点网络复杂性测度第j类模体M的个数,p(kMji )为网络中第j类模体顶点度为kMji的节点的概率.2)计算基于模体的边差异性,公式为Di = nj =1fjDMji式中DMji = kMji 1 - p(kMji )N,网络中任意连接的节点的度值应该服从的概率分布为kp(
15、k),即一个拥有度值为k的节点被选中的概率应该为度值为1的k倍31(网络中孤立节点不会被选中),由此可以反映网络中节点信息传递方式的多样性以及节点之间信息传递的时效性和质量.3)计算基于模体的节点相对重要性,公式为Ii = Ii Ni =1Ii式中:Ii为节点在网络中的差异性程度;Ii = Si +Di,表示节点i的结构重要性,其中、分别为基于模体的点差异性和边差异性的权重, + =1.本文认为点差异性和边差异性对网络结构复杂性的影响具有同等重要性,因此/ =1.4)计算基于模体的网络结构熵,公式为H = - Ni =1Iilg Ii1. 3 基于模体的信息传播路径计算在网络模体探测基础上,通
16、过计算模体中蕴含的信息传播路径,能够更好地解释基于模体的网络结构熵对行业站点链接网络复杂性的影响,因此,利用Matlab设计主函数和子函数计算模体的信息传输路径.函数功能实现步骤如下:1)主函数pathsum定义初始变量minary、marcary,minary为图的邻接矩阵.计算图中边的数量,赋值给n.循环读取minary矩阵,为marcary赋值,marcary为n行3列矩阵,存储每条边的信息,第1列为起点,第2列为终点,第3列为边的编号,用于区分是否为同一边.使用循环语句,获取图中2点,点编号分别赋值为p1、p2,计算subfunc(p1,p2,marcary)函数的累计加和值,结果赋值
17、给outvalue,则函数subfunc(p1,p2,marcary)返回p1和p2之间的路径条数.函数返回outvalue.2)子函数subfunc变量p1、p2、marcary分别为起点编号、终点编号、边信息矩阵.定义变量r,赋初值1,定义变量resultcnt,赋初值0.如果r大于marcary行数,则函数返回resultcnt值,程序执行完毕;否则,读取marcary中第r行.如果第r行第1列是p1,则继续执行 ,否则,r = r +1,执行 .第r行第1列点编号入栈stack,如果第r行第2列点编号为p2,则resultcnt = resultcnt +1.第r行第3列赋值给数组变量
18、flag,标记该边被访问过.判断栈是否为空,不为空,则继续 ;否则,r = r +1,返回至 .计算栈长度,赋值给变量pre_len.取栈顶值,赋值给变量i.变量pot1 = marcary(i,1),pot2 = marcary(i,2),fg =marcary(i,3).循环读取marcary中每条边,如果该边可与第i行表示的边相连,且未被访问过,则该边入栈,标记为已访问,如果该边终点为p2,则resultcnt =resultcnt +1.获取栈长度,如果栈长度仍然为pre_len,则栈顶出栈,返回 .2 汽车行业站点网络社团结构划分及复杂性测度2. 1 汽车行业站点网络拓扑结构图绘制数
19、据来源为某搜索网站提供的87 288 069条网站站点文本数据,每条文本数据项视为1个网络站点,数据项包含多个网址,这些网址为从该站点可访问到的其他站点,从而可形成海量网站之间的链接关系图.为构建汽车行业相关站点网络图,搜索汽车行业主流站点93个,在原始网站站点文本数据中筛选出含7条以上汽车行业主流站点的数据项作为汽车行业相关站点数据库,共计14 150条文本数据,占比约0. 016%.将14 150条数据视为14 150个节点,如果任意2条数据文本中含有相同的网站,则认为2条数据文本间存在关联边,边权为含有相同站点的个数.因数据量较大,选择边权大于11的点集合作为样本数据构建网络,通过2条数
20、据字段含有的相同项建立连边,构造邻接矩阵并通过Ucinet软件构建网络拓扑结构图.网络节点即为汽车行业相关网站站点,网络连边为站点间关联,构成无向无权图,其中节点591个,节点间连边51 756类,虽然网站间链接复杂,但站点数规模相对不大.图1为betweenness(特征向量中心度)为500的节点构成的网络拓扑结构图.198万方数据北 京 工 业 大 学 学 报2017年图1 汽车行业网站网络拓扑结构图Fig.1 Automobile industry website network topology graph图2 社团1 5拓扑结构图Fig.2 Community 1 -5 topolo
21、gy graphs2. 2 网络社团结构检测及特征分析利用可视化工具VOSviewer,通过聚类算法,对汽车行业站点网络进行社团检测,生成社团标签视图. VOSviewer根据节点间关联程度对其进行社团聚类,标签视图中的不同颜色为不同类别,因此,可将汽车行业站点网络划分为8个社团,社团的节点数依次为142、131、105、102、98、5、5、3.通过社团结构划分并对各类社团中站点内容进行解析,得出汽车行业网站内容分类体系为:第1类主要涉及汽车新闻、论坛消息等信息型站点,站点构建目标为通过新闻及社交宣传网络建立起公众对汽车产品和服务的关注,提升交易机会;第2类主要涉及汽车品牌、车型报价等广告型
22、站点,多用于品牌及营销策略宣传;第3类主要涉及二手车市场、配件等在线销售型站点,主要通过图片及在线展示的方式提供二手车线上营销与配件销售等信息;第4类主要涉及维修制造等售后服务型站点,关注汽车售后服务营销;第5类主要包括与汽车产业相关的经济资讯等综合信息订阅型站点,关注个性化服务与推荐营销;第6类主要包括地方新闻、地方政策等信息站点;第7类主要包括汽车电子产品报价以及批发等销售类站点;第8类主要是一些搜搜问问、网络购物等相关信息站点.通过社团的规模和内容主题分类,可得前5类社团为汽车行业站点网络的核心社团,说明目前汽车网络销售与运营平台构建的内容体系主要包括:新闻宣传、品牌宣传、营销策略宣传、
23、售后服务以及个性化信息推荐等类型,其网络功能多表现为借助网络做广告、产品介绍以及信息发布等.虚拟试驾、在线咨询系统、在线交易平台以及辅助销售的智能化应用平台等内容和功能较少.为进一步研究汽车行业站点网络中不同社团的网络结构特征,利用Gephi软件对社团进行分割,并绘制各社团的拓扑结构,如图2所示.298万方数据 第6期骆 琪,等:基于模体的汽车行业站点网络复杂性测度利用Pajek计算社团1 5的结构特征,结果如表1所示.表1 社团1 5复杂网络结构特征Table 1 Community 1 -5 complex network structure characteristics社团节点边平均度
24、网络直径网络密度平均聚类系数平均路径长度1 142 5 237 36. 88 3 0. 523 0. 873 1. 4872 131 6 269 47. 86 3 0. 736 0. 835 1. 2663 105 4 220 40. 19 3 0. 773 0. 916 1. 2334 102 4 059 39. 79 3 0. 788 0. 928 1. 2155 98 1 380 14. 08 3 0. 290 0. 839 1. 760由表1可得:社团1 4的平均度都较大,为36 48,说明信息传播规模较大; 5个社团的网络直径均为3,平均聚类系数分布在0. 83 0. 93,平均路径
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 汽车行业 站点 网络 复杂性 测度 骆琪
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内