书签分享收藏举报版权申诉 / 5

当前位置：首页 > 研究报告 > 论证报告 > 基于种子节点选择的重叠社区发现算法-齐金山.pdf

基于种子节点选择的重叠社区发现算法-齐金山.pdf

上传人：不***

文档编号：129580

上传时间：2018-05-15

格式：PDF

页数：5

大小：1.25MB

( 4.5 )

《基于种子节点选择的重叠社区发现算法-齐金山.pdf》由会员分享，可在线阅读，更多相关《基于种子节点选择的重叠社区发现算法-齐金山.pdf（5页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第34卷第12期2017年12月计算机应用研究Application Research of ComputersV0134 No12Dec2017基于种子节点选择的重叠社区发现算法齐金山12，梁循1，王怡1(1中国人民大学信息学院，北京100872；2淮阴师范学院计算机科学与技术学院，江苏淮安223300)摘要：针对目前从局部社区扩展成全局社区时有关算法的种子节点选择不合理的情形，提出了一种基于种子节点选择的重叠社区发现算法。首先根据影响力函数找出局部影响力最大的节点，由这些节点构成的种子集合较好地分布在整个网络中，然后以这些种子点构造初始社区，根据设定的吸引度函数选择性地添加节点来进行社

2、区扩展。实验结果表明，该算法在真实网络上进行测试时能够有效地挖掘网络中的重叠社区。关键词：重叠社区；局部社区；吸引度函数；社区扩展中图分类号：TP3016 文献标志码：A 文章编号：1001-3695(2017)12-353404doi：103969jissn1001-3695201712003Overlapping community detection algorithm based on selection of seed nodesQi Jinshanl一，Liang Xunl，Wang Yil(1School ofInformation，Renmin University ofChi

3、na，Beijing 100872，China；2School ofComputer Science&Technology，Hnaiyin NormalUniversity，Hnaian Jiangsu 223300，China)Abstract：In view of the unreasonable selection in seed algorithm from the local community expanding into a global communityat present，this paper proposed an overlapping community detect

4、ion algorithm based on selection of the seed nodesThe algorithm used the inflh叠nce function to find out the strongest nodes in local node iniluenceswhich structured the seeds distributing throughout the networkAnd then utilized these seeds to construct the initial community，selectively added nodes t

5、o ex-pand the community according to the set attraction functionThe experimental results show that the algorithm tested in a realnetwork can effectively dig out overlapping community in the networkKey words：overlapping community；local community；attraction function；community expansion0 引言现实世界许多复杂的系统如

6、人际关系网、科学家合作网、流行病传播网、蛋白质相互合作网等都可以抽象为复杂的网络。网络的模块化是指复杂网络中的节点具有聚簇化的特点，其表现形式为模块结构，即社区结构。它是指网络由若干个团或是群组成，每个团内部节点的连接相互紧密，而不同团之间的连接相互稀疏。社区发现的目的就是挖掘复杂网络中的这种团结构，进而实现更深入的应用研究，如社会网络动态演变、异质网络分析、个性化推荐、大规模网络压缩求解等。目前有关社区发现的方法大致可分为两类，第一类是非重叠社区发现方法，此类方法将复杂网络划分为若干个彼此互不相连的社区结构，各节点只归属于其中的一个社区。具体又可分为：a)层次聚类方法，通过给定网络的拓扑结构

7、定义网络节点间的相似性或距离，然后采用单连接层次聚类或全连接层次聚类将网络节点组成一个树状图层次结构，根据实际需求横切树状图，获得社区结构，代表性算法有文献1提出的算法；b)谱聚类方法，该方法源于图的划分问题，其目标是找到一种切割方法，使得切割最少的边就可以将节点分割为不相交的集合，代表性算法有文献2提出的算法，类似的算法还包括文献35；e)模块度优化方法则是采用模块化评价函数Q来描述所发现的社区的优劣，基本思想是基于社区内部的节点连接概率应大于同样度序列随机图的连接概率，Q函数值越大，说明发现的社区结构越好，代表性算法有快速Newman算法陋J、CNM算法J、模拟退火算法(simulated

8、 annealing，sA)o。另一类方法是重叠社区发现方法，该类方法允许一个节点同时属于多个社区的情况，即社区之间有重叠。相关的方法包括：a)CFinder1算法，该算法首先从网络中找出所有大小为k的团，然后将每个团作为节点构建一个新的图，当两个k团共享k一1个节点时，新图中两个对应的节点之间才有边，则新图中每个连通子图所对应的k团集合即构成了一个社区，属于不同社区的k团可能会共享一些节点，类似的算法还有文献10，11；b)COPRA算法2采用标签传播的方法来发现重叠社区，初始化时，每个节点被赋值为一个唯一的标签，然后通过迭代更新节点的标签及其隶属度，最终具有相同标签的节点被划分到相同社区中

9、，若节点具有多个标签即为连接不同社区的重叠节点；C)Link算法。1刊首先对边集进行聚类形成边集社区，然后将边集社区转换为相应的节点社区，分属于不同社区的同一节点即为重叠节点，类似的算法还有文献14，15等；d)基于局部社区优化和扩展的算法，该类算法的思路是从局部出发，逐步扩展，多个扩展之间会形成交叉区域，由此形成重叠社区。典型的算法如LFM 016算法，该算法先从一个随机选择的收稿日期：20160905；修回日期：20161031 基金项目：国家自然科学基金资助项目(71271211，71531012)；北京市自然科学基金资助项目(4132067)；中国人民大学品牌计划资助项目(10XNl0

10、29)作者简介：齐金山(1977一)，男，湖南株洲人，讲师，博士研究生，主要研究方向为社会计算、数据挖掘(qijinshansinacoin)；梁循(1965一)，男，教授，博导，博士，主要研究方向为商务智能、社会计算、数据挖掘；王怡(1991一)，女，硕士研究生，主要研究方向为社会计算、数据挖掘万方数据第12期齐金山，等：基于种子节点选择的重叠社区发现算法 3535种子节点出发，通过不断向外扩张来构建社区，直至社区函数达到局部最优为止。拓扑势作为另一种新颖的重叠社区发现理论，同样产生了许多相关算法。文献17从数据场思想出发，提出了一种基于拓扑势的社区发现算法该方法引人拓扑势描述网络节点问的

11、相互作用，将每个社区视为拓扑势场的局部高势区，通过寻找被低势区域所分割的连通高势区域实现网络的社区划分；文献18提出了一种基于节点位置分析的新的重叠社区发现算法，该算法使用PageRank来评估节点质量，并且基于它们在拓扑势场的固有峰谷结构中的位置来确定节点的社区联系；文献19提出了一种基于节点拓扑结构和属性相似度的局部社区检测算法，通过融合多个已检测到的局部社区，计算出隶属矩阵从而获取全局重叠社区结构。社会网络中的社区挖掘虽然已经取得了很大的进展，但这些方法大多数只在某个领域或某些条件下表现较优，且实际应用中社会网络结构日趋复杂，发掘的难度也不断增大，因此，网络中的社区发现问题仍然是摆在研究

12、人员面前的巨大挑战。本文提出了一种基于种子节点选择的重叠社区发现算法，其基本思想是：首先求出各顶点间的相异度，作为各顶点链接上的权值，从而将问题转换为加权无向网络，利用提出的影响力函数找出局部影响强度最大的节点，这些局部影响力强度最大的节点构成的集合即为最优的种子节点集合，它们较好地分布在整个社会网络中；然后从种子节点集合中选取各种子节点根据预设的吸引力函数找出种子所在的局部社区结构，进而从局部社区结构扩展至整个网络，从而发现网络中的重叠社区。1 相关工作近些年，随着社会网络的不断发展，随之而来出现了大量有关社区发现的种种算法，本文仅讨论有关从种子点出发识别出局部社区算法。2009年Shen等

13、人20 o提出使用最大团来形成社区的核心，将这些最大团当做种子点其计算的代价太高。2011年Gargi等人旧。首先计算出YouTube网络上每个视频被点播的次数，然后选出播放次数最多的视频当做该网络的种子点来识别社区，然而这种非结构信息社区识别并不适合其他许多社会网络的社区识别。2012年，Coscia等人旧。提出了Demon算法，该算法是把网络中的任意一个节点当做种子点开始识别局部社区，然后对局部社区进行融合进而形成最优的全局社区。同年，Chen等人旧1提出了选择有局部最大的度的节点作为种子点的算法，该算法先建立社会网络图的节点列表；若一个节点具有最大的局部的度，则把该节点作为种子节点加入到

14、种子节点集合中，同时将该节点以及小于此节点的度的邻居节点从节点列表中移除，若一个节点不是局部最大度的节点，它也被移除出节点列表，当节点列表中的节点全部被移除后，就得到了一个局部最大度的种子点集合，从该集合中选取一个种子点进行局部社区的发现，然后把此局部社区从网络中移除，重复以上过程直到算法收敛。2013年，Whang等人1提出了传播中心算法选择种子点，该算法首先根据社会网络中节点的度大小按递减顺序对节点进行排序，然后选择前K个最大的度的节点作为种子点进行社区识别。由于该算法需要对社会网络有一个全局的了解以及假设种子数目K是已知的，这是该算法的不足之处，因为根本无法事先了解整个社会网络的社区结构

15、。为了更好地找出分布在整个社会网络中的种子点集合，进而挖掘出其中的重叠节点，本文提出了基于种子节点选择的重叠社区发现算法，该算法能够解决现有算法存在的种子选择分布不合理以及效率较低等问题。2 基于种子节点选择的重叠社区发现算法通常，一个社会网络可以用无向图G=(y，E)的形式表示，其中y代表图中凡个节点的集合，E代表图中m条边或关系的集合，如图1所示。泓瑟l 三?H珞定义l节点u的邻居集合N(u)定义为，v(u)=：V，(u，F)E (1)定义2节点u的度D(u)是指与u相关联的边的数目，即D(u)=IN(u)I，其中JI表示集合的势，即元素的个数。定义3节点u对”的影响力NG(u，)定义为

16、NG(等等“芒等 (2)式(3)表示网络中节点M对节点”的影响力大小，其值与节点的度的大小成正比，与节点间的距离成反比。该公式是由牛顿万有引力定律演变而来，式中D(“)用来衡量网络节点的质量，用节点u的度表示，这是因为网络本身具有结构特性，只有节点的度能反映出该节点的有关信息，同时也体现了一个节点与网络中其他节点的通信能力。节点之间的距离d(u，”)用节点之间的相异度来衡量，即d(u，口)=lsim(u，”)，其中sim(“，”)代表节点u和”的Jacc缸d相似度值，若节点u与”的相异度越大，则u对”的影响力就越小，它们在同一个社区的可能性就越小。G是影响力常量(本文取值为常数1)。定义4节点

17、“对其所有邻居节点的影响力和值用函数，()表示，即，(“)：NG()：G单鹄(3)：mN(u ”：磐【l-8”“，”J厂lJ“ “函数，(“)的值越大，则节点u的影响力强度越大，说明在其邻居节点中的地位就越重要，它越有可能成为种子点。为了发现社会网络中的社区结构，本文首先使用种子节点选择算法找到分布于整个网络中的种子集，然后通过该种子集来识别局部社区，进而扩展至整个社会网络。21 种子节点选择算法在种子节点选择算法中，先利用节点间的链接关系计算其相异度，然后根据F(“)函数求出每个节点的影响力强度，如果一个节点和它的邻居节点相比具有更大的影响力强度，该节点以及邻居节点又最终属于同一个社区，则

18、该节点就是一个好的种子节点1。算法1列出了种子节点选择算法的伪代码，其中行3用来求出每个节点的影响力强度，行6、7则表示一个节点的影响力强度大于其所有邻居节点的影响力强度时，则该节点被视为一个种子点，并将其加入到种子集合|s中。图1中各节点的影响力强度值以及算法1所选择的种子节点结果如表1所示，y代表该节点为种子点。算法1 种子节点选择算法万方数据3536 计算机应用研究第34卷输入：社会网络G=(r，E)。输出：种子节点集合S。1 S+一：2 fjr each MV do3 F(“)= G(M，)；4 en df：or5 for eachV do6 if V抄()aJld F()=F(”)

19、then7 S=SU：8 end if9 endfor10 retum S；表1算法1选择的种子点顶点，()值种子点(YN) 顶点 F(u)值种子点(YN)1 3054 Y 6 1699 N2 2493 N 7 1004 N3 1781 N 8 185O Y4 100 4 N 9 185O N5 2493 N 10 25 N算法1能够找出分布在社会网络中的种子点，如图1的种子点集合1，8，这些种子点的度在社会网络中未必是最大的，但它们很好地分布在每个社区中。选择好种子点集合后，各种类型的种子点扩展算法可用于识别局部社区，本文提出了一种新的思想通过种子点扩展来识别社会网络中的重叠社区。22

20、重叠社区发现算法假定有一个社会网络G(V，E)中的一个社区c5和一个节点“，则社区cs对节点u的吸引力函数attract(CS，u)的定义为 attract(cs，“)=竺巫箭广(4) G(“，p)其中：吸引力函数attracl(cS，u)反映了社区对节点M的吸引程度，attract(CS，u)的值越大，节点“从属于社区cS的可能性越大，相反altract(CS，)的值越小，节点M从属于社区cS的可能性就越小。若某一节点“的所有邻居节点都在社区cS中，则attract(CS，托)=1，即节点配只属于嬲这一个社区；否则attract(CS，H)占(s为给定的阈值)，则节点拉属于该社区。节点H的其

21、他邻居节点假如在另一个社区cs中，有attract(CS，u)占，则节点u也属于社区岱，此时节点“归属于多个社区，即为重叠节点。在图1中假设社区cs包含的节点集合为l，2，3，4，5，社区岱对节点6的吸引力attract(圆，6)的值是(N(6，1)+N(6，2)F(6)=033，若占=04，则节点6不属于社区CS；而另一社区cs包含的节点集合为7，8，9，10，社区cS对节点6的吸引力attract(CS，6)的值是(N(6，7)+N(6，8)+(6，9)F(6)=066，则节点6属于社区cS。如果占=03，则节点6属于上述的两个社区，节点6即为重叠社区。本算法发现一个最终社区的过程如下：取

22、种子集合S中一个种子点构造初始社区；扩展初始社区。为了挖掘出社会网络中的重叠社区，事先将网络中所有节点都标记为false，表示此时这些节点尚未被划分到任何一个社区，若节点已被分配到至少一个社区中，则标记为tree。算法2列出了从种子点集合中取一个种子点“构造初始社区并扩展得到一个最终社区的伪代码。其中2一10行构造了一个初始社区cS，该社区的每个节点的吸引力函数值attract(CS，)均不小于给定的阈值占；行12的find()函数找出社区cS的邻居节点集合C；1320计算出该集合中吸引度函数值attract(CS，u)不小于给定的阈值占的节点集合NC，若NC中的节点个数为0时，则挖掘出了一个

23、最终的社区cS，否则将该NC中的节点添加到社区中，得到一个更大的社区cS，继续迭代；然后将最终的社区cS中的节点划分状态标记为tree。算法2从种子节点扩展到一个最终社区算法输入：G=(V，E)，种子节点，阈值s。输出：一个最终社区。1 cS囝；Cg；C一囝；2 c5一cS U：3 for each FE(u)do4 CS+一CS U：5 end for6 l缸each FCS do7 if(attract(cS，)=8)then14 C+一C U”；15 end if16 if(INCI0)then Cs+一CsUNC；Nc一囝：18 else19 break；20 while(tnle)2

24、1 fjr each“CS do22 markedM-tme；23 end for24 retum CS：图1中种子节点8构造的初始社区cS集合为6，7，8，9，10(阈值占取值为040)，该社区的邻居节点集合为t 1，3，由于attract(CS，1)=010，attract(CS，3)=014均小于给定的阈值占，则社区扩展过程停止并发现了一个最终的社区cS=6，7，8，9，10。23时间复杂度分析假设社会网络G包含有n个节点和m条边，算法1实质上是求出每个节点的影响力强度，其时间复杂度为O(n)。为了找到一个最终社区，算法2从O()个种子节点中任选一个种子节点作为初始社区。在进行社区扩展时

25、，在最差情况下，0(n)个节点将加入到该社区，该过程重复执行0(n)次，直到找到一个最终社区。因此，找到一个最终社区的时间复杂度为0(n+nn)=0(n2)。理想情况下，0(后)个种子节点构成D(矗)个初始社区，找到所有的最终社区的时间复杂度为o(k X凡2)，若凡，则时间复杂度近似为0(n2)，在最坏情况下有0(忍)个初始社区，则找到所有的最终社区的时间复杂度为O(n3)。3实验为了测试基于种子节点选择的重叠社区发现算法的有效性，本文算法分别与几种具有代表性的重叠社区发现算法进行比较，待比较的算法分别是CFinder、COPRA、Link和LFM。其中CFinder和COPRA采用的编程语言

26、为Java，本文算法、Link以及LFM使用c#NET编程语言。实验环境为：处理器IntelCore“i52400 CPU310 GHz，内存4 GB，操作系统为Windows 7。31 实验数据实验数据集选取以下三个真实网络，相关信息如表2所示。万方数据第12期齐金山，等：基于种子节点选择的重叠社区发现算法 3537表2实验数据集number dataset nodes f：clses number dataset nodes edgesSl Karate 34 78 s4 Email 1 133 5 45lS2 Dolphins 62 159 S4 GPG 10 680 24 316S3

27、 Football 115 613表中数据集Karate代表了美国一所大学空手道俱乐部成员之间的社会关系网，每个节点代表一个俱乐部成员，成员之间的关系用一条边表示；数据集Dolphins是海豚家族关系网络，每个节点代表一只海豚，若某两只海豚之间经常一起频繁活动，那么网络中相应的两个节点之间就会有一条边存在；数据集Football描述了美国一所大学里各学院之间玩足球游戏的社会关系，节点代表各学院足球队，边则表示学院足球队之间有比赛的社会关系；数据集Email是RoviraiVirgeili大学的一个邮件网络，将邮件用户作为节点，每一封邮件作为边；数据集GPG则代表了信息安全方面的密钥签名。32真

28、实网络的评价标准为了衡量一个网络社区结构划分质量的优劣，文献17提出了重叠社区结构划分质量的模块度函数EQ，其定义为1 I k k印=亡矛A。一苦(5)，l l“E cit，Vf 小其中：Q。表示节点u所属的社区数；A为网络的邻接矩阵，若节点M与口有连接，则A。=I，相反，A。=0；K。为节点u的度；m表示网络中节点间连接的总边数。33实验分析本文中阈值占的取值对社区划分的大小与社区结构的优劣有影响，因此首先给阈值占设置初始值s。，根据式(5)采用爬山的策略调整占，直至达到最优的EQ为止。下面通过Karate数据集的分析来确定s取值对社区结构的影响。首先通过算法l得到Karate的种子节点为1

29、，34；当s=04时通过算法2获得该网络有两个重叠社区，重叠节点为9，此时的EQ值达到最大值为0424。图2中显示的是该网络在占分别取值为03、04时被本文算法划分出的两个重叠社区，其中种子节点集合用红色钻石形标注，挖掘出的两个社区分别用黄色正方形、绿色圆点标注，蓝色三角形节点集合代表社区之间的重叠节点(请见电子版)。将图2中的(a)(b)进行比较，在s=04时EQ值达到最大值，此时社区结构与真实社区结构更相符合。图3给出了随着阈值占的改变，各数据集EQ值的变化情况。从图中可知在占取值为04时，各数据集都取得了最大的EQ值。表3列出了本文算法和其他四个重叠社区发现算法在真实网络上进行测试的EQ

30、性能比较。从实验结果来看，本文算法在不同的真实网络上都取得了较高的EQ值，这说明本文算法划分的社区结构更加准确和明显。EQ值最低的算法是LINK算法，正是由于该算法所构造的链接社区在转换为节点社区时，将其中的一些小的链接社区也转换成为节点社区，从而得不到较为理想的社区发现结果，说明简单地舍去小规模的链接社区仍然是不够的。4结束语本文提出了一种新的从种子节点局部扩展的重叠社区发现算法，该算法定义了两个函数：节点的影响力函数和社区对节点的吸引力函数，以节点的影响力函数获取种子点集合来构造各初始社区，再根据社区对节点的吸引力函数进行社区扩展得到最终社区。通过在真实实验数据集上进行测试，本文算法得到的

31、社区划分虽然受到阈值占的影响，但总体上获得的EQ值与上述算法相比较要好，即本文算法所划分的网络社区结构更准确。后续工作将提高算法在大数据网络上划分的社区结构质量。(h J E=04刳2取彳i同值时的Ka ralr网络社区划分I捌fI(一罔3,offlfj参数。的父系表3本文算法和其他重叠社区发现算法在真实网络上的EQ结果对比参考文献：1Blondel V D，GuiUaume J L，Lambiotte R，et a1Fast unfolding ofcommunities in large networksJJournal of Statistical MechanicsTheoryExpe

32、riment，2008，2008(10)：1551682Shiga MTakigawa I，Mamitsuka HA spectral clustering approachto optimally combining numerical vectors with a modular networkCProe of the 13th ACM SIGKDD International Conference onKnowledge Discovery and Data MiningNew Yo&：ACM Press，2007：6476563White S，Smyth PA spectral clu

33、stering approach to finding conanunities in graphCProe of SIAM International Conference on DataMining2005：76844Donetti L，Muoz M AImproved spectral algorithm for the detection ofnetwork communitiesCProe of the 8th Granada Seminar on Computational and Statistical Physics2005：104107(下转第3568页)万方数据3568 计

34、算机应用研究第34卷样本集存在严重的类簇重叠，而当采样比例较低时KFCMSLI无法准确地选取代表性样本。此外，在iris和balanceScale两个样本集上，KFCMSL!性能略好于理想情况。4结束语本文提出了一种模糊核聚类采样算法，用于解决主动学习中构造初始分类器难以选取代表性样本的问题。为了改善聚类效果，该算法通过核函数把原始样本空间的点映射到高维特征空间，并结合了一种基于局部密度的初始聚类中心选择方法；同时，为了提高采样质量，该算法设计了采样比例分配以及后补采样两种策略。实验结果分析表明，所提算法具有比最新用于解决该问题的Cmeans和FCM聚类采样算法更优的性能，在相同的人工标注负

35、担情况下具有更高的分类正确率。最后，对比了所提算法与理想情况下采样的性能差距，总体上该算法与理想情况的差距并不明显，能够适应实际应用的需要。值得一提的是，本文在对类簇边界区域采样时沿用了BVSB规则(best vssecond best)，接下来的研究将会探索更有效的方法以度量样本与类簇边界的关系。此外，今后工作仍需进行更多的数值实验和对算法效率作进一步改进，并从理论上给出分配系数P的取值指导。参考文献：1Hart Jiawei，Pei Jian，Kamber MData mining：concepts and techniquesMS1：Elsevier，20112钱晓东数据挖掘中分类方法综

36、述J图书情报工作，2007，51(3)：6872(上接第3537页)5Jiang J Q，Dress A W M，Yang GenkeA spectral clusteringbasedframework for detecting community structures in complex networksJApplied Mathematics Letters，2009，22(9)：147914826Newman M EFast algorithm for detecting community structure innetworksJ，Physical Review E：Stati

37、stical Nonlinear&SoftMatter Physics，2004，69(6)：0661337Clauset A，Newman M EMoore CFinding community structure invery large networksJPhysical Review E：Statistical Nonlinear&Soft Matter Physics，2005，70(6)：2642778Guimera R，Amaral L A NFunctional cartography of complex meta-bolic networksJNature，2005，433

38、(7028)：8959009Palla G，Derenyi I，Farkas I，et a1Uncovering the overlapping cornmunity structures of complex networks in nature and societyJNa-ture，2005，435(7043)：81481810Kumpula J M，Kivel M，Kaski K，et a1Sequential algorithm for fastclique percolationJPhysical Review E：Statistical Nonlinear&So仃Matter P

39、hysics，2008，78(2)：1815182411Farkas I，Abel D，Palla G，et a1Weighted network modules f JNew Journal of Physics，2007，9(6)：18012Gregory SFinding overlapping communities in networks by labelpmpagationJNew Journal of Physics，2009，12(10)：2011202413Ahn Y Y，Bagrow J P，Lehmann SLink communities reveal muhiscal

40、e complexity in networksJNature，2010，466(7307)：76176414BaII B，Karrer B，Newman M EEfficient and principled method fordetecting communities in networksJPhysical Review E：Statisti-caI Nonlinear&Soft Matter Physics，201184(3)：10913415Kim Y，Jeong HMap equation for link communitiesJPhysicalReview E：Statist

41、icaI Nonlinear&Soft Matter Physics201 184吴伟宁，刘扬，郭茂祖，等基于采样策略的主动学习算法研究进展J计算机研究与发展，2012，49(6)：11621173Fu Yifan，Zhu Xingquan，Li BinA survey on instance selection foractive learningJKnowledge and Information Systems，2013，35(2)：249283Lughofer EHybrid active learning for reducing the annotation effortofope

42、rators in classification systemsJPattern Recognition，2012，45(2)：884896王骏，王士同，邓赵红聚类分析研究中的若干问题J控制与决策，2012，27(3)：321328朱林，王士同，邓赵红改进模糊划分的FCM聚类算法的一般化研究J计算机研究与发展，2009，46(5)：8148228汪洪桥，孙富春，蔡艳宁，等多核学习方法J自动化学报，2010，36(8)：103710509章森，朱美玲，侯光奎改进的模糊核聚类算法J北京工业大学学报，2012，38(9)：1408141110王勇臻，陈燕，张金松一种改进的求解聚类问题的差分进化算法J

43、计算机应用研究，2016，33(9)：263026331 1Liao Honghong，Xiang Jinhai，Sun Weiping。et a1Adaptive initialization method based on spatial local information for Kmeans algorithmjMathematical Problems in Engineenng2014：article ID76146812Guo Husheng，Wang WenjianAn active learningbased SVM multi-class classification mo

44、delJPattern Recognition，2015，48(5)：1577159713Chang C，nCLIBSVM：alibraryfor support vectormachinesJACM Trans on Intelligent Systems and Technology201 12(3)：2714公茂果，王爽，马萌，等复杂分布数据的二阶段聚类算法J软件学报，2011，22(】1)：27602772(2)：1402140916Lancichinetti A，Fortunato S，Kertrsz JDetecting the ovedappingand hierarchical

45、 community structure of complex networksJNewJournal of Physics，2009，”(3)：194417淦文燕，赫南，李德毅，等一种基于拓扑势的网络社区发现方法J软件学报，2009，20(8)：2241225418Wang Zhixiao，Li Zechao，Ding Xiaofang，et a1Overlapping community detection based on node location analysisJKnowledge-Based Systems，2016105：22523519许加书，韩忠愿，顾惠健基于节点拓扑结构和

46、属性的重叠社区检测算法J计算机应用研究，2016，33(12)：3615361920Shen Huawei，Cheng Xueqi，cai Kai，et a1Detect overlapping andhierarchical community structure in networksJPhysica A：Statis-tical Mechanics&Its Applications，2008，388(8)：1706171221Garsi U，Lu Wenjun，Mirrokni V Set al+Largescale communitydetection on Youtube for t

47、opic discovery and explorationC1Proc ofthe 5th International Conference on Weblogs and Social Media201 1：48648922Coscia M，Rossetti G，Giannotti F，et a1DEMON：a 10calfirst diseovery method for overlapping communitiesCProc of the 1 8thACM SIGKDD International Conference on Knowledge Diseovery andData Mi

48、ningNew York：ACM Press，2012：61562323Chen Qiong，Fang MingAn efficient algorithm for eommunitv detection in complex networkscProc of the 6th Workshop on SocialNetwork Mining and Analysis201224Whang J J，Gleich D F，Dhillon I SOverlapping comillunity deteclion using seed set expansionCProc of ACM Intemational Conference on

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

此文档不允许下载，请继续在线阅读

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于种子节点选择重叠社区发现算法金山

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：基于种子节点选择的重叠社区发现算法-齐金山.pdf
链接地址：https://www.taowenge.com/p-129580.html