《基于流行度预测的互联网+电视节目缓存调度算法-朱琛刚.pdf》由会员分享,可在线阅读,更多相关《基于流行度预测的互联网+电视节目缓存调度算法-朱琛刚.pdf(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机研究与发展DOI:107544issnl0001239201620151143Journal of Computer Research and Development 53(4):742751,2016基于流行度预测的互联网+电视节目缓存调度算法朱琛刚 程 光 胡一j 王玉祥(东南大学计算机科学与工程学院南京211189)(教育部计算机网络和信息集成重点实验室(东南大学) 南京 211189)(gchengnj neteducn)A Caching Strategy for Internet Plus TV Based on Popularity PredictionZhu Chenga
2、ng,Cheng Guang,H u Yifei,and Wang Yuxiang(School of Computer Science and Engineering,Southeast University,Nanjing 211189)(Key Laboratory of Computer Network and Information Integration(Southeast University),Ministry of Education,Nanjing 211189)Abstract Internet plus TV tends to excessively consume s
3、torage space to achieve higher cache hitratioA novel cache schedule algorithm called PPRA(popularity prediction replication algorithm)isproposed in this paper based on programs popularity forecastFirstly,according to statistical analysisfrom actual measurement,we apply random forests(RF)algorithm to
4、 construct a forecasting model ofprograms popularitySubsequently,we use the principal component analysis(PCA)to overcomedimensionality curse and accelerate the forecasting processFinally,we validate PPRA with authenticbehavior data of a certain cable operatorS 13 million users in a period of 120 day
5、sOur experimentalresults show that PPRA only consumes 30storage space to achieve a fixed cache hit ratio comparedwith LRU and LFU algorithms,therefore the cost of Internet plus TV platform iS savedKey words Internet plus TV;popularity prediction;random forests(RF);caching strategy;dimensionality cur
6、se摘要针对互联网+电视平台为提高热点节目命中率而过渡消耗存储空间的问题,提出一种基于流行度预测的节目缓存调度算法PPRA(popularity prediction replication algorithm)首先,在对实际测量数据进行统计与分析的基础上,使用随机森林(random forests,RF)算法构建节目流行度预测模型同时,针对所选特征存在的“维数灾难”问题,利用主成分分析法(principal component analysis,PCA)实施特征降维处理,以实现视频流行度预测值的快速计算然后基于节目流行度预测数据调度缓存中的节目最后以某广电运营商130万用户120 d的收视数
7、据为例,对PPRA算法进行实验实验结果表明,在保证一定缓存命中率前提下,与LRU,LFU算法相比,PPRA算法仅需30的存储空间,可有效降低互联网+电视平台的建设成本关键词互联网+电视;流行度预测;随机森林;缓存策略;维数灾难中图法分类号TP393收稿日期:20l 5-12 21;修回日期:2016一02一16基金项目:国家“八六i”高技术研究发展计划基金项目(2015AA015603);江苏省未来网络创新研究院未来网络前瞻性研究项目(BY201309 5 5 03);江苏省“六大人才高峰”高层次人才项目(201l DZ024)This work was supported by the Na
8、tional High Technology Research and Development Program of China(863 Program)(2015AA015603),the Prospective Research Program Oil Future Networks of Jiangsu(BY2013095503),and the Six IndustriesTalent Peaks Plan of Jiangsu(20 1 1一DZ024)通信作者:程光(gchengnjneteducn)万方数据朱琛刚等:基于流行度预测的互联网+电视节日缓存调度算法为克服传统广播电视要
9、求用户在固定时间及地点收看特定电视台播出的特定节目,无法满足当今用户空问移动化、时间碎片化和内容个性化需求的缺点,互联网+电视网络通过大数据分析技术,从海量用户行为数据中分析当前用户的收视兴趣,有的放矢地向用户提供符合用户兴趣的节目内容,为用户提供个性化的电视节目,给用户带来更加人性化的体验为此,互联网+电视网络系统通过将热点节目缓存在边缘服务器上,有效降低网络访问流量和播放时延但为保证一定的节目缓存命中率,现有节目缓存调度算法需要消耗大量存储空间,增加了缓存建设成本,阻碍了互联网+电视的进一步推广针对此问题,本文通过对实际互联网+电视平台数据分析,发现节目流行度与用户点播量、播出时间、节目内
10、容、制作方等因素密切相关,在定性分析这些关系的基础上,提出一种基于流行度预测的缓存调度算法PPRA(popularity prediction replicationalgorithm)该算法首先使用随机森林(randomforests,RF)算法建立了节目流行度的预测模型,采用主成分分析法(principal component analysis,PCA)对模型输入实施特征降维处理,实现流行度预测值的快速计算;然后通过比较各节目的预测流行度决定调入缓存的节目内容;最后,以某广电运营商的130万云媒体电视用户行为数据为例对所提fH的算法进行测试实验结果表明,在保证一定缓存命中率的前提下,与近期
11、最少使用(1east recentlyused,I。RU)算法、最近最不常娟置换算法(1eastfrequently used,LFU)=?算法相比,PPRA算法仅需30的存储空间,可有效降低互联网+电视平台建设成本1 相关工作11 流行度预测节目流行度是节目收视量的表现,收视量越大流行度越高节目流行度作为反映节目热度的重要指标,不仅能够帮助运营商在购买节目版权时做出决策,指导广告商合理分配广告投入,而且能够作为边缘内容分发网络(CDN)缓存调度的重要依据目前针对在线视频、图像、音乐、微博、话题的流行度分析和预测是当前研究的热点和难点近期的研究工作大多通过在具体情境下引入更多的分析特征,以提高
12、预测的准确率和覆盖率Wang等人3j通过分析用户在腾讯微博中转发优酷视频链接的行为,采用神经网络算法构建视频流行度模型,在不依赖历史收视数据的情况下取得了良好的预测精度Vallet等人。L综合社交网络和视频发布平台的数据,提出基于传染病传播的流行度预测模型,实现了对YouTube上点播量瞬间爆发视频的预测孔庆超等人一j研究了影响网络讨论帖流行度的动态因素,并提出一种基于动态演化的讨论帖流行度预测模型Ding等人“。通过分析社交网络中流行图片和非流行图片的特征,提出一种用于预测图片流行度的模型Figueiredo70研究了YouTube视频流行趋势,给出了UGC视频特征和节目流行度的关系Pint
13、o等人_利用节目上线初期的点播数据,提出了一种适用于YouTube平台的内容流行度预测算法,有效地降低了预测偏差Ahmed等人。9j使用内容自身流行度的比例变化与用户关注其他内容流行度的比例变化之间的相似程度,得出内容在不同时间段聚类组的转换关系Sanner等人利用Twitter数据对YouTube平台内容流行度进行分析,采用转移学习算法有效预测出视频流行度发生突变的情况Chang等人。1越采用自动回归模型捕获用户行为变化的特征,实现了对网络连续剧内容的质量分析和流行度预测McParlane等人虬为解决预测内容缺乏标签、评论等交互数据导致的冷启动问题,使用图片、用户上下文信息以及视觉感受预测F
14、lickr图片的流行度,取得了良好的效果12缓存调度CDN网络中如何高效地管理边缘服务器的缓存空问是当前国内外研究的热点问题缓存策略主要由缓存替换算法和缓存决策算法2部分构成缓存替换算法负责在有限的缓存空间下寻找出最合适的内容数据进行缓存;缓存决策算法为需要缓存的数据寻找合适的存储节点因此,如何在有限的缓存空间下设计高效的缓存策略,从而提高缓存命中率、降低网络带宽消耗,是缓存管理的关键Abrahamsson等人屯通过分析一个在线时移系统的用户点播记录,发现20的节目产生了80的点播请求如果能够合理地缓存热点节目,可以很好地降低系统的带宽消耗Balachandran等人u朝分析了3 000万的视
15、频会话数据发现用户在使用VOD服务时存在同步收视的特征,采用混合P2PCDN的方式能有效降低CDN的建设成本Zhou等人1 6j万方数据计算机研究与发展201 6,53(4)研究了V()D系统中不同类型节目流行度的变化规律,并提出一种FIFO和IFU混合缓存策略,取得了较好的效果Gouta等人I 7j提出了一种ICN网络中动态自适应流行度变化的流缓存策略Abrahamsson等人J艇研究了影响缓存效果的诸多因素,包括节目流行度、节目大小、缓存策略等Nencioni等人n”I通过在机顶盒硬盘上提前录制用户可能收视节目,有效降低高峰时段的网络流量Agrawal等人120 5通过缓存不定长的影片片段
16、取得了相比LRU算法更好的命中率Akhtar等人2提出了一种用于缓存在线影片的分层过滤算法,该算法复杂性类似于IRU,但在命中率、替换率和缓存吞吐量上均有明显提升Park等人2纠提出了一种自适应流行度分布的二元缓存算法,在缓存较小时取得了良好的效果王永功等人12L提出了一种基于预过滤的改进算法,通过对原始内容的整形使得内容更容易被后续缓存命中以上有关缓存策略的研究中,各边缘节点在进行决策时均未综合考虑内容的流行度和缓存容量等冈素一些算法片面追求缓存命中率,没有考虑缓存空间和内容总量的关系,造成整个系统建设与运营成本高昂,性价比较低2 互联网+电视节目的流行度特征目前流行度的研究对象主要集中于视
17、频、图像、微博、分享链接等流行度的定义与具体的应用相关本文研究对象是互联网+电视平台中的节目,因此将节目在某段时间窗口内的点播量以及节目点播量在总片库中的排名数据作为节目流行度的度量21数据描述本文数据采集是某广电运营商互联网+电视平台2015-010120150430共计120 d的用户时移回看记录和电子节目指南数据本文主要关注基于IP技术的互联网+电视,采集数据不包括传统直播业务的收视记录通过对服务器RTSP日志的清洗,用户回看记录、电子节目指南都作为一条记录存储在()RACLE数据库中表1总结了数据集的具体情况本文共收集了1309万个用户201亿次回看记录,节目数量总计423万个每条回看
18、记录包含机顶盒序列号、回看时间、节目名称、频道名称;每条电子节目指南包括频道名称、节目名称、节目类型、节目时长、播出Et期、拍摄日期、导演、演员信息Table I Internet Plus TV Data Set in Figures表1互联网+电视收视数据总体情况通过对120 d的点播行为数据(如图1所示)进行分析,发现在线用户数(clients)和节目数(programs)基本稳定在相对固定的范围,而收视次数(requests)随时间呈现周期性震荡点播次数在每周六通常会出现一个高峰数据采集周期内,平均每天点播次数达1675万次Number of DaysFig1 Number of re
19、quests,active clients,and distinctprograms requested over 1 20 days图1 点播量用户节目在采集周期内的总体情况22流行度与时间关系在观测周期内,点播量以周为单位存在明显的周期变化周末的点播量明显高于工作日的点播量图2展示了一周之内每小时的点播量数据通过图2Fig2 Number of requests of topl0,top500 and allprograms for an hour in a week图2一周内每小时toplOtopS0和所有节目的点播量万方数据朱琛刚等:基丁流行度预测的巨联网+电视节f_1缓存凋度算法可以
20、发现,一周内的所有节日点播次数呈现明显的周期性,其中周六和周日在一周中的点播量最大,而在每天晚间2():()o 21:00是收视高峰期;此外在每天中午的12:oo 13:00会出现一个小高峰,而在下午会有所回落,直到傍晚1 6:00之后,点播量开始逐渐上升总体看来,Topl0和TopS00的节目也呈现出同样的特征23流行度与内容关系观测周期内,平均每天有45万个节目被点播排名最高的节目累计点播量接近20万次,大部分节目的累计点播量不足1 000次图3是收视次数与节目排名的累积分布可以看排名前10的节目占据了75的点播量,排名前20的节目占据了90的点播量呈现j明显的长尾效应本文将节目分为电影、
21、电视剧、新闻、少儿和综艺南于收视人群的不同以及各期节目之间的关联性,造成不同类型节日的流行度呈现不同的变化趋势图4(a)为一部热播电影上线以来的点播量以及每天的点播排名变化情况可以发现,电影节日在上线初期点播量很大且排名很高,随上线时间变长,其点播量和排名均会同步下降;在周末,点播量会m现一个明显的回升图4(b)为综艺节目点播量以及点播排名变化情况可以看出节日在上线初期的点播量较高;而后Fig3 Cumulative distribution of requests to programs图3收视次数随节目排名的累积分布lj现下降的情况;与其他类型节目不同,真人秀节目会周期性出现一些点播的高点
22、,而这一周期正好与真人秀节目的播放周期一致图4(c)为单条新闻发布48 h内的点播量以及点播排名变化情况可以发现,新闻刚发布,即带来较高的点播量,其排名也较高,但点播量和排名在48 h内都会快速下降图4(d)为儿童动漫节日点播量以及点播排名变化情况可以发现,动漫节目在上线初期的点播量特别大,然后会下降;与其他类型节日不同的是动漫节目在上线一段时间后仍会保持比较稳定的点播(c)Ne、s (d)Childrens programsRequests 廿RankFig4 Requests and rank for movies,TV show,news and childrens programs f
23、or seven days图4 电影、综艺、新闻和卡通7日点播量和收视排名变化Jno王J。Qls。11口出ko矗DuIjZo一万方数据计算机研究与发展201653(4)量和点播排名;此外,动漫节目在周六和周日的点播量会明显高于一般_T作日2。4流行度与节目制作方关系同样内容和类型的节目,由于导演、演员、制片公司、宣发频道和首播时间的不同,点播量和排名变化也呈现出不同的趋势节目是否符合当前观众的兴趣口味节目本身的制作水平是关键的影响因素。与导演风格、演员的当红程度、制作公司能力息息相关在观测的120 d内,本文整理了445位导演和2008位演员的节目数据,发现16的导演制作的节目产生了80的点播
24、量,15的演员参演的节目产生了80的点播量图5(a)为在相同宣发频道、相同内容主题的前提下,不同制作方拍摄节目的流行度随时间的变化可以看出,不同演员和导演制作的节目会产生截然不同的流行度Stage(a)Influnce of different films productions(b)Influnce ofdifferent distribution channelsFig5 Influence of film production and dist ributioncorporatkm on programs popula rity冈5 不同制作方和宣发频道对节日流行度的影响宣发频道的实力和
25、定位也影响着节目的点播量和排名变化宣发频道是否有足够实力在节目播m前在观众群中为节目预热、宣发频道本身带来的收视惯性,以及该宣发频道的定位是否与节目风格符合都直接影响节目上线后的流行度图5(b)为相同节目在不同宣发频道上的流行度变化,可以看出,宣发频道对节目流行度有直接的影响3 PPRA算法从第2节分析可看出可通过选取多个不同特征来描述一个节目,如上线日期、播I叶I时间、节目类型等,而节目流行度与所选取的节目特征之间有很强的关联性,因此本文选用一系列有监督学习的方法来对节目的历史数据进行分析和学习,从而提取影响节目流行度的关键特征,并构建节目流行度随时间变化的模型,根据某个节目的特征和该节目上
26、线以来的历史数据预测该节目未来7 d的流行度,为节目的缓存调度提供合理的理论依据31 数据预处理及输入特征选取在本文第2节中,已经描述了若干对节日流行度有显著影响的特征,但是由于这些特征并不能够直接作为机器学习算法模型的输入,所以需要对其进行预处理1)上线时间图4为电影、综艺、新闻和卡通4类电视节目7 d的点播量和收视变化,可以看出。随着节目上线时间的增长,节日的点播量和收视排名均会出现下降因此,新上线节目往往会比老节目更加受欢迎,本文用“距离首次上线的天数”这一指标衡量上线时间带来的影响,如式(1)所示:了、一TT。 (1)其中,11为观测日期,T。,为节目首次上线时问2)频道、节目类型图5
27、为不同制作方和宣发频道对节目流行度的影响,可以看出宣发频道和节目类型对节目的流行度有直接的影响同时,此类特征属于类型特征,每一个特征都有个不同的取值,但同时只有一个是有效的本文将其转换成采用One一()fK编码模式的特征,即如果一个特征有,儿个不同的取值,则用一组长度为且只有一位为1的二进制数来表示3)节目标签、导演、演员本文的观测数据集中,包含445位导演和2 008位演员,通过分析发现80的点播量由16的导演制作的节目产生15的演员参演的节目产生了80的点播量此类特征和节目类型有相似之处,都会有,刀个不同的取值,但不同的是有效取值可以同时存在多个对其采用类似的处理方法,转换为长度为,竹的二
28、进制位后,将每一个有效的位用1来表示,其余则为0需要指出的是,导演和演员的数量众多,如果不加处理直接万方数据朱琛刚等:基于流行度预测的互联网+电视节目缓存调度算法使用会导致样本属性维度过大、训练结果过拟合因此在训练前,筛选贡献80流行度的导演和演员,将导演和演员的数量分别从445位和2 008位减少到223位和1 202位4)播放时间从图2可以看出,不同时间段的点播量存在较大差异本文将一天按24 h划分为24个时间段,根据节目播放的时问,为其标记l 24当中对应的值,然后再根据类型特征的预处理方法进行处理此外,节目时长以及是否为周末节假日对影片的点播率也有很大的影响,将这些因素全部作为特征加入
29、到机器学习的模型中,将有效提升模型预测结果的准确性对本文设计的模型而言,一条样本”,阱由输入特征向量(F)和未来7 d该节目的流行度(Dj)组成o:是一个7维向量,每一维代表该节目在接下来某一天的流行度32流行度预测模型的训练Biau。21对RF算法的适用场景和计算模型进行了分析和改进,改进后的RF可以用来做分类、聚类、回归和生存分析本文选用RF模型的原因有3点:1)经过预处理后的特征维度会达到2 000的数量级,即使经过一系列的降维处理,仍会有100而RF算法得益于算法中双重抽样的环节,在面对高维特征时仍有较好的性能和较高的准确性2)RF算法在学习完成后可以给H5特征的重要性,这对于分析特征
30、对点播率的影响有很大的作用3)本文的目标是根据节目的特征预测出未来7 d的流行度,属于回归问题,RF算法相比于传统线性回归算法更为简洁高效使用随机森林算法进行流行度预测的过程如下:设x为RM的矩阵,X。表示第i个样本的第j个特征;y为R1的向量,y,表示第i个样本的输出值Stepl对数据集进行行、列双重采样,并对采样后的数据建立决策树行采样采用有放回的采样方式,也就是在采样的集合中有可能有重复的样本设输入样本有N个,每次采样的个数为玎(,zP。) OT=()丁+(,; J丁一,丁+t; else continue; end if end forend forreturn o了、,J丁基于流行度
31、预测的缓存算法1所示,该算法设置大小为w的缓存窗口缓存窗口内的节目是缓存中流行度排名靠后的W个节目在缓存置换时,仅将主存内的节目与缓存窗口内的节日进行流行度的比较,将比置换窗口中节目流行度高的节目调入缓存,并将相应的低流行度节目调出缓存,这样可以有效地减少比较次数,提高缓存替换算法的响应速率4性能评估采用某广电运营商互联网+电视平台的用户行为记录作为性能评估的原始数据以天为单位计算节目收视次数和调度缓存内容的时间间隔。比较LRU,IFU,PPRA三种缓存调度策略命巾率随缓存数目的变化其中命中率是指节目请求的命中率命中率的计算周期为7 d,实验结果如图8所示从图8可以看出,缓存算法的命中率与缓存
32、大小之问正相关而且,当缓存较小时缓存的增大对于命中率的提高幅度较大,但随着命中率的提高,缓存大小对于命中率的提升效果减弱从21节的数据集介绍中可以得出,每天的平均电视节目请求数为19 098,为了比较不同缓存策略的差异,取日均节目请求数的5(955个)作为观测点从图8可以看出,当缓存总请求量5的电视节目时,IRU算法的缓存命中率为57。I。FU算法的缓存命中率为59PPRA的缓存命中率为79,而且,在缓存节目大小相同时。PPRA算法的缓存命中率明显优于I。RU算法和I。FU算法的缓存命中率;同时,为了达到一定的缓存命中率,PPRA策略所需的缓存空间要远小于I。FU算法和LRU算法,例如要达到8
33、0的缓存命中率,LRU和LFU需要缓存2 987个节目,而PPRA算法仅需缓存l 021个,从而可以有效地节省缓存空间、降低系统建设成本0 1 2 3 4 5 6103xCache SizeprogramsFig8 Lache hit rallo、S cache size for three algorithms图8 不同算法缓存命巾率和缓存容量的对比同时,选取日均节目的5作为缓存的容量使用120 d的用户收视数据检验PPRA缓存算法缓存命中率,并将PPRA算法的缓存命中率与LRU算法和LFU算法的缓存命中率进行比较基于l 7周的观测数据,我们对PPRA算法、IRU算法和IFU算法的缓存命中率
34、进行了对比,发现3种算法的缓存命中率均随时间发生一定的波动图9展现了1 7周中3种算法缓存命中率最高一周的波动情况在整个1 7周中PPRA算法最大缓存命中率是随时间发生周期变化的且大部分时间高于IxRU算法和IFU算法在系统负载最大时达到最高值。在黄金时间(每天20:00 21:00)命中率超过80;而I。RU算法和IFU算法的缓存命中率稳定在5060实验结果表明PPRA算法能够有效地提高最大缓存命中率OneWeekFig9 Comparison of iliaX cache hit ralio图9最大缓存命中率的比较图10展现了1 7周中3种算法缓存命中率取得中间值时一周的波动情况在整个1
35、7周中,PPRA算法缓存命中率是随时间发生周期变化的,且大部分时间高于IRU算法和I。FU算法,在系统负载最万方数据75() 计算机研究l亏发展2016,53(4)大时达到最高值,在黄金时间(每天20:00 21:00)命中率超过70;而LRU算法和LFU算法的缓存命中率稳定在4555实验结果表明,PPRA算法相比LRU算法和I。FU算法,对缓存命中率中值有很好的提升Fig10 Lomparison of median cache hit ratio罔10缓存命中率中值的比较图11展现了17周中3种算法缓存命中率最低一周的波动情况在整个l 7周中,PPRA算法最大缓存命中率是随时间发生周期变化
36、的,在系统负载最大时达到最高值,在黄金时间(每天20:OO一21:00)命中率超过80,远高于同期的IRU算法和I。FU算法最小缓存命中率;而IRU算法和LFU算法的缓存命中率稳定在4050实验结果表明,PPRA算法的最大缓存命中率优于IRU算法和IFU算法Fig1 1 Comparison of rain cache hit ralio图11 最小缓存命中率的比较综上所述,可以得出以下结论:1)PPRA算法采用日均节目的5作为缓存空间,可以达到平均70的缓存命中率2)PPRA算法消耗的缓存空间明显低于相比传统算法(IRU,LFU),达到80缓存命中率时只消耗相当于传统算法30的空间3)在互联
37、网+电视系统负载最高时,PPRA算法的命中率达到最高,较好地契合了互联网+电视节目流行度随时问的变化规律5 结 论为了解决互联网+电视平台以提高热点节目命中率而过渡消耗存储空间的问题,本文首先从互联网+电视平台真实数据巾揭示了与节目流行度关系紧密的若干因素,定性分析了相应的关系,并根据这些关系选取节目上线时问、类型、标签、播放时间作为特征,基于RF算法和PCA算法,构建了节日流行度预测模型,并提出一种基于节目流行度的缓存调度算法一PPRA该算法在保证缓存命中率的同时能有效节省存储空间实验结果表明,在相同节目缓存命中率下PPRA算法的空问开销最多可缩减至IRU算法的30,降低了互联网+电视平台的
38、建设成本作为后续研究工作:拟分析用户其他行为(如使用社交网络、移动终端)对节目流行度的影响,进一步挖掘用户收视兴趣,精细化该预测模型,提高预测准确度,并部署在真实的互联网+电视平台上进行验证和应用参 考 文 献1Fricker【1Robert PRobert s JA versattie and atcurateapproxinultion for IRU cache performance Ec3Proc of t11e24th Int Telm raffic Congress KrakowPoland:International Telet raffic Congress201 2:182
39、Hendrantoro(j,Affandi AEarly result from adaptivecombination of LRUIFU and FIF()to improve cache serverperformance in telecommunication network EcProc of IntSeminar on Intelligent Technology and hs Applications(ISITIA)PiscatawayNJ:IEEE2015:4294323Wang ZSun I。Wu(、et a1Guiding Internet scale videoserv
40、ice deployment using microblog based prediction【、Proc of IEEE 1NF()【()M 2012Piscataway,NJ:IEEE2012 2901-290514Vallet D,Berkovsky S,Ardon S,el a1Characterizing andpredicting viralandpopular video content(刁troe of the241h A【、M Int Con r on 1nformalion anti KnowledgeManagementNew York:ACM,2015:159l一160
41、05Kong Qingchao,Mao WenjiPredicting popularity of forumthreads based on dynamic evolutionJJournal of Software2014,25(12):2767-2776(in Chinese)(孔庆超毛文吉基r动态演化的讨论帖流行度预测软件学报201 125(12):2767-2776)万方数据朱琛刚等:基于流行度预测的巨联网一电视节目缓存调度算法 7j1r 61J78j9j1 o:1l:1 21 3i1411j:rl 6r1 71 81()r)i119 WShaIY(加)IPt扎Vide()po叫la
42、 rity predhlonby sellI;n“,n c I】r。I】fIgati()n、lfl jnlpIl(lt ntJlw()rk!(1iIr【】Lofthc 2“h ALM lt ()nf()n 1nformalion and KnowledgeMana妊emt叶1tNew York:ACM。2Ij:l 621_1 63(Rguei rcd()F t)n t1e lJredIcti。n of 1)。pularlIy()ftrellds an(ihit s f()r us。r g。Icd、。id、:(二Ir()【。f 111e 6Ih A【、M In【()nf(】11 W曲ar小a11
43、d I)1Ia Mi119, ew、【】rk:A【、-2l 3 74】一746Pmto H,Alnlrida J M(j【)ncfll、es M AL+sjng earIy、icwpaerns t()predIct 111e I)。p LJ】aritj+【)f YouT LJhe、ldeos!【1iPr()c()r“1e 6Ih ALM Int L1011f 011 W曲Scarch and I虹taMiningNrw Y)rk:AtlM!_:冀6j 074、hfned MSpagna S,HuIcl Fct a1A peek int()the future:PrcdicIlng the ()
44、lutj()n ()f p()pullrlty in L】s。r gcner“1edcontenI:L、Pr。c【)fthe 6Ih ACM Tnt(、onf on web Sea rchan【l Dala Minl暇ew York:、L、M2()l 3:6()7一_;16R()y S I) Mel TZeng Wet a1 Towa r(Is crossdomainlcarning f。r s()cIal 、7ideo I】()pularity prcdirtion :J IEFETrs()11 MulIinledla!1 31j(f)12jj一1 167Yu H Xit_L Sanner
45、S Twjtter一【lrivon YouTube、,iews:Bey。n|in1ivi(1LIalinflucncersc?Iroc()f th。A(、M Int【()nfon MultImcdlaNew Y()rk:ALM?(1 4:8R!)一872Chang m Z1u H,(;e Yet a1 Predhlng the popula riIy。fonJine serjals with aut()regrcsslve n1()delsLjIroc of 1he23 rd CM Int (、()nf on I“ornlatI()n d K11(,wlc【19cManagcmenINcw、T
46、ork:ACM2I_11 i:1 33 1)13 18McParlHne P JMoshfeg1i YJflse J M01)od、7 ronles hreanymore1t s t()o crowded; I)redicllng imagu poI)ula九ty(FlickrL11Proc。f Int Lonf。n、nllIinledia ReI ri卧ral NcwY()rk:、CM!14:38j一3 1)7A1)rah1sson H Nor(1mark M P rogranl I)oI)ulariIy fmd讯wer Ielvi()LIr in a large TV 011 dLmlan
47、clysIem!(1Pr。cof the 2012 ALM L、o“011 111ternet Measurenlenl NewYork:AL、M,22:1 9921“Balac1ind川1 A跏kar V、hlla、al- A11Ilyzing 1 heI)oI。nl knem ()f (DN augnlpntan s”at瞎ies f()rlnlernel video workloads ic?Proc of the 2()13 AcM(、。nf()n InterneI Mcasur。mcnt New、ork:ACM2()l 3:35hZh()Ll、Chll IYiing-cI a1Video I)omjla ril y dynanllcsand its inlplicallon f。r reI)licat;on J IEE Trans onM LIlIinledia,2()1j1 7(8):l 2 73一l 28i(而L“a A Hon业I)K Kcrml rrPr A Met11 HTTPadaIjti、。mreamlng 111 nlobllc nelworks: Characlrrlslifs“ndcachlng opI)()九u11ltiPs:【:Pr。c【)f 111e 2 1 st IEEE Int synlpon Model
限制150内