《文件共享系统的测量与研究.ppt》由会员分享,可在线阅读,更多相关《文件共享系统的测量与研究.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、P2PP2P文件共享系文件共享系统统的的测测量量与研与研究究韩韩士雄士雄华北计算技术研究所什什么么是是P2PP2P网络网络?争议争议没有特定的集中的网络设备由网络中的结点提供资源或服务所有结点(设备)的角色、责任和义务平等例:电驴、BT下载、搜狗音乐等研研究究动动机机P2P文件共享系统(Gnutella and Napster)已得到广泛应用还没有人对P2P网络进行测量研究发现系统中用户的特征:带宽瓶颈带宽瓶颈、包延包延迟迟、用用户户接入接入与与退出系退出系统统的生命周期的生命周期、用用户户共享和共享和下下载载的的数数据量据量、用用户间户间的的协协作水平作水平,特征之间的关关系系内内容容概概要
2、要文章文章概概述述研研究方法究方法测测量量结结果果建建议议结论结论介介绍绍GnutellaGnutellaNapsterNapster节节点点对对系系统产统产生的影生的影响响例:例:网络状况网络状况差(大量引用)差(大量引用)接入接入时间时间短(短(资资源可用性)源可用性)。研研究方法究方法主主动测动测量量第一步:周期性第一步:周期性获获取每取每个个系系统统的同的同时时在在线线人人数数以以及用及用户户的的状态状态,包括,包括IPIP地址、端口地址、端口号号以及客以及客户户端端软软件自己上件自己上报报的一些信息。的一些信息。第二步:第二步:针对针对第一步得到的用第一步得到的用户户,进进行行长时间
3、长时间探探测测,获获取他取他们们的相的相应应信息,如信息,如带宽瓶颈带宽瓶颈等。等。研研究方法究方法体系体系结构结构目目标标:利用互:利用互联网联网使用使用户户自由交自由交换换文件文件协议协议:HTTPHTTP用用户户:对对等(均衡)、上等(均衡)、上传传、下、下载载(与与分布式分布式系系统统差差异异)策略:定位文件策略:定位文件研研究方法究方法体系体系结构结构PPPPPPSSSSQRDPPPPPPQRPQQNapsterGnutella研研究方法究方法NapsterNapster网络网络爬虫爬虫无法直接访问Napster服务器提前确定文件列表(流行音乐)-误差并行发出大量请求收集用户信息:带
4、宽、共享文件数、正在上传及下载的文件数、文件的名字及大小、IP地址统计:160服务器,40%-60%用户 80%-95%文件546401个不同IP地址,509538个用户研研究方法究方法GnutellaGnutella网络网络爬虫爬虫连接热点Peer循环发送ping消息(TTL很大)通过pong消息获取用户信息(IP地址等)每个网络爬虫运行2分钟,无误差统计:每个网络爬虫获取到8000-10000个结点信息,总节点的25%-50%1180205个不同IP,1239487个用户研研究方法究方法GnutellaGnutella网络网络爬虫爬虫研研究方法究方法测测量用量用户户特征特征带宽瓶颈测量延迟
5、测量生命周期测量(连接频率、保持连接时间)研研究方法究方法带宽瓶颈测带宽瓶颈测量量Napster(25%)和Gnutella都存在不上报带宽的节点采用动态侦听获取节点带宽,两个难点:1、可用带宽随时间变化2、必须衡量丢包率高带宽接入(1G)可用带宽链路带宽最后一跳工具:SProbe(TCP包)研研究方法究方法生命期生命期测测量量Peer的三种状态:离线状态(未接入互联网或不响应TCP SYN包)非活动状态(接入互联网,响应TCP SYN包,但未接入点对点系统)活动状态(已接入点对点系统,能接受TCP连接)工具:LF(可监视上万个结点生命期)研研究方法究方法测测量量对对象描述象描述Gnutell
6、a1、生命期(17125Peer,60小时,7分钟)2、瓶颈带宽(595974Peer,下行223552,上行16252)3、延迟(339502Peer)Napster1、生命期(7000Peer,25小时,2分钟)2、瓶颈带宽(2049/4079Peer)测测量量结结果果带宽瓶颈带宽瓶颈下行带宽高于上行带宽测测量量结结果果-带宽瓶颈带宽瓶颈下行带宽Gnutella高于Napster测测量量结结果果NapsterNapster结结点点带宽带宽测量结果测量结果NapsterNapster结点带宽结点带宽测测量量结结果果GnutellaGnutella延延迟迟70ms 280ms测测量量结结果果G
7、nutellaGnutella延延迟迟接入方式影响上网带宽及延迟大小测测量量结结果果可用性可用性测测量量结结果果可用性可用性Gnutella与Napster的文件传输方式基本相同测测量量结结果果文件共享文件共享数数量量少量的用户拥有大部分的资源测测量量结结果果文件共享文件共享数数量量文件共享数量Gnutella高于Napster测测量量结结果果下下载载、上、上传传、共享文、共享文件件上传文件(高带宽用户)下载文件(低带宽用户)测测量量结结果果共享文件特征共享文件特征Gnutella共享文件数量远大于Napster测测量量结结果果GnutellaGnutella网络网络拓扑拓扑Gnutella依赖少量重要结点对Peer-to-Peer系统的建议根据结点的物理特征及可靠性来分配责任节点之间的差异:连接速度、延迟、生命期、共享数据3-5个数量级直接测量各节点的物理特征处理服务器与客户端的关系Gnutella 26%的用户不共享数据Napster 20%-40%的用户不共享或很少共享总结Gnutella和Napster内部节点之间存在着较大的差异系统中存在着责任不均衡的问题用户会在某种动机的驱使下谎报自己的信息Thank you!Thank you!
限制150内