效用函数研究hayi.docx
效用函数数研究报报告003一一种TCCP博弈弈模型的的Nassh均衡衡存在性性分析与与仿真在TCPP博弈中中,当网网络对任任意流没没有额外外的处罚罚时,用用户i的收益益函数表表示为:。Y为为此时链链路的资资源使用用率,为用户户i采取哪哪的策略略时的效效用,为为链路上上产生拥拥塞时对分组组的时延延和丢弃弃所造成成的拥塞塞成本。005P2P环境中基于信号博弈论的资源定价机制根据需求求曲线和和供给曲曲线的交交点,即即是均衡衡价格和和均衡质质量值所以,可可求出局局部均衡衡价格,均均衡质量量,既均均衡解为为(,)。在确定信信号传递递模型时时,从卖卖方以局局部均衡衡价格作作为出售售价格来来分析自自身利益益最大化化的信号号局部部均衡价价格是卖卖方卖出出资源的的可能性性最大的的价格所以,提提供方在在获得局局部最优优解后,根根据自身身的效用用最大选选择质量量信号,进进行资源源定价,卖卖方也可可以根据据均衡价价格,适适当的调调低或调调高定价价,这由由卖方的的个人喜喜好而定定,资源源可靠性性为t,信信号量为为s,在不不考虑交交易是否否成功时时的卖方方的效用用为由于交易易并不一一定成交交,因此此在信息息不对称称的环境境下,交交易是否否成交和和价格pp,及信信号量ss的选择择有关,假假设成交交的可能能性与价价格和信信号量的的关系为为,式中中k是常常量当当交易成成功时,节节点获得得的收益益为u;不成功功时获得得的收益益为0由此。确确立新的的卖方效效用函数数008一种基于博弈论的P2P内容分发协议本文通过过博弈论论的机制制来激励励节点间间进行协协作,促促使网络络中彼此此互为邻邻居的节节点同时时成为对对方的内内容下载载者与上上传者把该系系统建模模成一个个非协作作博弈,博博弈主体体为接收收服务器器S所分发发数据包包的所有有节点每个节节点选择择一种策策略以决决定自己己如何执执行博弈弈数据据包的下下载收益益和上传传成本这这两个因因素是节节点选择择个人博博弈策略略的主要要参考依依据其其中,节节点可以以选择参参加系统统的协作作(CAA),贡贡献带宽宽和服务务;或者者不参加加系统的的协作(UCAA),保保持自私私的行为为性能能分析表表明,最最终每一一个节点点都不愿愿意独自自偏离依依照博弈弈理论所所选定的的协作策策略即遵遵守本文文设定的的激励机机制,达达到对所所有节点点均最优优的纳什什均衡。收益值是是节点所所收到的的分发数数据包的的数量的的具体体体现,可可以表达达成:上式中,Harvsti代表节点i加入系统m个回合后的总收益值,p为内容分发服务器s每回合所分发的数据包数量,Reit表示节点i在第t个回合所接收到数据包数成本值是是节点所所发送数数据包的的数量的的具体体体现,可可以简单单地表达达成:上式中,CCostti代表表节点ii加入系系统m个个回合后后的总成成本值,其其他See分别表表示节点点i在第第t个回回合所发发送的内内容包、谣谣言/请请求包和和惩罚包包的数量量。效用值的的表达 (0<<<1)010基于重复博弈和惩戒机制的P2P 协作激励信誉模型信誉机制制加入到到P2PP 网络络后,节点间间的博弈弈行为已已不再是是简单的的单阶段段博弈.假设节节点将无无法知道道该博弈弈到何时时终止,由博弈弈论知识识可知,当局中中人无法法预知博博弈终点点时,该博弈弈将是一一个无限限重复的的多阶段段博弈.因此,PP2P网网络中节节点交易易便成为为一种无无限重复复博弈节节点在考考虑本次次交易所所采取的的策略时时要考虑虑的标准准是它在在本阶段段的预期期收益值值. 由重重复博弈弈理可知知,节点的的预期收收益是此此次交易易与所有有后续交交易中单单阶段收收益值的的贴现值值之和,即其中,为贴现现因子,它可以以看成一一个节点点对后续续交易的的耐心程程度, 其取值值范围为为0 <<< 11. 的值越越大,说明节节点对后后继交易易越有耐耐心;反之, 节点越越重视当当前的交交易,它的取取值由PP2P 网络本本身的各各个因素素决定;ui(k)为为节点ii 在第第k 阶段段的收益益。020基于博弈论框架的P2P 激励模型效用函数数Ui用于刻刻画用户户对于所所得服务务质量的的以货币币为度量量的满意意程度表表现用户户需求的的异构性性有了价价值矩阵阵和差异异服务概概率函数数就可以以得到PPi的效用用Ui第1项表表示加入入系统需需要付出出的代价价第2 项是可可从系统统得到的的收益。定义无量量纲ui,则-di表表示Pi加入系系统的代代价它与与Pi贡献的的硬盘空空间或者者带宽的的资源成成正比PPi的获益益取决于于其他PPeerr 对系系统的贡贡献dj和这些些贡献对对于Pi的价值值(bijj)以及Pi可能从从该Peeer下下载文件件的概率率由P(00)=0和P()=1 可知知ui有两个个极限可见无限限增大贡贡献di并不能能无限地地提高效效用ui直观地地解释就就是参与与者贡献献越大得得到的服服务质量量就越好好但是参参与者从从系统中中得到总总的收益益并不是是随着其其贡献的的增加无无限增大大的而是是有一个个最大值值前提是是有一系系统临界界值bc.当bi>bc时效用用函数才才有可能能取到最最大.024基于混合战略博弈的P2P激励机制文献中,把把结点行行为分为为服务(serrve)和不服服务(donnt serrve),两种种行为的的支付函函数分别别为:公式 33-1公式 33-2其中,UU和C是结点点的效用用函数和和消耗函函数,RR是信誉誉值,由由以下式给给出公式 33-3公式3-4是介于00到1的一个个常量,其其意义相相当于贴贴现率。如如果结点点的混合合战略NNashh均衡为为(p,l-pp),即即以P概率服服务,以以(1-p)概率率拒绝服服务,则则根据等等值法,占优混合战略中大于O分量的纯战略期望支付相等,有公式3-5将公式33-1至至3-44代入公公式3-5有pp关于UU、C、的函数关系:公式3-6032对等网络中的搭便车行为分析与抑制机制综述效用函数数(uttiliity funnctiion)是搭便便车抑制制机制研研究中的的一个关关键概念念。效用用函数可可能涉及及以下自自变量;节点共共享文件件的数量量、节点点已下载载文件的的数量、节节点已上上传文件件数量、节节点已下下载数据据的大小小、节点点已上传传数据的的大小等等。定义义计算复复杂性小小,却能能客观地地反映搭搭便车控控制中关关键问题题的效用用函数是是激励机机制设计计的核心心. 以以下通过过介绍不不同效用用函数定定义,分分析激励励机制的的一般研研究方法法。式(1)(3)是文文献11中定定义的33个效用用函数。(1) 式(1)左端的的表示在在时刻,节节点的效效用函数数。右端端的表示示在时刻刻,节点点所提供供的共享享文件数数;是一一个规范范化系数数,是个个常量。采采用式(1)作作为效用用函数,节节点能享享受的服服务质量量正比于于节点共共享的文文件数量量,效用用函数(1)十十分简单单,节点点所共享享文件数数量决定定节点能能享受的的服务质质量。(2)式(2)从文件件大小角角度来计计算节点点的效用用函数。式式(2)先先把一个个节点提提供的共共享文件件大小求求和,然然后乘以以规范化化系数。对对比式(1)和和式(22),两两者差异异是在大大文件和和小文件件的处理理方面有有区别。采采用式(1),有有利于共共享多个个小文件件的节点点享受高高服务质质量;而而式(22)则有有利于共共享大文文件的节节点。式式(1)和和式(22)定义义的效用用函数均均是静态态效用函函数,没没有反映映节点所所提供的的文件被被其它节节点下载载次数的的动态信信息。(3)效用函数数(3)既考考虑了节节点提供供的共享享文件的的大小,又又考虑了了提供的的共享文文件在对对等网络络中的受受欢迎程程度。表表示节点点在时刻刻的奖励励值,表表示节点点在时刻刻的惩罚罚值。奖奖励值中中包括节节点为其其它节点点提供下下载文件件大小之之和,惩惩罚值是是节点从从网络中中下载数数据大小小之和,已已下载信信息量越越多则惩惩罚值越越大。效效用函数数(3)可可以有效效区分那那些提供供不被访访问信息息资源的的搭便车车节点。然然而式(3)在在增加合合理性的的同时也也增加了了计算复复杂度,它它揭示了了效用函函数设计计中的一一个矛盾盾:复杂杂度与合合理性的的冲突。计计算比较较简单的的效用函函数,如如式(11)、式式(2),合合理性较较弱;而而合理性性强的定定义则计计算复杂杂度大。采采用式(1)(3)效效用函数数,可以以有效限限制节点点的搭便便车行为为。在节节点搭便便车行为为突出时时,可让让节点既既无法发发送查询询请求,也也不能下下载信息息资源。搭搭便车者者若不能能享受信信息资源源共享服服务,它它将离开开对等网网络,对对等网络络在线用用户数量量降低。然然而对对对等网络络运营者者而言,在在线用户户数量大大小是衡衡量系统统价值的的重要指指标,例例如利用用 P22P系统统从事广广告业务务,它可可以允许许不提供供共享数数据的节节点存在在,因为为系统可可以主动动向搭便便车节点点发送广广告信息息。在线线节点数数量越多多,则广广告效果果越好。如如果严格格执行上上述效用用函数,尽尽管有效效抑制了了节点的的搭便车车行为,却却不利于于提高对对等网络络的用户户数量。评价一个个节点为为对等网网络所做做贡献不不能单纯纯地按绝绝对贡献献大小评评价,继继而提出出了如式式(4)所示示的效用用函数值值大小比比较方式式,其中中表示节节点所作作绝对贡贡献值,表示节点的最大可支持物理带宽。式(4)中的效用函数值不是简单的绝对贡献值,而是服务贡献值与节点所能提供的最大带宽之比值。它对物理上贡献能力低、但尽力做了贡献的节点比较有利。(4) 多数基于于激励机机制的搭搭便车行行为控制制方法是是在节点点提出查查询或下下载请求求时计算算该节点点的效用用函数,然然后确定定服务质质量。但但也有研研究者认认为在对对等网络络负载不不大的情情况下,应应该尽量量为所有有节点服服务。因因此他们们把激励励机制的的控制点点选择在在信息服服务提供供节点,而而不是请请求发起起节点2-33。提提供信息息资源下下载的节节点根据据当前网网络状态态,将其其判定为为拥塞和和不拥塞塞两种类类型。如如果服务务提供节节点不拥拥塞,则则尽力满满足同一一时刻所所有节点点提出的的服务请请求。但但当服务务提供节节点发生生拥塞时时,它根根据查询询或下载载请求发发起节点点的效用用函数值值对服务务请求进进行优先先级分类类。先满满足效用用函数值值高的节节点发出出的服务务请求,后后满足效效用函数数值小的的节点服服务请求求;特别别拥塞的的情况下下,可能能拒绝搭搭便车者者的服务务请求2-33。文献44中定定义的效效用函数数如式(5)所示示:(5)式(5)与式(1)(3)有两两个区别别:(11)在时时间域上上采用连连续方式式,用积积分计算算节点pp在时刻刻 t 的效用用函数;(2)评价收收益的角角度不同同。式(1)(3)是从从整个 P2PP系统的的角度来来计算各各个节点点的效用用函数,节节点为其其它节点点提供了了服务,则则是正收收益;节节点从网网络中下下载了数数据,则则是负收收益。式式(5)却是是从单个个节点角角度来评评价效用用函数,其其中积分分部分表表示节点点从网络络下载的的数据量量。从对对等网络络中下载载资源越越多,则则节点自自身收益益越大;求和部部分表示示节点为为其它节节点提供供的下载载服务总总和,为为系统贡贡献越大大,则节节点效用用函数值值越小。根根据式(5)的计计算结果果,文献献4把节点点分成理理性主义义者、搭搭便车者者和贪婪婪者3类类。理性性主义者者期望效效用函数数值较大大;搭便便车者则则仅期望望自身提提供的下下载服务务量最小小;贪婪婪者则仅仅注意积积分部分分值较大大,即节节点从网网络中获获得下载载数据总总量最大大。文献献认为无无论是搭搭便车者者还是贪贪婪者,都都不值得得提倡,对对等网络络提倡理理性主义义节点。