效用函数研究.docx
《效用函数研究.docx》由会员分享,可在线阅读,更多相关《效用函数研究.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、效用函数研究报告003一种TCP博弈模型的Nash均衡存在性分析与仿真在TCP博弈中,当网络对任意流没有额外的处罚时,用户i的收益函数表示为:。Y为此时链路的资源使用率,为用户i采取哪的策略时的效用,为链路上产生拥塞时对分组的时延和丢弃所造成的拥塞成本。005P2P环境中基于信号博弈论的资源定价机制根据需求曲线和供给曲线的交点,即是均衡价格和均衡质量值所以,可求出局部均衡价格,均衡质量,既均衡解为(,)。在确定信号传递模型时,从卖方以局部均衡价格作为出售价格来分析自身利益最大化的信号局部均衡价格是卖方卖出资源的可能性最大的价格所以,提供方在获得局部最优解后,根据自身的效用最大选择质量信号,进行
2、资源定价,卖方也可以根据均衡价格,适当的调低或调高定价,这由卖方的个人喜好而定,资源可靠性为t,信号量为s,在不考虑交易是否成功时的卖方的效用为由于交易并不一定成交,因此在信息不对称的环境下,交易是否成交和价格p,及信号量s的选择有关,假设成交的可能性与价格和信号量的关系为,式中k是常量当交易成功时,节点获得的收益为u;不成功时获得的收益为0由此。确立新的卖方效用函数008一种基于博弈论的P2P内容分发协议本文通过博弈论的机制来激励节点间进行协作,促使网络中彼此互为邻居的节点同时成为对方的内容下载者与上传者把该系统建模成一个非协作博弈,博弈主体为接收服务器S所分发数据包的所有节点每个节点选择一
3、种策略以决定自己如何执行博弈数据包的下载收益和上传成本这两个因素是节点选择个人博弈策略的主要参考依据其中,节点可以选择参加系统的协作(CA),贡献带宽和服务;或者不参加系统的协作(UCA),保持自私的行为性能分析表明,最终每一个节点都不愿意独自偏离依照博弈理论所选定的协作策略即遵守本文设定的激励机制,达到对所有节点均最优的纳什均衡。收益值是节点所收到的分发数据包的数量的具体体现,可以表达成:上式中,Harvsti代表节点i加入系统m个回合后的总收益值,p为内容分发服务器s每回合所分发的数据包数量,Reit表示节点i在第t个回合所接收到数据包数成本值是节点所发送数据包的数量的具体体现,可以简单地
4、表达成:上式中,Costi代表节点i加入系统m个回合后的总成本值,其他Se分别表示节点i在第t个回合所发送的内容包、谣言/请求包和惩罚包的数量。效用值的表达 (0<<1)010基于重复博弈和惩戒机制的P2P 协作激励信誉模型信誉机制加入到P2P 网络后,节点间的博弈行为已不再是简单的单阶段博弈.假设节点将无法知道该博弈到何时终止,由博弈论知识可知,当局中人无法预知博弈终点时,该博弈将是一个无限重复的多阶段博弈.因此,P2P网络中节点交易便成为一种无限重复博弈节点在考虑本次交易所采取的策略时要考虑的标准是它在本阶段的预期收益值. 由重复博弈理可知,节点的预期收益是此次交易与所有后续交
5、易中单阶段收益值的贴现值之和,即其中,为贴现因子,它可以看成一个节点对后续交易的耐心程度, 其取值范围为0 << 1. 的值越大,说明节点对后继交易越有耐心;反之, 节点越重视当前的交易,它的取值由P2P 网络本身的各个因素决定;ui(k)为节点i 在第k 阶段的收益。020基于博弈论框架的P2P 激励模型效用函数Ui 用于刻画用户对于所得服务质量的以货币为度量的满意程度表现用户需求的异构性有了价值矩阵和差异服务概率函数就可以得到Pi 的效用Ui 第1项表示加入系统需要付出的代价第2 项是可从系统得到的收益。定义无量纲ui , 则 -di 表示Pi加入系统的代价它与Pi贡献的硬盘空
6、间或者带宽的资源成正比Pi的获益取决于其他Peer 对系统的贡献dj 和这些贡献对于Pi 的价值(bij)以及Pi 可能从该Peer下载文件的概率由P(0)=0和P()=1 可知ui 有两个极限可见 无限增大贡献di并不能无限地提高效用ui直观地解释就是参与者贡献越大得到的服务质量就越好但是参与者从系统中得到总的收益并不是随着其贡献的增加无限增大的而是有一个最大值前提是有一系统临界值bc.当bi>bc 时效用函数才有可能取到最大.024基于混合战略博弈的P2P激励机制文献中,把结点行为分为服务(serve)和不服务(dont serve),两种行为的支付函数分别为: 公式 3-1 公式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 效用 函数 研究
限制150内