重复博弈与信誉的管理特征.pptx
《重复博弈与信誉的管理特征.pptx》由会员分享,可在线阅读,更多相关《重复博弈与信誉的管理特征.pptx(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第6章重复博弈与合作行为张维迎 教授北京大学光华管理学院序惯博弈与重复博弈 序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次; 重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game).重复博弈的三个特征 阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构; 所有参与人观察到博弈过去的历史; 参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;重复博弈和信誉问
2、题 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。囚徒困境博弈合作不合作合作不合作3,3-1,44,-10,0AB重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例: All-D: 不论过去什么发生,总是选择不合作; All-C: 不论过去什么发生,总是选择合作;
3、 合作-不合作交替进行; tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动; trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。“囚徒困境”的一般表示合作不合作合作不合作T,TS,RR,SP,P满足:RTPS; (S+R)T+T支付函数 双方都不合作: 对 的解释: 贴现率; 博弈继续的概率; 二者的结合; 一般化:未来收益的重要程度11.d)-alld,-all(32PPPPPV无名氏定理(Folk Theorem) 在无限次重复博弈中,如果参与人对未来足够重视( 足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均
4、衡得到。 这里“合作程度”定义为整个博弈中合作出现的频率。 50年代就人所共知,但无人有发明权;Tit-for-tat 纳什均衡,但不是精炼纳什均衡:11.TFT)TFT,(32TTTTTV1.TFT)D,-All(32PTPPPTVWhy Not A Perfect NE 假定A在t=5的时候,没有合作。根据TFT战略,在t=6,B应该选择惩罚(不合作)。B会这样吗? 如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为: 反之,如果B原谅A,,.,RSRSR,.,TTTTTAxelrod (1984) Tit-for-tat 是成功率最高的战略Trigger strat
5、egies 如果未来足够重要,精炼纳什均衡:11.trigger)(32TTTTTV 合作,1.trigger)(32PRPPPRV 不合作,合作的条件 如果下列条件满足,合作就是均衡结果:111PRTPRTR解释 R-T可以理解为不合作的诱惑; R-P是合作的剩余(利益); 条件说明: 给定未来的重要程度,不合作的一次性诱惑(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大; 给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大;行为的信息传递 假如欺骗两次才被发现:1)1 (.trigger)(2432PRPPPRRV 不合作,PRTRPRTR含义 欺骗行为越难以被发
6、现,欺骗发生的可能性越大;或者说,合作越困难; 在前面的例子,R=4, T=3, P=0. 如果欺骗一次就被发现,只要 合作就会出现;而如果欺骗两次才被发现,只有当 时,合作才可能出现; 一般地,欺骗行为越不容易被发现,合作越困难。25. 004345 . 0惩罚与合作 Abreu(1986):最大合作战略是使用最严厉的可信惩罚(the strongest credible punishment); 维护合作并不需要无限期的惩罚;只要惩罚期足够长就可以了; 萝卜加大棒(stick and carrot): 从合作开始,一直合作直到:如果有任何一方在t期不合作,在t+1期,前期合作者选择“不合作
7、”来实施惩罚,前期不合作者选择合作;如果该合作的没有合作或者该惩罚的没有惩罚,在t+2期继续按照上述t+1期的战略规定博弈;否则,合作恢复。解释 在合作子博弈,合作的条件是: 在非惩罚子博弈,合作的条件是:STTRSRTTSTSPSPTS不可信的惩罚:垄断厂家客户商家不购买购买诚实欺骗(5,5)(1,7)(0,0)不确定性下的最优处罚 在确定的情况下,惩罚越严厉,越有助于合作。因为均衡情况下,欺骗从来不会发生,所以惩罚实际上是没有成本的。 但在不确定的情况下,即使每个人都选择合作,“坏结果”也会出现。如果坏结果总是触发惩罚,就会冤枉好人,过重的惩罚反到导致不合作;但如果总是原谅,合作也不会发生
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 重复 博弈 信誉 管理 特征
限制150内