书签分享收藏举报版权申诉 / 343

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 博弈论经典课件.ppt

博弈论经典课件.ppt

上传人：飞****2

文档编号：69440363

上传时间：2023-01-04

格式：PPT

页数：343

大小：6.57MB

( 4.5 )

《博弈论经典课件.ppt》由会员分享，可在线阅读，更多相关《博弈论经典课件.ppt（343页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、博弈论博弈论1参考书目：参考书目：博弈博弈论基基础，罗伯特伯特吉本斯，高峰吉本斯，高峰译中国社会科学出版社，中国社会科学出版社，1999年年3 3月月策略策略-博弈博弈论导论，乔尔沃森，沃森，费方域，方域，赖丹丹馨馨译，上海人民出版社，上海人民出版社，2010年年11月月经济博弈博弈论（第二版）（第二版），谢枳予枳予复旦大学出版社，复旦大学出版社，2002年年1 1月月2主要内容主要内容第一章第一章完全信息静完全信息静态博弈博弈第二章第二章完全信息的完全信息的动态博弈博弈第三章第三章非完全信息静非完全信息静态博弈博弈第四章第四章非完全信息非完全信息动态博弈博弈3在所有社会，人们经常互动

2、。在所有社会，人们经常互动。互动有时是合作，有时是竞争。互动有时是合作，有时是竞争。在这两种情况下，都可以用一个术语，即在这两种情况下，都可以用一个术语，即相互依相互依赖性赖性来表示一个人的行为对另外一个人的福利造来表示一个人的行为对另外一个人的福利造成的影响。成的影响。相互依赖的情形可称为相互依赖的情形可称为策略环境策略环境。因为人们为了。因为人们为了确定所采取的最优行动，必须考虑他周围的其他确定所采取的最优行动，必须考虑他周围的其他人会怎样选择行动。人会怎样选择行动。博弈就是策略对抗博弈就是策略对抗博弈的定义博弈的定义4定义：定义：博弈就是一些个人、队组或其他组织，面对一定博弈就是一些个人

3、、队组或其他组织，面对一定的环境条件，的环境条件，在一定的规则下，同时或先后，一次或在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。实施，各自取得相应结果的过程。四个核心方面四个核心方面博弈的参加人博弈的参加人(Player)博弈方博弈方各博弈方的策略各博弈方的策略(Strategies)或行为或行为(Actions)博弈的次序博弈的次序(Order)博弈方的得益博弈方的得益(Payoffs)5目前，博弈论被许多来自不同领域的专业人士使用，这些目前，博弈论被许多来自不同领域的专业

4、人士使用，这些领域包括经济学、政治学、法律、生物、国际关系哲学以领域包括经济学、政治学、法律、生物、国际关系哲学以及数学。及数学。事实上，事实上，大多数情形即包含了冲突元素，也包含了合作的大多数情形即包含了冲突元素，也包含了合作的元素元素。我们对博弈的组成要有一个广义的理解。我们对博弈的组成要有一个广义的理解。简而言之，博弈是策略环境的正式描述。因此，博弈论是简而言之，博弈是策略环境的正式描述。因此，博弈论是研究相互依赖情形的正式的方法论。这里，研究相互依赖情形的正式的方法论。这里，“正式正式”是指是指一种以数学化的精确，以及逻辑上的一致见长的结构。一种以数学化的精确，以及逻辑上的一致见长的结

5、构。利用正确的理论工具，我们可以研究各种情况下的行为，利用正确的理论工具，我们可以研究各种情况下的行为，从而更好地理解经济中的相互作用。从而更好地理解经济中的相互作用。6静静态博弈：博弈：所有博弈方同所有博弈方同时或可看作同或可看作同时选择策略策略的博弈的博弈石石头剪刀布、猜硬剪刀布、猜硬币、古、古诺模型模型动态博弈：博弈：各博弈方的各博弈方的选择和行和行动有先后次序且后有先后次序且后选择、后行、后行动的博弈方在自己的博弈方在自己选择、行、行动之前可以之前可以看到其他博弈方的看到其他博弈方的选择和行和行动弈棋、市弈棋、市场进入、斯坦博格型市入、斯坦博格型市场结构构7完全信息博弈：完全信息博弈：

6、各博弈方都完全了解所有博弈方各各博弈方都完全了解所有博弈方各种情况下的得益种情况下的得益不完全信息博弈：不完全信息博弈：至少部分博弈方不完全了解其他至少部分博弈方不完全了解其他博弈方得益的情况的博弈，也称为博弈方得益的情况的博弈，也称为“不对称信息博不对称信息博弈弈”完美信息博弈：完美信息博弈：每个轮到行动的博弈方对博弈的进每个轮到行动的博弈方对博弈的进程完全了解的博弈程完全了解的博弈不完美信息博弈：不完美信息博弈：至少某些博弈方在轮到行动时不至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈完全了解此前全部博弈的进程的博弈8约翰翰福布斯福布斯纳什什(John Forbes Nash

7、 Jr.,1950,1951)利用不利用不动点定理点定理证明了均衡点的存在，明了均衡点的存在，为博弈博弈论的一般化奠定了的一般化奠定了坚实的基的基础。1994年年约翰翰福布斯福布斯纳什什、约翰翰C C海海萨尼尼以及以及莱因哈德莱因哈德泽尔腾，三人同，三人同时因因为他他们对博弈博弈论的研究，所作出的突出的研究，所作出的突出贡献，而献，而获得得诺贝尔经济学学奖。John HarsanyJohn NashLeihaden Selten9三位大师主要的贡献三位大师主要的贡献1950年和年和1951年年纳什的两篇关于非合作博弈什的两篇关于非合作博弈论的重要的重要论文，文，证明了非合作博弈及其均衡解，并明

8、了非合作博弈及其均衡解，并证明了明了均衡解的均衡解的存在性存在性，即著名的，即著名的纳什均衡。从而揭示了博弈均衡与什均衡。从而揭示了博弈均衡与经济均衡的内在均衡的内在联系。系。泽尔腾（1965）将将纳什什均均衡衡概概念念引引入入了了动态分分析析，提提出出了了“精精炼纳什均衡什均衡”概念。概念。海海萨尼尼发展展了了刻刻画画不不完完全全信信息息静静态博博弈弈的的“贝叶叶斯斯纳什什均衡均衡”（19671968）。）。泽尔腾和和海海萨尼尼进一一步步将将纳什什均均衡衡动态化化，加加入入了了接接近近实际的的不不完完全全信信息息条条件件。他他们的的工工作作为后后人人继续发展展博博弈弈论，提供了基本思路和模型

9、，提供了基本思路和模型。10第一章第一章完全信息静完全信息静态博弈博弈1.1 基本理论基本理论:博弈的标准式和纳什均衡博弈的标准式和纳什均衡1.2 应用举例应用举例1.3 混合策略和均衡的存在混合策略和均衡的存在111.1 基本理论基本理论:博弈的标准式和纳什均衡博弈的标准式和纳什均衡例例1 儿童游戏：儿童游戏：“石头、剪刀、布石头、剪刀、布”。参与人参与人：1，2。策略空间策略空间：S1=S2=石头、剪刀、布石头、剪刀、布收益收益：两人出手的函数：两人出手的函数u1(石石头头，石石头头)=0，u1(石石头头，剪剪刀刀)=1，u1(石石头，布头，布)=-1u2(石石头头，石石头头)=0，u2

10、(石石头头，剪剪刀刀)=-1，u2(石石头，布头，布)=112博弈的标准式表示博弈的标准式表示(normal-form representation)(1)参与人参与人(player).n 个参与人：个参与人：1,2,i,n(2)策略策略(strategy).一个参与人的策略是他采取的一个行动。一个参与人的策略是他采取的一个行动。参与人参与人 i 的策略：的策略：si 参与人参与人 i 的策略空间的策略空间:Si 策略的一个组合策略的一个组合:s=s1，s2,sn 简化表示：简化表示：s-i=s1，,s i-1，s i+1,sn(3)收益收益(payoff).参与人参与人 i 的收益：的收益：

11、ui=ui(s1，s2,sn)n 个参与人博弈的标准形式表示个参与人博弈的标准形式表示:G=S1,S2,Sn；u1,u2,un13博弈标准式特例：博弈标准式特例：u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)u1(s13,s21),u2(s13,s21)u1(s13,s22),u2(s13,s22)s11 s12 s13参与人参与人1参与人参与人2s21 s22S1=s11,s12,s13 S2=s21,s22收益表收益表(Payoff)：两个参与人，有限个

12、战略的博弈两个参与人，有限个战略的博弈的表示方法的表示方法 140，01，-1-1，1-1，10，01，-11，-1-1，10，0石头石头剪刀剪刀布布石头石头剪刀剪刀布布P1P215囚囚徒徒1的的考考虑虑：无无论论对对方方选选沉沉默默还还是是招招认认，自自己己选选“招招认认”好于好于“沉默沉默”。囚徒囚徒2的考虑：的考虑：无论对方选什么，无论对方选什么，“招认招认”好于好于“沉默沉默”。两人的选择两人的选择:(招认招认,招认招认)。-1，-1-9，00，-9-6，-6 囚徒囚徒 2沉默沉默招认招认沉默沉默招认招认例例囚徒困境囚徒困境(The Prisoners Dilemma)囚徒

13、囚徒1占优占优1617每一个博弈都是一个你中有我，我中有你的情形，每一个博弈都是一个你中有我，我中有你的情形，不同的博弈参与者可以选择不同的行动，但由于不同的博弈参与者可以选择不同的行动，但由于相互作用，一个博弈参与者的得益不仅取决于自相互作用，一个博弈参与者的得益不仅取决于自己采取的行动，也取决于其他博弈参与者所采取己采取的行动，也取决于其他博弈参与者所采取的行动。的行动。博弈论的精髓在于基于系统思维基础上的理性换博弈论的精髓在于基于系统思维基础上的理性换位思考，位思考，即在选择你的行动时，你应当用他人的即在选择你的行动时，你应当用他人的得益去推测他人的行动，从而选择最有利于自己得益去推测他

14、人的行动，从而选择最有利于自己的行动。的行动。17鹰鸽博弈（斗博弈（斗鸡博弈）博弈）参与人：参与人：鹰和和鸽策略：保持原方向和策略：保持原方向和转向向偏好：如果他偏好：如果他们都保持原方向，就会撞都保持原方向，就会撞车。如。如果都果都转向，就都保住了面子。如果只有向，就都保住了面子。如果只有对方方转向，就会被称向，就会被称为硬硬汉。保持保持转向向保持保持 0，0 3，1转向向 1，32，2鸽鸽鹰鹰18公共公共财产的悲的悲剧12少吃少吃多吃多吃少吃少吃 2，20，3多吃多吃 3，01，119智猪博弈智猪博弈12按下按下不按不按按下按下 4，2 2，3不按不按 6，-10，0小猪小猪大

15、大猪猪20定定义义：si 是是 si 的的严严格格劣劣势势战战略略（strictly dominated），如果），如果:ui(si，s-i)ui(si，s-i)“沉默沉默”是是“招认招认”的严格劣战略的严格劣战略-1，-1-9，00，-9-6，-6 囚徒囚徒 2沉默沉默招认招认沉默沉默招认招认囚徒囚徒1理性的参与人不会理性的参与人不会选择严格劣策略选择严格劣策略21公共公共财产的悲的悲剧12少吃少吃多吃多吃少吃少吃 2，20，3多吃多吃 3，01，122重复剔除严格劣策略重复剔除严格劣策略1，01，20，10，30，12，0上下参与人2左中右参与人11，01，20，30

16、，1上下参与人2左中参与人1博弈结果（上，中）博弈结果（上，中）23两人都没有严格劣策略两人都没有严格劣策略保持保持转向向保持保持 0，0 3，1转向向 1，32，2鸽鸽鹰鹰12按下按下不按不按按下按下 4，2 2，3不按不按 6，-10，0小猪小猪大大猪猪24定定义义：s*=(s1*，sn*)是是一一个个纳纳什什均均衡衡(Nash equilibrium),如果对如果对 i，ui(si*，s i*)ui(si，s i*)纳什均衡为如下最大化问题的解纳什均衡为如下最大化问题的解 ui=ui(s1*,si,sn*)给定你的策略，我的策略是最好的策略定你的策略，我的策略是最好

17、的策略给定我的策略，你的策略也是最好的策略定我的策略，你的策略也是最好的策略因此没有一个参与人会因此没有一个参与人会轻率地偏离率地偏离这个策略个策略组合而使合而使自己蒙受自己蒙受损失失25纳什均衡特例：纳什均衡特例：u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)u1(s13,s21),u2(s13,s21)u1(s13,s22),u2(s13,s22)s11 s12 s13参与人参与人1 1参与人参与人2 2s21 s22(s11*,s21*)是纳什均衡，如

18、果是纳什均衡，如果 u1(s11*,s21*)u1(s12,s21*)u1(s11*,s21*)u1(s13,s21*)u2(s11*,s21*)u2(s11*,s22).26寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法-1，-1-9，00，-9-6，-6 囚徒囚徒 2 沉默沉默招认招认沉默沉默招认招认囚徒囚徒1-6，-6没有哪个博弈方有偏离这个预测结果的愿望没有哪个博弈方有偏离这个预测结果的愿望第一类决策矛盾：强第一类决策矛盾：强烈的个人动机将导致烈的个人动机将导致集体的损失集体的损失27对于策略组合对于策略组合S和和S，如果所有的参与人相对于，如果所有的参与人相对于S都

19、更偏好于都更偏好于采取采取S，而且至少对一个参与人来说是严格偏好的，我们就说，而且至少对一个参与人来说是严格偏好的，我们就说S比比S更有效率更有效率。用数学来表示，如果。用数学来表示，如果ui(S)ui(S)对每个参对每个参与人与人i都成立，并且不等式至少对一个参与人是严格成立的，都成立，并且不等式至少对一个参与人是严格成立的，那么那么S比比S更有效率更有效率。-1，-1-9，00，-9-6，-6 囚徒囚徒 2 沉默沉默招认招认沉默沉默招认招认囚徒囚徒1（沉默，沉默）比（招认，招认）更有效率（沉默，沉默）比（招认，招认）更有效率28如果不存在其他更有效率的策略组合，我们就称这个策略组如果不

20、存在其他更有效率的策略组合，我们就称这个策略组合合S是有效的是有效的。用数学来表示，不存在其他策略组合。用数学来表示，不存在其他策略组合S对每个对每个参与人参与人i来说都满足来说都满足ui(S)ui(S)，同时对某个参与人，同时对某个参与人j来说满来说满足足ui(S)ui(S)。-1，-1-9，00，-9-6，-6 囚徒囚徒 2 沉默沉默招认招认沉默沉默招认招认囚徒囚徒1（沉默，沉默）（沉默，沉默）,（招认，沉默），（招认，沉默），（沉默，招认）都是有（沉默，招认）都是有效的策略组合效的策略组合29寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法1，01，20，10，30，12

21、，0上上下下参与人参与人2左左中中右右参与人参与人11，230寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法0，44，05，34，00，45，33，53，56，6上上中中下下参与人参与人2左左中中右右参与人参与人16，631寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法2，10，00，01，2 帕特帕特歌剧歌剧拳拳击击歌剧歌剧拳击拳击克里斯克里斯性别战性别战(the battle of the Sexes)1，22，1第二类决策矛盾：达成第二类决策矛盾：达成均衡的方式不止一种，均衡的方式不止一种，策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍

22、有效结果的获得沟通沟通32寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法鹰鸽博弈鹰鸽博弈保持保持转向向保持保持 0，0 3，1转向向 1，32，2鸽鸽鹰鹰制度、规则、制度、规则、行为及文化行为及文化第二类决策矛盾：达成第二类决策矛盾：达成均衡的方式不止一种，均衡的方式不止一种，策略不确定性有时会阻策略不确定性有时会阻碍有效结果的获得碍有效结果的获得33现实生活中无效率均衡的例子现实生活中无效率均衡的例子-QWERTY的键位设计的键位设计第三类决策矛盾：习惯已经根深蒂固了第三类决策矛盾：习惯已经根深蒂固了标准的键位设计（第三行以标准的键位设计（第三行以QWERTY开始）是由打字

23、机的发明开始）是由打字机的发明者为了防止按键卡死而修正的。对于机械打字机来说，当两个者为了防止按键卡死而修正的。对于机械打字机来说，当两个位置接近的按键同时按下的时候，会导致用来敲打色带的铅字位置接近的按键同时按下的时候，会导致用来敲打色带的铅字杠杆之间发生纠结，因此发明者设计键位的原则是将那些经常杠杆之间发生纠结，因此发明者设计键位的原则是将那些经常连在一起使用的字母分开排列。但按键卡死在现代来说并不是连在一起使用的字母分开排列。但按键卡死在现代来说并不是一个问题。一个问题。20实际实际30年代，年代，August Dvorak和和William Dealey通过对英语中通过对英语中单词运用

24、的仔细研究，设计了一种新的键盘单词运用的仔细研究，设计了一种新的键盘-Dvorak键盘，人们键盘，人们确信这种键盘比使用确信这种键盘比使用QWERTY键盘打字效率显著提高。键盘打字效率显著提高。为什么为什么QWERTY键盘现在仍然是标准？键盘现在仍然是标准？34寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法公共财产的悲剧公共财产的悲剧12少吃少吃多吃多吃少吃少吃 2，20，3多吃多吃 3，01，135寻找纳什均衡的方法之一：划线法寻找纳什均衡的方法之一：划线法智猪博弈智猪博弈按下按下不按不按按下按下 4，2 2，3不按不按 6，-10，0小猪小猪大大猪猪为什么中小企业不会

25、花钱去开发新产品？为什么中小企业不会花钱去开发新产品？36协调博弈协调博弈12A B A1，10，0B 0，01，1帕累托协调博弈帕累托协调博弈12A B A2，20，0B 0，01，1帕累托上策均衡帕累托上策均衡375 5，5 53 3，0 00 0，3 33 3，3 3鹿鹿兔子兔子猎人人2 2鹿鹿兔子兔子猎猎人人1 1猎鹿博弈鹿博弈风险上策均衡（兔子，兔子）上策均衡（兔子，兔子）设猎人设猎人2选抓兔子的概率为选抓兔子的概率为p，则猎人，则猎人1选抓鹿的期望得益选抓鹿的期望得益:5(1-p)选抓兔子的期望得益选抓兔子的期望得益:3(1-p)+3p由由 5(1-p)2/5考虑其他博弈方可能发生

26、考虑其他博弈方可能发生错误等时，帕累托上策均错误等时，帕累托上策均衡并不一定是最优选择，衡并不一定是最优选择，需要考虑：风险上策均衡。需要考虑：风险上策均衡。38三个主要的广播电视台：三个主要的广播电视台：A、B、C。所有这三个电视台都。所有这三个电视台都可以选择讲晚间新闻现场直播时间定在晚上可以选择讲晚间新闻现场直播时间定在晚上6点或是推迟到点或是推迟到7点，每个电视台的目标都是使他的收视率最大化。点，每个电视台的目标都是使他的收视率最大化。AB6点7点6点14,24,328,30,277点30,16,2413,12,50AB6点7点6点16,24,3030,16,247点30,23,141

27、4,24,326点7点C39缔约（缔约（contract）缔约不仅仅用于防止策略的不确定，还可以缓解缔约不仅仅用于防止策略的不确定，还可以缓解共同利益和个体利益之间的冲突。共同利益和个体利益之间的冲突。即缔约为各参即缔约为各参与者提供了一种防止无效率协调的方法与者提供了一种防止无效率协调的方法。12I N I 8，8-4，4N 10，-2 0，012I N I 8，8-4，4N 7，1 0，040让我们集中考虑让我们集中考虑z1+z2x1+y2，z1+z2x2+y1，且，且z1+z20的情况。这意味着各参与人的收益总和在采的情况。这意味着各参与人的收益总和在采取取(I,I)时达到最大化。时达到

28、最大化。(I,I)组合是这个基本博弈唯一组合是这个基本博弈唯一的一个有效率的结果。的一个有效率的结果。问题：假设问题：假设(I,I)是最好的结果，各参与人是否可以是最好的结果，各参与人是否可以缔约，执行规定的缔约，执行规定的(I,I)组合？组合？12I N I z1，z2 y1，x2 N x1，y2 0，0基本博弈基本博弈41只要只要(I,I)是一个纳什均衡，采取是一个纳什均衡，采取(I,I)的协定就是自我实施的协定就是自我实施合同。而这只有当合同。而这只有当z1x1和和z2x2的情况下才成立。的情况下才成立。但是，如果其中有一个不成立，那么各个参与人就无法但是，如果其中有一个不成立，那么各个

29、参与人就无法依靠合同的自我实施去维持依靠合同的自我实施去维持(I,I)的结果，他们需要第三方的结果，他们需要第三方的加入，法庭就是作为这样一种第三方存在的。的加入，法庭就是作为这样一种第三方存在的。如果一方选择了如果一方选择了N，法庭的涉入可以在他们之间，强制进，法庭的涉入可以在他们之间，强制进行货币收益的行货币收益的转移支付转移支付。12I N I z1，z2 y1，x2 N x1，y2 0，042假设参与人知道转移的情况，那么法庭的干预就改变了假设参与人知道转移的情况，那么法庭的干预就改变了参与人之间的博弈。这个新的博弈把转移的数字加到基参与人之间的博弈。这个新的博弈把转移的数字加到基本博

30、弈中，显示各参与人的实际收益。本博弈中，显示各参与人的实际收益。这个博弈称为这个博弈称为引发博弈引发博弈(induced game)。12I N Iz1，z2 y1+,x2-N x1+,y2-，-12I N I z1，z2 y1，x2 N x1，y2 0，043设计适当的合同，可以很容易引发有效率的设计适当的合同，可以很容易引发有效率的(I,I)结果结果。只要符合只要符合z1x1+和和z2 x2-的的和和都满足这个条件。都满足这个条件。-具具体体和和的值自由决定。的值自由决定。12I N I z1，z2 y1+,x2-N x1+,y2-，-12I N I z1，z2 y1，x2 N x1，y2

31、 0，012I N I 8，8-4，4N 10，-2 0，012I N I 8，8-4，4N 7，1 0，0=-3=044但是，上例的最基本的条件是，法庭必须能够区分基本但是，上例的最基本的条件是，法庭必须能够区分基本博弈中所有不同的结果。例如，法庭必须能够核实每个博弈中所有不同的结果。例如，法庭必须能够核实每个参与人在博弈中，是选择了参与人在博弈中，是选择了I还是选择了还是选择了N。我们称这个。我们称这个信息条件为信息条件为完全可证实性（完全可证实性（full verifiability）。结论：在完全可证实的条件下，存在一个合同，随着它结论：在完全可证实的条件下，存在一个合同，随着它的执行

32、可以获得有效率的结果。的执行可以获得有效率的结果。不幸的是，完全可证实往往是特例，而不是通例。通常不幸的是，完全可证实往往是特例，而不是通例。通常证据都不足以解释基本博弈的结果。法庭也许只能确定证据都不足以解释基本博弈的结果。法庭也许只能确定最终结果的好坏。好的结果意味着双方都进行了投入，最终结果的好坏。好的结果意味着双方都进行了投入，坏的结果表示至少有一人没有投入。坏的结果表示至少有一人没有投入。有限可证实性（有限可证实性（limited verifiability）：法庭无法完美地：法庭无法完美地对参与人的生产行为进行证实的情况。对参与人的生产行为进行证实的情况。45在有限可证实的情况下，

33、对博弈矩阵中的每一个单元格，在有限可证实的情况下，对博弈矩阵中的每一个单元格，规定不同的外部实施收益转移，是不可能的。即法庭无法规定不同的外部实施收益转移，是不可能的。即法庭无法区分区分(I,N),(N,I)和和(N,N)。合同必须对所有这些结果规定相。合同必须对所有这些结果规定相同的收益转移。从博弈论的角度看，这个合同中的外部实同的收益转移。从博弈论的角度看，这个合同中的外部实施部分施部分只包含一个只包含一个。(见下图见下图)12I N I z1，z2 y1+,x2-N x1+,y2-，-46在有限可证实的情况下，要维持在有限可证实的情况下，要维持(I,I)的结果很难，甚至是的结果很难，甚

34、至是不可能的。例如虽然提高不可能的。例如虽然提高可以降低参与人可以降低参与人2选择选择N的动机，的动机，但是又提高了参与人但是又提高了参与人1选择选择N的动机。因此的动机。因此的选择必须平的选择必须平衡双方的动机。需要满足：衡双方的动机。需要满足：z1x1+和和 z2x2-整理简化以后可得：整理简化以后可得：x2-z2x1+x2时，存在一个时，存在一个同时满足这两同时满足这两个不等式。个不等式。12I N I z1，z2 y1+,x2-N x1+,y2-，-47下图所示的基本博弈为例设下图所示的基本博弈为例设=-3，得出的右下的引，得出的右下的引发博弈，其中发博弈，其中(I,I)是纳什均衡。是

35、纳什均衡。1212I I N N I I 8 8，8 8-4-4，4 4N N 1010，-2 2 0 0，0 012I N I 8，8-7，7N 7，1-3，3下下图所示的基本博弈在有限可所示的基本博弈在有限可证实的情况下，的情况下，(I,I)不可不可能被能被执行。行。12I N I 10，10-4，12N 12，-4 0，048(2)法庭法庭实施施违约赔偿情况下的情况下的缔约。法庭并不法庭并不总是根据参与人起草的合同是根据参与人起草的合同进行行执行。事行。事实上，美国法庭更可能根据某些法律上，美国法庭更可能根据某些法律原原则，而不是根据合同的，而不是根据合同的规定定实施施转移。移。在此，我

36、在此，我们将将对美国的商美国的商业环境下，境下，对于于赔偿的三个法律原的三个法律原则进行概括。行概括。49在在预期利益赔偿的法律原则预期利益赔偿的法律原则下，法庭要求被告转移给原告，下，法庭要求被告转移给原告，使得使得原告获得在合同实现的情况下的收益。原告获得在合同实现的情况下的收益。根据基本博弈，参与人根据基本博弈，参与人1的期望收益是的期望收益是z1，参与人，参与人2的期望收益是的期望收益是z2。因。因此，如果参与人此，如果参与人1违约，他被强制付给参与人违约，他被强制付给参与人2的钱数，必须使得参与的钱数，必须使得参与人获得人获得z2的收益。这意味着的收益。这意味着=y2-z2。类似地，

37、如果参与人。类似地，如果参与人2违约，他付违约，他付给参与人给参与人1的转移是的转移是=z1-y1。在引发博弈中，如果当且仅当在引发博弈中，如果当且仅当z1x1+y2z2和和z2x2+y1z1时，时，(I,I)是纳什是纳什均衡。不等式可以整理得：均衡。不等式可以整理得：z1+z2x1+y2 和和 z1+z2x2+y1它们正好是当它们正好是当(I,I)有效率时所满足的条件。有效率时所满足的条件。结论：在预期利益赔偿原则下，当且仅当结论：在预期利益赔偿原则下，当且仅当(I,I)是有效率的时候，是有效率的时候，(I,I)是是可执行的。可执行的。12I N I z1，z2 z1,x2+y1-z1N x

38、1+y2 z2，z2 0，012I N I z1，z2 y1+,x2-N x1+,y2-，-50第二种违约补偿非常适用于第二种违约补偿非常适用于zi无法观察的情况。无法观察的情况。在在信赖利益损害赔偿原则信赖利益损害赔偿原则下，法庭实施的转移，使得原告下，法庭实施的转移，使得原告能够获得他在没有签署合同情况下的收益。能够获得他在没有签署合同情况下的收益。根据左下图，信赖利益损害赔偿意味着根据左下图，信赖利益损害赔偿意味着=y2和和=-y1。引。引发博弈如右下图所示。发博弈如右下图所示。注意，当且仅当注意，当且仅当z1x1+y2 和和z2x2+y1时，时，(I，I)是引发博弈是引发博弈的纳什均衡

39、。的纳什均衡。12I N I z1，z2 0,x2+y1N x1+y2，0 0，012I N I z1，z2 y1+,x2-N x1+,y2-，-51违约情况下普遍采用的第三种法律原则指的是违约情况下普遍采用的第三种法律原则指的是回复原状赔回复原状赔偿偿，这种原则是通过取消被告因违约而牟取的，相对于无，这种原则是通过取消被告因违约而牟取的，相对于无合同情况下所增加的不当得利而得名。合同情况下所增加的不当得利而得名。回复原状赔偿意味着回复原状赔偿意味着=-x1，=x2。所得到的引发博弈形式。所得到的引发博弈形式如右下图所示。如右下图所示。注意，当且仅当注意，当且仅当z10，z20时，时，(I,I

40、)是引发博弈的纳什均是引发博弈的纳什均衡。衡。12I N I z1，z2 x2+y1，0N 0，x1+y2 0，012I N I z1，z2 y1+,x2-N x1+,y2-，-521212I I N N I I 4 4，4 4-4-4，9 9N N 2 2，-4-4 0 0，0 0在在预期利益期利益赔偿的法律原的法律原则下，下，(I,I)能能够被被执行。行。12INI4，44，1N-6，40，0基本博弈基本博弈引引发博弈博弈531212I I N N I I 4 4，4 4-4-4，9 9N N 2 2，-4-4 0 0，0 0在恢复原状在恢复原状赔偿的法律原的法律原则下，下，(I,I)能能

41、够被被执行。行。12INI4，45，0N0，-20，0基本博弈基本博弈引引发博弈博弈541212I I N N I I 4 4，4 4-4-4，9 9N N 2 2，-4-4 0 0，0 0在信在信赖利益利益损害害赔偿原原则的法律原的法律原则下，下，(I,I)不能不能够被被执行。行。12INI4，40，5N-2，00，0基本博弈基本博弈引引发博弈博弈55两方严格竞争博弈（两方严格竞争博弈（two-player,strictly competitive game）是指具有如下性质的两方博是指具有如下性质的两方博弈，对于任意两个策略组合弈，对于任意两个策略组合s,s S，当且仅当，当且仅当u2(s

42、)u1(s)。零和博弈零和博弈是其中的一种是其中的一种3，20，46，11，3A B参与人参与人1参与人参与人2 A B-1，1 11 1，-11 1，-1-1，1 1正正面面反反面面猜硬猜硬币方方盖盖硬硬币币方方正正面面反反面面56对于策略对于策略来说，如果来说，如果是是的解，那么的解，那么它就是一个它就是一个安全策略安全策略，其中，其中参与人参与人i采取策略采取策略si最差的得益，参与人最差的得益，参与人i的安全得益水平为的安全得益水平为结论结论：如果一个两方博弈是严格竞争的，并且有一个纳什：如果一个两方博弈是严格竞争的，并且有一个纳什均衡均衡s*=(s1*,s2*)S，那么，那么

43、s1*是参与人是参与人1的一个安全策略，的一个安全策略，s2*是参与人是参与人2的一个安全策略。的一个安全策略。3，20，46，11，3A B参与人参与人1参与人参与人2 A B57纳什均衡与重复剔除严格劣策略的关系纳什均衡与重复剔除严格劣策略的关系命命题2.1：没有被剔除的唯一的策略：没有被剔除的唯一的策略组合是合是纳什均什均衡衡.命命题2.2：如果策略是一个如果策略是一个纳什均衡，它什均衡，它们在重复在重复剔除剔除严格劣策略后留下格劣策略后留下.上述两个命上述两个命题保保证在在进行行纳什均衡分析之前先什均衡分析之前先通通过剔除剔除严格劣策略格劣策略简化博弈是可行的。化博弈是可行的。581.

44、1 节习题与练习节习题与练习1.2 2，01，14，23，41，22，31，30，23，0TMBL C R591.3设此博弈的纯策略纳什均衡是对于参与人1来说同理，对于参与人2因此，此博弈的纯策略纳什均衡是且满足60例例1 定位博弈定位博弈例例2 合伙人博弈合伙人博弈-策略互补策略互补例例3 犯罪与治安模型犯罪与治安模型例例4 古诺双头垄断模型（古诺双头垄断模型（Cournot Model of Duopoly）例例5 贝贝特特兰兰德德双双头头垄垄断断模模型型（Bertrand Model of Duopoly）例例6 最后要价仲裁最后要价仲裁(Final-offer Arbitration)

45、例例7 公共财产问题公共财产问题1.2 应用举例应用举例61例例1 定位博弈定位博弈帕帕特特和和克克里里斯斯为一一家家很很大大的的软饮料料公公司司工工作作，他他们的的工工作作是是在在人人们喜喜欢的的一一个个海海滩上上销售售这家家公公司司的的灌灌装装苏打打饮料料，他他们在在同同一一个个海海滩上上工工作作，而而且且公公司司规定定，必必须卖一一样的的价价格格，并并且且承承诺每每卖一一听听饮料料给他他们25美美分分的的佣佣金金。帕帕特特和和克克里里斯斯需需要要作作出出的的决定是：决定是：每天早晨要把售每天早晨要把售货棚棚设在哪里？在哪里？13245678962每个区域中都会有每个区域中都会有50个人个

46、人想要买苏打水。想要买苏打水。如果一个售货员可以为其中区域中的所有顾客服务，如果一个售货员可以为其中区域中的所有顾客服务，他将赚的他将赚的12.5美元。美元。顾客们都会到最近的售货摊去买顾客们都会到最近的售货摊去买。132456789利润利润=43.75利润利润=68.756312345156.25,56.2512.5,10018.75,93.7525,87.531.25,81.252100,12.556.25,56.2525,87.531.25,81.2537.5,75393.75,18.7587.5,2556.25,56.2537.5,7543.75,68.75487.5,2581.25,

47、31.2575,37.556.25,56.2550,62.5581.25,31.2575,37.568.75,43.7562.5,5056.25,56.25675,37.568.75,43.7562.5,5056.25,56.2550,62.5768.75,43.7562.5,5056.25,56.2550,62.543.75,68.75862.5,5056.25,56.2550,62.543.75,68.7537.5,75956.25,56.2550,62.543.75,68.7537.5,7531.25,81.25132456789646789137.5,7543.75,68.7550,6

48、2.556.25,56.25243.75,68.7550,62.556.25,56.2562.5,50350,62.556.25,56.2562.5,5068.75,43.75456.25,56.2562.5,5068.75,43.7575,37.5562.5,5068.75,43.7575,37.581.25,31.25656.25,56.2575,37.581.25,31.2587.5,25737.5,7556.25,56.2587.5,2593.75,18.75831.25,81.2525,87.556.25,56.25100,12.5925,87.518.75,93.7512.5,10

49、056.25,56.25132456789652345678256.25,56.2525,87.531.25,81.2537.5,7543.75,68.7550,62.556.25,56.25387.5,2556.25,56.2537.5,7543.75,68.7550,62.556.25,56.2562.5,50481.25,31.2575,37.556.25,56.2550,62.556.25,56.2562.5,5068.75,43.75575,37.568.75,43.7562.5,5056.25,56.2562.5,5068.75,43.7575,37.5668.75,43.7562

50、.5,5056.25,56.2550,62.556.25,56.2575,37.581.25,31.25762.5,5056.25,56.2550,62.543.75,68.7537.5,7556.25,56.2587.5,25856.25,56.2550,62.543.75,68.7537.5,7531.25,81.2525,87.556.25,56.256634567356.25,56.2537.5,7543.75,68.7550,62.556.25,56.25475,37.556.25,56.2550,62.556.25,56.2562.5,50568.75,43.7562.5,5056

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 博弈论经典课件

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：博弈论经典课件.ppt
链接地址：https://www.taowenge.com/p-69440363.html