书签分享收藏举报版权申诉 / 308

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 博弈论最全完整ppt课件-讲解.ppt

博弈论最全完整ppt课件-讲解.ppt

上传人：飞****2

文档编号：29577366

上传时间：2022-08-01

格式：PPT

页数：308

大小：1.74MB

( 4.5 )

《博弈论最全完整ppt课件-讲解.ppt》由会员分享，可在线阅读，更多相关《博弈论最全完整ppt课件-讲解.ppt（308页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、博弈论与信息经济学博弈论与信息经济学Game Theory and Economics of Information博弈论基本思想博弈论基本思想人们在日常生活中进行着博弈，与配偶，朋友，陌生人，老板/ /员工，教授等。类似的博弈也在商业活动、政治和外交事务、战争中进行着在任何一种情况下，人们相互影响以达成彼此有利的协议或者解决争端。博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。如何在“博弈”中获胜？日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/ /橄榄球How can you win such games

2、?许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。它是对于如何最好地利用身体（物质）的技巧的一种算计。什么是策略博弈？What is a Game of Strategy? 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、对同一情形也在进行类似的思考。博弈论就是用来分析这样交互式的决策的。理性的行为指的是：明白自己的目的和偏好，同时了解自己行动的限制和约束，然后以精心策划的方式选择自己的行为，按照自己的标准做到最好。博弈论对理性的行为又从新的角度赋予其新的含义与其他同样具有理性的决策者进行相互作用。博弈论是关于相互作用情况下的理性行为的科学。如何在博弈中

3、获胜？真的能在博弈中（总是）获胜吗？对手和你一样聪明！许多博弈相当复杂，博弈论并不能提供万无一失的应对办法。例1：无谓竞争（The GPA Rat Race）你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有4040的人能够得优秀，4040的人能得良好。所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施! !稍加努力即可胜过他人，诱惑大矣。问题是，大家都这么做。这样一来，所有人的成绩都不比大家遵守协议来得高。而且，大家还付出了更多的功夫。正因为这样的博弈对所有参与者存在着或大或小的潜在成本，如何达成和维护互利的合作就成为一个值得探究的重要问题。存在双赢的博弈吗？例2

4、 2：焦点博弈 “We Cant Take the Exam,Because We Had a Flat Tire”两个学生想要推迟考试，谎称由于返校途中轮胎漏气，未能很好地备考。教授分别对他们提出了问题：“哪个轮胎漏气? ?”如何应答？他们本应该预计到教授的招数，提前准备好答案。在博弈中，参与者应该向前看到未来的行动，然后通过向后推理，推算出目前的最佳行动。如果双方都没有准备，他能够独立地编出一个相互一致的谎言吗？例2 2：焦点博弈 “We Cant Take the Exam,Because We Had a Flat Tire”“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你

5、的朋友是否使用同样的逻辑，或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然；反之，是否她认为这一选择对你同样显然。以此类推。也就是说，需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。例2 2：焦点博弈 “We Cant Take the Exam,Because We Had a Flat Tire”我们无法从所有这样的博弈的结构中找到一般和本质的东西，来保证这样的收敛。某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。没有某个这样的暗示，默契的合作就完全不可能。

6、例3：为什么教授如此苛刻？许多教授强硬地规定，不进行补考，不允许迟交作业或论文。教授们为何如此苛刻？如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法，就是“没有例外”的策略。例3：为什么教授如此苛刻？问题是，一个好心肠的教授如何维持如此铁石心肠的承诺？他必须找到某种使拒绝变得强硬和可信的方法。拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声誉导论博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者博弈论的基本概念与类型主要参考文献导论一、博弈均衡与一般均衡案例：囚犯困境案例：囚犯

7、困境抵赖坦白抵赖-1，-1-9，0坦白0，-9-6，-6支付嫌疑人B嫌疑人A与传统微观经济学的比较与传统微观经济学的比较一致性利益最大化原则均衡原则不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性信息不完全-委托-代理理论、信号传递与信息筛选模型导论二、博弈论与诺贝尔经济学奖获得者1994年诺贝尔经济学奖获得者美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由：在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和

8、经济学产生了重大影响。约翰约翰纳什纳什1928年生于美国年生于美国约翰约翰海萨尼海萨尼19201920年年生于美生于美国国莱因哈莱因哈德德泽尔泽尔腾，腾，19301930年年生于德生于德国国1996年诺贝尔经济学奖获得者英国人詹姆斯莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey) 获奖理由：前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。詹姆斯詹姆斯莫里斯莫里斯19361936年生于英国年生于英国威廉维克瑞，1914-1996，生于美国2001年

9、诺贝尔经济学奖获得者三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。约瑟夫斯蒂格利茨，1943年生于美国的印第安纳州，1967年获美国麻省理工学院博士头衔，曾担任世界银行的首席经济学家，现任美国哥伦比亚大学经济学教授乔治阿克尔洛夫1940年生于美国的纽黑文，1966年获美国麻省理工学院博士头衔，现为美国加利福尼亚州大学经济学教授。迈克尔斯彭斯1948年生于美国的新泽西，1972年获美国哈佛大学博士

10、头衔，现兼任美国哈佛和斯坦福两所大学的教授。2005年诺贝尔经济学奖获得者以罗伯特奥曼色列经济学家罗伯特奥曼（Robert J. Aumann）和美国经济学家托马斯谢林（Thomas Thomas C. SchellingC. Schelling）获奖原因：“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。罗伯特奥曼托马斯谢林导论三、博弈论的基本类型合作博弈与非合作博弈合作博弈（cooperative game）达成有约束力的协议（binding agreement），强调团体理性，强调效率、公正、公平非合作博弈（non-cooperative game）强调个人理性

11、，其结果可能有效率，也可能无效率。纳什均衡（纳什均衡（NENE）子博弈完美纳什子博弈完美纳什均衡（均衡（SPNESPNE）贝氏纳什均衡贝氏纳什均衡（BNEBNE）完美贝氏纳什均衡完美贝氏纳什均衡（PBNEPBNE）及序贯均及序贯均衡（衡（SESE）完全信息不完全信息静态动态非合作博弈的基本分类非合作博弈的基本分类静态博弈与动态博弈(static games and dynamic games)同时决策或者同时行动的博弈属于静态博弈；先后或序贯决策或者行动的博弈，属于动态博弈即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈完全信息博弈与不完全信息博弈

12、(games of complete information and games of incomplete information)按照大家是否清楚对局情况下每个局中人的得益。“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识（common knowledge）。据“共同知识”的掌握分为完全信息与不完全信息博弈。完美信息博弈与不完美信息博弈(games with perfect information and games with imperfect information)是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。如果在博弈进行过

13、程中的每一时刻，面临决策或者行动的参与人，对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚，则称为完美信息博弈；否则位不完美信息。零和博弈与非零和博弈(zero-sum game and non-zero-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。零和博弈是利益对抗程度最高的博弈。常和博弈与非常和博弈（constant-sum game and variable-sum game）如果一个博弈在所有各种对局下全体参与人之得益

14、总和总是保持为一个常数，这个博弈就叫常和博弈；相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数，这个博弈就叫非常和博弈。常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。导论四、主要参考文献张维迎著，博弈论与信息经济学，上海三联书店、张维迎著，博弈论与信息经济学，上海三联书店、上海人民出版社，上海人民出版社，19961996年版。年版。Roger B. Myerson著：Game Theory（原文版、译文版），中国经济出版社，2001年版。王则柯、李杰编著，博弈论教程，中国人民大学出版社，2004年版。艾里克.拉斯缪森（Eric Rasmusen

15、）著，博弈与信息：博弈论概论，北京大学出版社，2003年版。因内思马可-斯达德勒,J.大卫佩雷斯-卡斯特里罗著，信息经济学引论：激励与合约,上海财经大学出版社，2004年版。施锡铨编著，博弈论上海财大出版社，2000年版。谢识予编著，经济博弈论，复旦大学出版社，谢识予编著，经济博弈论，复旦大学出版社，20022002年版。年版。谢识予主编，经济博弈论习题指南，复旦大学出谢识予主编，经济博弈论习题指南，复旦大学出版社，版社，20032003年版。年版。课程主要内容第一章完全信息静态博弈第二章完全信息动态博弈第三章不完全信息静态博弈第四章不完全信息动态博弈第五章委托-代理理论第六章逆向

16、选择与信号传递第一章完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论（game theory）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈的战略式表述：G=N,(Si)iN,(Ui)iN有三个基本要素：（1）参与人（players）iN=1,2,n ；（2）战略（strategies）,siSi(战略空间)；（3）支付（payoffs）,ui=ui(s-i,si)。案例案例1 1：囚犯困境：囚犯困境抵赖坦白抵赖-1，-1-9，0坦白

17、0，-9-6，-6支付嫌疑人B嫌疑人A均衡与均衡结果均衡战略（坦白，坦白）均衡支付（-6，-6）第二节纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡完全信息静态博弈的几点特性完全信息静态博弈的几点特性同时出招，出招一次；知道博弈结构与游戏规则（共同知识）；不管是否沟通过，无法做出有约束力的承诺（非合作）一、占优战略均衡占优战略：不管对手战略为何，该参与人可找到一最佳战略。定义：在博弈G=N,(Si)iN,(Ui)iN中，如果对所有的参与人i,si*是它的占优战略，那么所有参与人选择的战略组合（s1*,sn*）成为该对策的占优战略均衡。案例案例1 1：囚犯困境：囚犯困境抵赖坦白

18、抵赖-1，-1-9，0坦白0，-9-6，-6支付嫌疑人B嫌疑人A“囚犯困境” 的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革结论：一种制度安排，要发生效力。必须是一种纳什均衡；否则，制度安排便不能成立。价格大战低价高价低价3，36，1高价1，65，5支付百事可乐可口可乐案例2：智猪博弈猪圈里圈两头猪，一头大猪，一头小猪。猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有10个单位的猪食进槽，但谁按按钮谁就要付出2个单位的成本。若大猪先到，大猪吃到9个单位，小猪只能吃1个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个

19、单位。支付如表。案例案例2 2：智猪博弈：智猪博弈按等待按5，14，4等待9，-10，0支付小猪大猪智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供（富户与穷户）改革中不同利益分配对改革的推动二、重复剔除的占优战略均衡绝对劣势战略：si是一绝对劣势战略当且仅当存在另一战略siSi使得ui(si,s-i) ui(si,s-i) 对所有s-iS-i均成立。（ si 未必是优势战略）重复剔除的占优战略均衡：逐次删去绝对劣势战略得到唯一的占优战略。例：重复剔除的占优战略均衡例：重复剔除的占优战略均衡2，30，2

20、3，41，12，74，5 参与人2 L M R参与人1UD例重复剔除的占优战略均衡4，35，16，22，18，43，63，09，62，8 参与人2L M R参与人1UDM例重复剔除的占优战略均衡1，01，33，00，20，13，00，22，45，3 参与人2L M R参与人1UDM三、纳什均衡纳什均衡定义：指一战略组合有以下特性：当参与人持此战略后，任一参与人均无诱因偏离这一均衡；s*=(s1*,sn*)=(si*,s-i*)是一纳什均衡，当且仅当对所有参与人而言，ui (si*,s-i*) ui (si,s-i*)对所有siSi 均成立。简单而言，当s1*是对s2*的最适反应，s2*也是

21、s1*的最适反应时，（s1*,s2*）就是二人博弈的纳什均衡。命题1：纳什均衡在占优战略重复剔除解法中不会被剔除命题2：重复剔除的严格占优战略均衡一定是纳什均衡。例纳什均衡求解0，44，05，34，00，45，33，53，56，6 参与人2L M R参与人1UDM作业7，76，67，65，75，88，56，65，84，8 乙左中右上中下甲一个两人同时博弈的支付竞争如下所示，试求纳什均衡。是否存在重复剔除占优战略均衡？第三节纳什均衡应用举例古诺（Cournot）寡头模型沙滩卖冰豪泰林（Hotelling）价格竞争模型公共地的悲剧一、古诺寡头模型特点：存在两家厂商；同时行动确定产量。通过

22、预测另一家厂商的产量来选择自己的利润最大化产量，寻求预测均衡。厂商1表示为：max p(y1+y2e)y1-c(y1)，得出y1=f1(y2e)，同理得出y2=f2(y1e)，称为反应函数，两条曲线的交点为古诺模型的解。古诺寡头模型的纳什均衡反应函数 y1=f1(y2) y2=f2(y1)（y1*,y2*）是该对策的纳什均衡解。y1* y12y11 y10y2*y22y21y1oy2f1(y2)f2(y1)例题：古诺模型的解假设p=a-(y1+y2)，C1=y1c，C2=y2c则根据利润最大化的一阶条件分别得到反应函数y1=f1(y2)=(a-y2-c)/2，y2=f2(y1)=(a-y1-c

23、)/2，求出均衡产量为（1/3(a-c)，1/3(a-c)），为纳什均衡，均衡利润为（1/9(a-c)2，1/9(a-c)2）古诺模型的解：与垄断市场的比较古诺模型的解：与垄断市场的比较假设为一垄断企业，则有： Max =y(a-y-c), 得到垄断企业的最优产量 y=1/2(a-c) y1+y2=2/3(a-c) 垄断利润为=1/4(a-c)2 2/9(a-c)2寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时，只考虑对本企业利润的影响，而忽视对另一个企业的外部负效应。寡头厂商与垄断厂商的比较 1/3(a-c) 1/2(a-c)1/2(a-c)y1oy2f1(y2)f2(

24、y1)1/3(a-c)0 1二、沙滩卖冰假设游客沿沙滩0，1间均匀分布，现有两位卖冰者，他们会将摊位选在哪个位置？假设游客就近购买。生活中还有哪些类似的例子？三、豪泰林模型寡头企业竞争战略是价格伯川德（Bertrand）模型：产品同质，均衡价格等于边际成本，类似于完全竞争市场均衡。豪泰林（Hotelling）模型：存在产品差异，均衡价格不等于边际成本，垄断性提高假定长度为1的线性城市，消费者均匀分布在0，1区间内，分布密度为1；两个商店1、2分别位于x=0，x=1，即城市的两端；消费者购买商品的旅行成本与商店的距离成反比，单位距离的成本为t；住在x的消费者在两个商店之间是无差异的，需求D1=x

25、，D2=1-x，x满足：p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。豪泰林模型：以空间上差异为例豪泰林模型：以空间上差异为例根据两个商店的利润函数，1=(p1-c)x, 2=(p2-c)(1-x)选择使利润最大化的价格，得到一阶条件，求得p1*=p2*=c+t，均衡利润1=2=t/2旅行成本越高，产品差异越大，均衡价格从而均衡利润也越高。原因：随着旅行成本上升，不同商店出售的产品之间的替代性下降，每个商店对附近的消费者的垄断能力加强，当旅行成本为零时，不同商店的产品之间具有完全的替代性，则为伯川德均衡结果。四、公共地的悲剧生物学家和生态学家哈丁（Garrett Harde

26、n）在科学（1968年，第162卷）发表公地的悲剧。考虑一块对所有的人都开放的牧场，在着的制度下，可以预期，每一个放牧的人都会在公地上放牧尽可能多的牲口。增加一头牲口既有正效用，也有负效用。正效用是牲口的销售收入，增加一头为+1负效用使每增加一头带来的过度放牧的损失，每一个放牧着承担-1/n放牧者合理的决策是增加牲口，直至马瘦毛长，公地毁灭。四、公共地的悲剧资源没有排他性产权：草地放牧、公海捕鱼、小煤窑的过度开发；另一类是人们向其中排放废物的公地。草地放牧：n个农民，每个拥有羊的数量为gi，G=gi，v(G)代表每只羊的价值，与草地上放牧的总数G相关，饲养量增加到一定程度，随着数量继续增加，羊

27、的价值会下降，即v(G) w(S)-S w(E) w(S)+E-S参与约束：参与约束：22R(E)-w(E), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受：w(E)-E0接受：w(S)-S0参与约束委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托： R(E)-w(E) R(0)不委托： R(E)-w(E) R(0)不委托： R(S)-w(S) 0不委托： 0.1*20-w(S) +0.9*10-w(S)0不委托：0.9*20-w(E)+0.1*10-w(E)0.1

28、*w(20)-S+0.9*w(10-S)接受：0.9*w(20)-E+0.1*w(10)-E0委托：0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件参与约束对于委托人来说，就是要对于委托人来说，就是要根据上述两个条件，以及根据上述两个条件，以及 E E、S S的值，选择最佳的工的值，选择最佳的工资水平资水平w(20)w(20)和和w(10)w(10)，或或者它们的差额者它们的差额w(20)w(20)- -w(10)w(10)第四节重复博弈和无名氏定理有限次重复博弈：连锁店悖论无限次重复博弈和无名氏定理一、有限次重

29、复博弈一、有限次重复博弈有限次重复博弈令G为阶段性博弈，G(T)是G重复T次的重复博弈（Tl0；工人也可以受雇后不干活，这不需任何劳动成本，同时创造的利润也是0。假设公司与工人在工程结束之前没有任何工资合同，它只是在雇用期满后才决定付给每个工人的工资额w。作业2如果该建筑公司在未来的10年内每年有一项相同的工程，证明：无论公司的利润贴现因子是多少，唯一的子博弈完美均衡是：在每一项工程中，无论工人是否干活，公司向工人付的工资额w都是0；工人不干活。如果该建筑公司依次有无穷多个工程，而下一期工人又能看到以前的工资政策。证明：只要充分接近1，每一期工人都努力干获将是一个子博弈完美均衡战略。在所有子

30、博弈完美均衡中，对公司最有利的是什么样的均衡？第三章不完全信息静态博弈不完全信息博弈和贝叶斯纳什均衡贝叶斯均衡的应用举例贝叶斯博弈与混合战略均衡机制设计理论与显示原理第一节不完全信息博弈和贝叶斯均衡一、不完全信息博弈完全信息（complete information）每个局中人对其他局中人的特征（或类型）和支付函数有准确的了解；否则，为不完全信息（incomplete information ）。完美信息（perfect information）在博弈过程的任何时点每个局中人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息（imperfect information ）40，5

31、0 -10，030，80-10，1000，300 0，3000，4000，400 高成本情况高成本情况低成本情况低成本情况默许默许斗争斗争默许默许斗争斗争进入进入不进入不进入进入者进入者在位者在位者市场进入博弈：不完全信息市场进入博弈：不完全信息二、海萨尼（Harsanyi）转换在位者存在不同类型，类似于与n个参与人博弈；海萨尼（1967-1968）提出，引入虚拟参与人自然，自然先决定参与人的特征，不完全信息博弈转换为不完美信息博弈不完全信息意味着至少有一个人有多个类型（type），即个人所拥有的非共同信息，用i表示参与人i的一个类型，分布函数p(1,n)为共同知识。自然进入者进入者

32、在位者在位者高低不进入进入不进入进入合作斗争合作斗争(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)p1-p海萨尼转换后的市场进入博弈二、海萨尼转换假设自然N按照一个先验的分布函数p(1,n)来选择各个局中人的类型，并且假设这是共同知识。记-i=(1,i-1,i+1,n)-i局中人i不知道N对-i的选择结果，但由于他知道自己的类型i，它可以利用贝叶斯法则计算出条件分布函数，对其他局中人的类型进行估计：称pi(-ii)为局中人i对别的局中人类型的信念（belief）。在许多场合下，局中人的类型是彼此无关的，此时pi(-ii)就简化为pi(-i)。i

33、iiiiiiiiiiippppp),(),()(),()(三、不完全信息静态博弈的三、不完全信息静态博弈的战略式表述战略式表述n人贝叶斯博弈的战略式表述为： G=N,S,P,U，其中参与人的类型空间为：1, n；条件概率为：p1,pn；类型依存战略为：S1(1) ,S(n)；类型依存支付函数为：u1(s1,sn; 1), un(s1,sn; n)给定参与人i知道自己的类型ii，条件概率pi=pi(-ii)描述给定自己属于i的情况下，参与人i有关其他参与人类型-i-i的不确定性。静态贝叶斯博弈的时间顺序自然选择类型向量=(1,n),其中ii,参与人i观测到i,但参与人j只知道pj(-jj),观测

34、不到iN个参与人同时选择行动s=(s1,sn),其中siSi(j)参与人i得到ui(s1,sn;j)。自然进入者进入者在位者在位者高低不进入进入不进入进入合作斗争合作斗争(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)p1-p海萨尼转换后的市场进入博弈市场进入博弈均衡求解当进入者选择进入的期望收益大于选择不进入的期望收益时，进入者选择进入进入的期望收益：p*40+(1-p)*(-10)0，解得：p1/5，进入；p1/5时,s1*=进入,s2*(高成本)=默许当pzj+(1-zj)0=zj，即只有1-zjci，参与人才会提供。存在一个分割点（cut

35、off），使得cic,ci*时，参与人才会提供。求解ci*:1-ci*=cj*/2，1-cj*=ci*/2,求得ci*=cj*=2/3，即当只当cic*,参与人i提供。三、一级密封价格拍卖（the first-price sealed auction）当一件物品对买者的价值买者比卖者更清楚时，卖者一般不愿意首先提出价格，而常常采用拍卖的方式获得可能的最高价格。一级密封价格拍卖是许多拍卖方式的一种，在这种拍卖中，投标人同时将自己的出价写下来转入一个信封，密封后交给拍卖人，拍卖人打开信封，出价最高者是赢者，按他的出价支付价格，拿走被拍卖的物品。一级密封价格拍卖（一）以两个人为例两个人对拍卖品分别

36、有自己的主观判断，称其为对拍卖品的保留价格v，假设两人都不清楚对方的保留价格，只知道对方的保留价格为一均匀分布于0，1上的随机值。记局中人的最佳叫价为b(v)，由经验常识，假设函数b(v)严格单增是合适的，在此假设下，其反函数存在，记为V(b)，反映的是叫价为b的局中人真实的保留价格。一级密封价格拍卖（二）当某人叫价b时，获胜的概率当然是对方叫价低于b的概率，或者等价地说，是对方的保留价格低于V(b)的概率由于局中人对该物品的保留价格是闭区间0，1上的均匀分布，这一概率就等于V(b)。所以，一个具有保留价格v、叫价b的竞价者的期望支付为： V(b)(v-b)+(1-V(b)0 从而他的目标是

37、: max V(b)(v-b) 其一阶条件为：V(b)/(v-b)-V(b)=0, 即V(b)/(V(b)-b)-V(b)=0 一级密封价格拍卖（三）等价于：V2(b)/2/=bV(b)/恒等式两端对b求不定积分得到：V2(b)/2=bV(b)+c显然当某人对一个物品的保留价格是0时，它最优的叫价也是0，即V(0)=0，将这一初始条件带入上式可求得c=0。从而V(b)=2b，或b=v/2竞价者的最优战略是以自己保留价格的一半作为叫价。一级密封价格拍卖（四）如果有n人参与竞标，则b=(n-1)v/n，即b随n的增加而增加，特别地，当n时，bv，就是说，投标人越多，卖者能得到的价格就越高；当投标人

38、趋于无穷时，卖者几乎得到买者价值的全部。因此，让更多的人加入竞标是卖者的利益所在。第三节贝叶斯均衡与混合战略均衡贝叶斯均衡与混合战略有不少人认为完全信息博弈中的混合战略均衡仅仅只是理论上的概念，但在现实生活中确实难以理解的。针对这一点，海萨尼（1973）对混合战略提出了另一种解释。其思想是，只要在原来的博弈中加入少许不完全信息因素，得到（单纯战略）贝叶斯均衡就与完全信息下的混合战略均衡相似。性别战2，4+20，0音乐会1，14+1，2足球音乐会足球男方女方支付 b/ 1-b/a/0 a(b) p=a/或者p=b/1-a/“性别战”的重新构造完全信息情况下的“性别战”加上不完全信息，想象两人还

39、不十分了解，当双方都去看足球赛时男士得到的支付是4+1，双方都去听音乐会时女士得到的支付为4+2。两人知道自己的类型，但不清楚对方值的大小，只知道对方的值是均匀地分布在区间0,上的随机变量。如果男士的类型1不小于某一临界值a，他选择“足球”，否则选择“音乐会”；如果女士的类型2不小于某一临界值，她选择“音乐会”，否则选择“足球”。“性别战”求解男士选择足球的条件： b/(4+1)+(-b)/1b/0+(-b)/2 整理后得到男士选“足球”的充要条件： 1/b-5=a女士选择“音乐会”的充要条件是： 2/a-5=b联立两个条件中的等式，解得 a=b=在上述贝叶斯均衡中，两个局中人使用的都是单纯战

40、略，因为不知道对方的类型，感觉面对的像是混合战略的博弈对手。如果令为0，男士选足球的概率(-a)/趋于4/5。但不完全信息消失时，贝叶斯均衡趋向于完全信息下的混合均衡。 25254第四节机制设计原理与显示原理一、机制设计（mechanism design）机制设计是一种特殊的不完全信息博弈，委托人(principal)选择设计机制，给代理人足够的激励，促使代理人(agent)说实话（获取真实信息），也可以最大化委托人的期望效用。委托人设计机制面临两个约束：（1）参与约束(participation constraint)或称个人理性约束(individual rationality const

41、raint)：代理人在该机制下得到的期望效用不小于他在不接受这个机制时得到的最大期望效用。（2）激励相容约束(incentive-compatibility constraint)：代理人在所设计的机制下必须有积极性选择委托人希望他选择的的行动。机制设计满足参与约束的机制称为可行机制，满足激励相容约束的机制称为可实施机制，满足两个约束条件的机制称为可行的可实施机制。委托人的目的是选择一个可行的可实施机制以最大化他的期望效用。典型的机制设计是一个三阶段不完全信息博弈：第一阶段：委托人设计机制，即博弈规则，代理人根据规则发出信号(message)，实现的信号决定配置结果(allocation)；第

42、二阶段：代理人同时选择接受或不接受委托人设计的机制；第三阶段：接受机制的代理人根据机制的规定进行博弈。机制设计案例机制设计的案例有很多：拍卖、垄断企业定价、政府税收政策的制定、政府对垄断企业的规制、公共产品的供给、雇主对雇员职位的安排、保险公司的收费和赔偿政策等。机制设计案例分析（一）圣经上索罗门国王对孩子所有权的判定：两个代理人：A、B 私人信息：孩子对于A、B两人的价值分别为CA,CB 索罗门国王的处置方式：将孩子切成两半 A、B两个人按照所罗门国王设计的机制采取行动：私人信息配置结果存在问题：代理人可以模仿其他人的反应。机制设计案例分析（二）King Econ game采取处罚措施：

43、让A先行动，如果放弃得0，如果向B挑战需要付出F。B如果接受A的选择，放弃孩子则得0，如果不放弃，向A挑战，则需要付出E。A再进入下一个迎接挑战的循环。ABA(0,CB)(CA,0)(-F,CB-E)(CA-E-F,-F)Give upAssertAcceptChallege, bide E and A pays FDont matchChallege, match E and B pays FKing Econ gameKing Econ game假设A是孩子的亲生母亲，则有CACB，B知道她如果要得到孩子，必须付出足够的E使得A放弃，即有-FCA-E-F，即ECA，则有CBCAE，B的收益

44、为负，即CB-E0，得到均衡A will assert and B will。假设B是孩子的亲生母亲，则有CACA-E-F，即ECA，这样就能找到E，使得CBECA，得到A will give up in the 1st stage。二、显示原理（revelation principal）假定以Mi为信号空间和以ym(.)为配置函数的机制的贝叶斯均衡是：*(.)=1*(1),n*(n),i*Mi,i i 那么存在以Mi= I为信号空间的直接显示机制，该机制的贝叶斯均衡是，所有代理人在第二阶段接受机制，在第三阶段同时报告自己的真实类型=(1, n)。直接机制的均衡配置结果与原机制的均衡配置结

45、果相同。 )()(*myy显示原理显示原理显示原理肯定了对任何贝叶斯博弈的任何贝叶斯纳什均衡，都能设计出一种促使各博弈方“揭示”自己真实类型的直接机制来实现它。以暗标拍卖为例。设只有两个投标人，他们的估价类型V1,V2都是0,1上的标准分布。说实话的直接机制是这样设计的：(1)两投标人同时声明V1/,V2/；(2)投标人中中标的概率为qi=V1/2，中标的价格为pi=V1/。由于Vi0,1，因此Vi/0,1，q1+q21。其中为代定参数，是决定投标人都说实话是否能成为贝叶斯纳什均衡的关键。假定两投标人的声明是线性齐次的，具有：Vi/=aiVi的形式，则投标人i声明Vi/的期望收益为：对投标人i

46、来讲，均衡条件是找出ai使期望收益最大其一阶条件为ai=/2所谓说实话，即ai=1，Vi/=Vi因此，当=2时，也就是中标价格为中标人声明估价（也是真实股价）的一半时，上述直接机制使得两投标人都讲真话是贝叶斯纳什均衡显示原理显示原理)(2)(2iiiiiiiiiVaVVaVVVEu0，00，1B1，0-1，-1ABA厂商1厂商2支付作业1请用下面这个两市场博弈验证海萨尼关于混合策略和不完全信息博弈关系的结论。v1-1,v2-1v1-1,v2v1,v2-10,0 参与人2 提供不提供提供不提供参与人1作业2：公共物品的提供支付如下所示，成本为1，收益为私人信息，分别为v1,v2，其中v1,v2

47、分别均匀分布于0.75,1.75，1,2区间上，求贝叶斯纳什均衡。第四章不完全信息动态博弈精炼贝叶斯纳什均衡信号传递博弈及其应用举例KMRW声誉模型第一节精炼贝叶斯纳什均衡一、不完全信息动态博弈特点“自然”首先选择参与人的类型，参与人自己知道，其他参与人不知道；参与人开始行动，后行动者能观测到先行动者的行动，但不能观测到先行动者的类型；后行动者通过观察先行动者所选择的行动来推断类型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动；先行动者预测到自己的行动将被后行动者所利用，就会设法选择传递对自己最有利的信息，避免传递对自己不利的信息。二、贝叶斯法则先验概率(prior proba

48、bility):修正之前的判断；后验概率(posterior probability)：修正之后的判断贝叶斯法则：假定参与人i有K个类型，有H个行动，用k和sh分别代表一个特定的类型和战略，假定i属于k的先验概率是p(k)0,p(k)=1,i选择sh的条件概率为p(shk),p(shk)=1。假如观测到i选择了sh,i属于类型k的后验概率Prob(ksh)有以下公式存在：kjjjhkkhhkkhhkpsppspsobpspsob1)()()()(Pr)()(Pr贝叶斯法则举例假定现实中分为好人(1)和坏人(2)(type)，所有的事分为好事(s1)和坏事(s2)(strategy),那么一个

49、人干好事的概率ps1就等于他是好人的概率p(1)（先验概率）乘以好人干好事的概率p(s11)，加上他是坏人的概率p(2)乘以坏人干好事p(s12)的概率，即ps1=p(s11)p(1)+p(s12)p(2)(边缘概率)。假定观测到一个人干了一件好事，那么这个人是好人的后验概率为：)()()()()()(Pr)()(Pr221111111111111psppsppspsobpspsob贝叶斯法则举例假设认为这个人是好人的先验概率为1/2，那么在观测到他干了好事之后来修正他是好人的先验概率依赖于这件事好到什么程度。假设这件事非常好，好人一定干，坏人一定不干，则有p(s11)=1， p(s12)=0

50、，那么后验概率Prob(1s1)=(1*1/2)/(1*1/2+0*1/2)=1假设这是一件非常一般的好事，好人会干，坏人也会干，则有p(s11)=1, p(s12)=1,后验概率Prob(1s1)=(1*1/2)/(1*1/2+1*1/2)=1/2假设介于上述两种之间，好人肯定会做，坏人可能做也可能不做，则有p(s11)=1, p(s12)=1/2，后验概率Prob(1s1)=(1*1/2)/(1*1/2+1/2*1/2)=2/3三、精炼贝叶斯均衡（PBNE）PBNE是不完全信息动态均衡的基本均衡概念，是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡（SPNE）和海萨尼的不完全信息静态博弈贝叶斯

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 博弈论完整 ppt 课件讲解

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：博弈论最全完整ppt课件-讲解.ppt
链接地址：https://www.taowenge.com/p-29577366.html