博弈论最全完整ppt课件-讲解.ppt
《博弈论最全完整ppt课件-讲解.ppt》由会员分享,可在线阅读,更多相关《博弈论最全完整ppt课件-讲解.ppt(308页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论与信息经济学博弈论与信息经济学Game Theory and Economics of Information博弈论基本思想博弈论基本思想人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/ /员工,教授等。类似的博弈也在商业活动、政治和外交事务、战争中进行着在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学, 心理学和哲学。如何在“博弈”中获胜?日常生活中的博弈(“游戏”)往往指的是诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/ /橄榄球How can you win such games
2、?许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。它是对于如何最好地利用身体(物质)的技巧的一种算计。什么是策略博弈?What is a Game of Strategy? 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、对同一情形也在进行类似的思考。 博弈论就是用来分析这样交互式的决策的。 理性的行为指的是:明白自己的目的和偏好,同时了解自己行动的限制和约束,然后以精心策划的方式选择自己的行为,按照自己的标准做到最好。 博弈论对理性的行为又从新的角度赋予其新的含义与其他同样具有理性的决策者进行相互作用。 博弈论是关于相互作用情况下的理性行为的科学。如何在博弈中
3、获胜? 真的能在博弈中(总是)获胜吗?对手和你一样聪明! 许多博弈相当复杂,博弈论并不能提供万无一失的应对办法。例1:无谓竞争(The GPA Rat Race)你所注册的一门课程按照比例来给分:无论卷面分数是多少,只有4040的人能够得优秀,4040的人能得良好。所有学生达成一个协议,大家都不要太用功,如何?想法不错,但无法实施! !稍加努力即可胜过他人,诱惑大矣。问题是,大家都这么做。这样一来,所有人的成绩都不比大家遵守协议来得高。而且,大家还付出了更多的功夫。正因为这样的博弈对所有参与者存在着或大或小的潜在成本,如何达成和维护互利的合作就成为一个值得探究的重要问题。存在双赢的博弈吗?例2
4、 2:焦点博弈 “We Cant Take the Exam,Because We Had a Flat Tire”两个学生想要推迟考试,谎称由于返校途中轮胎漏气,未能很好地备考。教授分别对他们提出了问题:“哪个轮胎漏气? ?”如何应答?他们本应该预计到教授的招数,提前准备好答案。在博弈中,参与者应该向前看到未来的行动,然后通过向后推理,推算出目前的最佳行动。如果双方都没有准备,他能够独立地编出一个相互一致的谎言吗?例2 2:焦点博弈 “We Cant Take the Exam,Because We Had a Flat Tire”“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你
5、的朋友是否使用同样的逻辑,或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然;反之,是否她认为这一选择对你同样显然。以此类推。也就是说,需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。例2 2:焦点博弈 “We Cant Take the Exam,Because We Had a Flat Tire”我们无法从所有这样的博弈的结构中找到一般和本质的东西,来保证这样的收敛。某些博弈中,由于偶然的外因可以对策略贴标签,或者参与者之间拥有某些共同的知识体验,导致了焦点的存在。没有某个这样的暗示,默契的合作就完全不可能。
6、例3:为什么教授如此苛刻?许多教授强硬地规定,不进行补考,不允许迟交作业或论文。教授们为何如此苛刻?如果允许某种迟交,而且教授又不能辨别真伪,那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法,就是“没有例外”的策略。例3:为什么教授如此苛刻?问题是,一个好心肠的教授如何维持如此铁石心肠的承诺?他必须找到某种使拒绝变得强硬和可信的方法。拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声誉导论博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者博弈论的基本概念与类型主要参考文献导论一、博弈均衡与一般均衡 案例:囚犯困境案例:囚犯
7、困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A与传统微观经济学的比较与传统微观经济学的比较一致性利益最大化原则均衡原则不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性信息不完全-委托-代理理论、信号传递与信息筛选模型导论二、博弈论与诺贝尔经济学奖获得者1994年诺贝尔经济学奖获得者美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和
8、经济学产生了重大影响 。 约翰约翰纳什纳什1928年生于美国年生于美国约翰约翰海萨尼海萨尼19201920年年生于美生于美国国莱因哈莱因哈德德泽尔泽尔腾,腾,19301930年年生于德生于德国国1996年诺贝尔经济学奖获得者英国人詹姆斯莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey) 获奖理由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。詹姆斯詹姆斯莫里斯莫里斯19361936年生于英国年生于英国威廉维克瑞,1914-1996,生于美国2001年
9、诺贝尔经济学奖获得者三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。 约瑟夫斯蒂格利茨,1943年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授乔治阿克尔洛夫1940年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学经济学教授。迈克尔斯彭斯1948年生于美国的新泽西,1972年获美国哈佛大学博士
10、头衔,现兼任美国哈佛和斯坦福两所大学的教授。2005年诺贝尔经济学奖获得者以罗伯特奥曼色列经济学家罗伯特奥曼(Robert J. Aumann)和美国经济学家托马斯谢林(Thomas Thomas C. SchellingC. Schelling) 获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。 罗伯特奥曼 托马斯谢林导论三、博弈论的基本类型合作博弈与非合作博弈合作博弈(cooperative game) 达成有约束力的协议(binding agreement),强调团体理性,强调效率、公正、公平非合作博弈(non-cooperative game) 强调个人理性
11、,其结果可能有效率,也可能无效率。纳什均衡(纳什均衡(NENE)子博弈完美纳什子博弈完美纳什均衡(均衡(SPNESPNE)贝氏纳什均衡贝氏纳什均衡(BNEBNE)完美贝氏纳什均衡完美贝氏纳什均衡(PBNEPBNE)及序贯均及序贯均衡(衡(SESE)完全信息 不完全信息静态动态非合作博弈的基本分类非合作博弈的基本分类静态博弈与动态博弈(static games and dynamic games)同时决策或者同时行动的博弈属于静态博弈;先后或序贯决策或者行动的博弈,属于动态博弈即使决策或行动有先后,但只要局中人在决策时都还不知道对手的决策或者行动是什么,也算是静态博弈完全信息博弈与不完全信息博弈
12、(games of complete information and games of incomplete information)按照大家是否清楚对局情况下每个局中人的得益。“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识(common knowledge)。据“共同知识”的掌握分为完全信息与不完全信息博弈。完美信息博弈与不完美信息博弈(games with perfect information and games with imperfect information)是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。如果在博弈进行过
13、程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈;否则位不完美信息。零和博弈与非零和博弈(zero-sum game and non-zero-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。零和博弈是利益对抗程度最高的博弈。常和博弈与非常和博弈(constant-sum game and variable-sum game)如果一个博弈在所有各种对局下全体参与人之得益
14、总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。常和博弈也是利益对抗程度最高的博弈。非常和(变和)博弈蕴含双赢或多赢。导论四、主要参考文献张维迎著,博弈论与信息经济学,上海三联书店、张维迎著,博弈论与信息经济学,上海三联书店、上海人民出版社,上海人民出版社,19961996年版。年版。Roger B. Myerson著:Game Theory(原文版、译文版),中国经济出版社,2001年版。王则柯、李杰编著,博弈论教程,中国人民大学出版社,2004年版。艾里克.拉斯缪森(Eric Rasmusen
15、)著,博弈与信息:博弈论概论,北京大学出版社,2003年版。因内思马可-斯达德勒,J.大卫佩雷斯-卡斯特里罗著,信息经济学引论:激励与合约,上海财经大学出版社,2004年版。施锡铨编著,博弈论上海财大出版社,2000年版。谢识予编著,经济博弈论,复旦大学出版社,谢识予编著,经济博弈论,复旦大学出版社,20022002年版。年版。谢识予主编,经济博弈论习题指南,复旦大学出谢识予主编,经济博弈论习题指南,复旦大学出版社,版社,20032003年版。年版。课程主要内容第一章 完全信息静态博弈第二章 完全信息动态博弈第三章 不完全信息静态博弈第四章 不完全信息动态博弈第五章 委托-代理理论第六章 逆向
16、选择与信号传递第一章 完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节 博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈的战略式表述:G=N,(Si)iN,(Ui)iN有三个基本要素:(1)参与人(players)iN=1,2,n ;(2)战略(strategies),siSi(战略空间);(3)支付(payoffs),ui=ui(s-i,si)。 案例案例1 1:囚犯困境:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白
17、0,-9-6,-6支付嫌疑人B嫌疑人A均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)第二节 纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡完全信息静态博弈的几点特性完全信息静态博弈的几点特性 同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的 承诺(非合作) 一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。定义:在博弈G=N,(Si)iN,(Ui)iN中,如果对所有的参与人i,si*是它的占优战略,那么所有参与人选择的战略组合(s1*,sn*)成为该对策的占优战略均衡。 案例案例1 1:囚犯困境:囚犯困境抵赖坦白
18、抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A“囚犯困境” 的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革 结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。价格大战低价高价低价3,36,1高价1,65,5支付百事可乐可口可乐案例2:智猪博弈 猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个
19、单位。支付如表。 案例案例2 2:智猪博弈:智猪博弈按等待按5,14,4等待9,-10,0支付小猪大猪智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动二、重复剔除的占优战略均衡绝对劣势战略:si是一绝对劣势战略当且仅当存在另一战略siSi使得ui(si,s-i) ui(si,s-i) 对所有s-iS-i均成立。( si 未必是优势战略)重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。 例:重复剔除的占优战略均衡例:重复剔除的占优战略均衡2,30,2
20、3,41,12,74,5 参与人2 L M R参与人1UD例 重复剔除的占优战略均衡4,35,16,22,18,43,63,09,62,8 参与人2L M R参与人1UDM例 重复剔除的占优战略均衡1,01,33,00,20,13,00,22,45,3 参与人2L M R参与人1UDM三、纳什均衡纳什均衡定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s1*,sn*)=(si*,s-i*)是一纳什均衡,当且仅当对所有参与人而言,ui (si*,s-i*) ui (si,s-i*)对所有siSi 均成立。简单而言,当s1*是对s2*的最适反应,s2*也是
21、s1*的最适反应时,(s1*,s2*)就是二人博弈的纳什均衡。命题1:纳什均衡在占优战略重复剔除解法中不会被剔除命题2:重复剔除的严格占优战略均衡一定是纳什均衡。例 纳什均衡求解0,44,05,34,00,45,33,53,56,6 参与人2L M R参与人1UDM作业7,76,67,65,75,88,56,65,84,8 乙 左 中 右上中下甲一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?第三节 纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧一、古诺寡头模型特点:存在两家厂商;同时行动确定产量。通过
22、预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。厂商1表示为:max p(y1+y2e)y1-c(y1),得出y1=f1(y2e),同理得出y2=f2(y1e),称为反应函数,两条曲线的交点为古诺模型的解。古诺寡头模型的纳什均衡反应函数 y1=f1(y2) y2=f2(y1)(y1*,y2*)是该对策的纳什均衡解。y1* y12y11 y10y2*y22y21y1oy2f1(y2)f2(y1)例题:古诺模型的解假设p=a-(y1+y2),C1=y1c,C2=y2c则根据利润最大化的一阶条件分别得到反应函数y1=f1(y2)=(a-y2-c)/2,y2=f2(y1)=(a-y1-c
23、)/2,求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,均衡利润为(1/9(a-c)2,1/9(a-c)2)古诺模型的解:与垄断市场的比较古诺模型的解:与垄断市场的比较假设为一垄断企业,则有: Max =y(a-y-c), 得到垄断企业的最优产量 y=1/2(a-c) y1+y2=2/3(a-c) 垄断利润为=1/4(a-c)2 2/9(a-c)2寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。寡头厂商与垄断厂商的比较 1/3(a-c) 1/2(a-c)1/2(a-c)y1oy2f1(y2)f2(
24、y1)1/3(a-c)0 1二、沙滩卖冰假设游客沿沙滩0,1间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买。生活中还有哪些类似的例子?三、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高假定长度为1的线性城市,消费者均匀分布在0,1区间内,分布密度为1;两个商店1、2分别位于x=0,x=1,即城市的两端;消费者购买商品的旅行成本与商店的距离成反比,单位距离的成本为t;住在x的消费者在两个商店之间是无差异的,需求D1=x
25、,D2=1-x,x满足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。豪泰林模型:以空间上差异为例豪泰林模型:以空间上差异为例根据两个商店的利润函数,1=(p1-c)x, 2=(p2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p1*=p2*=c+t,均衡利润1=2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。四、公共地的悲剧生物学家和生态学家哈丁(Garrett Harde
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 完整 ppt 课件 讲解
限制150内