《博弈论导论优秀课件.ppt》由会员分享,可在线阅读,更多相关《博弈论导论优秀课件.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈博弈论导论第1页,本讲稿共82页要想在现代社会做一个有文化要想在现代社会做一个有文化的人,你必须对博弈论有一个的人,你必须对博弈论有一个大致了解。大致了解。萨缪尔森萨缪尔森第2页,本讲稿共82页什么是博弈论?什么是博弈论?高深莫测的逻辑推理?高深莫测的逻辑推理?下棋的方法?下棋的方法?生活中与人较量的策略?生活中与人较量的策略?数学模型?数学模型?第3页,本讲稿共82页博弈论基本思想博弈论基本思想人们在日常生活中进行着博弈(或称为战斗),与配偶,朋友,人们在日常生活中进行着博弈(或称为战斗),与配偶,朋友,陌生人,老板陌生人,老板/员工,教授等。员工,教授等。类似的博弈也在商业活动、政治和
2、外交事务、战争中进行着类似的博弈也在商业活动、政治和外交事务、战争中进行着在任何一在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。种情况下,人们相互影响以达成彼此有利的协议或者解决争端。游戏下棋、猜大小经济寡头产量决策、市场阻入、投标拍卖政治、军事美国和伊拉克、以色列和巴勒斯坦博弈论为众多学科提供了分析的概念和方法:经济学和商学博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学政治科学,生物学生物学,心理学和哲学。心理学和哲学。第4页,本讲稿共82页如何在如何在“博弈博弈”中获胜?中获胜?日常生活中的博弈(日常生活中的博弈(“游戏游戏”)往往指的是诸如赌博和运动)往
3、往指的是诸如赌博和运动这样的东西:这样的东西:赌抛硬币赌抛硬币 百米赛跑百米赛跑 打网球打网球/乒乓球乒乓球How can you win such games?How can you win such games?许多博弈都包含着运气、技术和策略。许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。它是对于如何最策略是为了获胜所需要的一种智力的技巧。它是对于如何最好地利用物体(物质)的技巧的一种算计好地利用物体(物质)的技巧的一种算计.想赢?策略+技术+运气第5页,本讲稿共82页什么是策略博弈?什么是策略博弈?What is a Game of Strategy?What
4、 is a Game of Strategy?策略本质上涉及到与他人的相互影响。其他人在同一时间、对同一情形也在进行类似的思考。博弈论就是用来分析这样交互式的决策的。理性的行为指的是:明白自己的目的和偏好,同时了解自己行动的限制和约束,然后以精心策划的方式选择自己的行为,按照自己的标准做到最好。博弈论对理性的行为又从新的角度赋予其新的含义与其他同样具有理性的决策者进行相互作用。博弈论是关于相互作用情况下的理性行为的科学。第6页,本讲稿共82页如何在博弈中获胜?如何在博弈中获胜?真的能在博弈中(总是)获胜吗?真的能在博弈中(总是)获胜吗?对手和你一样聪明!对手和你一样聪明!许多博弈相当复杂,博弈
5、论并不能提供万无一失的应许多博弈相当复杂,博弈论并不能提供万无一失的应对办法。对办法。第7页,本讲稿共82页你所注册的一门课程按照比例来给分:无论卷面分数是多少,只有40的人能够得优秀,40的人能得良好。所有学生达成一个协议,大家都不要太用功,如何?想法不错,但无法实施!稍加努力即可胜过他人,诱惑大矣。问题是,大家都这么做。这样一来,所有人的成绩都不比大家遵守协议来得高。而且,大家还付出了更多的功夫。正因为这样的博弈对所有参与者存在着或大或小的潜在成本,如何达成和维护互利的合作就成为一个值得探究的重要问题。存在双赢的博弈吗?例1:无谓竞争(The GPA Rat Race)第8页,本讲稿共82
6、页例例2 2:焦点博弈:焦点博弈“We Cant Take the “We Cant Take the Exam,Because We Had a Flat Tire”Exam,Because We Had a Flat Tire”两个学生想要推迟考试,谎称由于返校途中轮胎漏气,未能很好地备考。教授分别对他们提出了问题:“哪个轮胎漏气?”如何应答?他们本应该预计到教授的招数,提前准备好答案。在博弈中,参与者应该向前看到未来的行动,然后通过向后推理,推算出目前的最佳行动。如果双方都没有准备,他能够独立地编出一个相互一致的谎言吗?第9页,本讲稿共82页例例2 2:焦点博弈:焦点博弈“We Cant
7、 Take the “We Cant Take the Exam,Because We Had a Flat Tire”Exam,Because We Had a Flat Tire”“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你的朋友是否使用同样的逻辑,或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然;反之,是否她认为这一选择对你同样显然。以此类推。也就是说,需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。e.g.心有灵犀一点通。第10页,本讲稿共82页我们无法从所有这样的博弈的结构中找到一般和本质的东西,来保证
8、这样的收敛。某些博弈中,由于偶然的外因可以对策略贴标签,或者参与者之间拥有某些共同的知识体验,导致了焦点的存在。没有某个这样的暗示,默契的合作就完全不可能。例例2:焦点博弈:焦点博弈“We Cant Take the Exam,Because We Had a Flat Tire”第11页,本讲稿共82页例例3 3:为什么教授如此苛刻?:为什么教授如此苛刻?许多教授强硬地规定,不进行补考,不允许迟交作业或论文。教授们为何如此苛刻?如果允许某种迟交,而且教授又不能辨别真伪,那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法,就是“没有例外”的策略。第12页,本讲稿共82
9、页例例3 3:为什么教授如此苛刻?:为什么教授如此苛刻?问题是,一个好心肠的教授如何维持如此铁石心肠的承诺?他必须找到某种使拒绝变得强硬和可信的方法。拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声誉第13页,本讲稿共82页第一章第一章 引论引论博弈论的提出博弈论的基本概念与类型博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者主要参考文献案例分析第14页,本讲稿共82页引引 论论一、博弈论的提出第15页,本讲稿共82页博弈论历史没有公认答案对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早博弈论真正的发展在上世纪博弈论总体上仍然是发展中的
10、学科 博弈论的形成博弈论的形成 第16页,本讲稿共82页2000年前我国古代的“齐威王田忌赛马”1500年前巴比伦犹太教法典“婚姻合同问题”等。1838年古诺寡头模型。1883年伯特兰德寡头竞争模型。1913年齐默罗象棋博弈定理、“逆推归纳法”。1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解。1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果。第17页,本讲稿共82页19441944年冯年冯.诺伊曼和摩根斯坦诺伊曼和摩根斯坦博弈论和经济行为博弈论和经济行为 (Theory of Games and Economic Behavio
11、rTheory of Games and Economic Behavior)引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示提出稳定集(stable sets)解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架、概念术语和表述方法第18页,本讲稿共82页1 1、博弈的含义、博弈的含义 博博弈弈指指的的是是一一种种决决策策,即即每每一一行行为为主主体体的的利利益益不不仅仅依依赖赖他他自自己己的的行行动动选选择择,而而且且依依赖赖于于别别人人的的行行动动选选择择,以以致致他他
12、所所采采取取的的最最好好行行动动依依赖赖于于其其竞竞争争对对手手将将选选择择什什么么行行动。动。博博弈弈论论所所研研究究的的就就是是两两个个以以上上行行为为主主体体的的互互动动决决策及策略均衡。策及策略均衡。一、博弈论的提出第19页,本讲稿共82页 博博弈弈论论(Game Game TheoryTheory)又又称称为为对对策策论论、游游戏戏理理论论以以及及策策略略运运筹筹学学。它它最最早早由由德德国国数数学学家家、哲哲学学家家莱莱布布尼尼茨于茨于17101710年提出。年提出。博博弈弈论论是是研研究究决决策策主主体体行行为为发发生生直直接接相相互互作作用用时时候的决策及谋求这种决策的候的决策
13、及谋求这种决策的均衡问题。均衡问题。第20页,本讲稿共82页博弈论可以划分为博弈论可以划分为合作博弈合作博弈(cooperative game)cooperative game)和和非合作博弈非合作博弈(non-cooperative game)(non-cooperative game)。纳什、泽尔。纳什、泽尔腾和海萨尼的贡献主要是在非合作博弈方面,而且腾和海萨尼的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的现在经济学家谈到博弈论,一般指的是非合作博弈是非合作博弈,很少指合作博弈。很少指合作博弈。第21页,本讲稿共82页20世纪50年代可以说是博弈论的巨人出现的年代。合作
14、博弈论在50年代达到顶峰,同时非合作博弈论也开始创立。纳什纳什在1950年和1951年发表了两篇关于非合作博弈的主要文章。塔克塔克于1950年定义了“囚徒困境”,他们两个人的著作基本上奠定了现代非合作博弈论的基石。第22页,本讲稿共82页到60年代后又出现了一些重要人物,泽尔腾泽尔腾将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;海萨尼海萨尼则把不完全信息引入博弈论的研究。然后到80年代出现了几个比较有影响的人物,包括克瑞普斯(克瑞普斯(kreps)kreps)和威尔逊威尔逊(wilson)(wilson),他们在1982年合作发表了关于动态不完全信息博弈的重要文章。第23页,本讲
15、稿共82页严格地说,博弈论并不是经济学的一个分支。它是一种方严格地说,博弈论并不是经济学的一个分支。它是一种方法,应用范围并不局限于经济学。在政治学、军事学、外法,应用范围并不局限于经济学。在政治学、军事学、外交学甚至犯罪学等多个领域都涉及到博弈论知识。实际上,交学甚至犯罪学等多个领域都涉及到博弈论知识。实际上,它属于数学知识。它属于数学知识。1 1、博弈论在经济学中的应用最广泛、最成功;博弈论、博弈论在经济学中的应用最广泛、最成功;博弈论的许多成果也是借助于经济学的例子来发展的,特别是的许多成果也是借助于经济学的例子来发展的,特别是在应用领域在应用领域。第24页,本讲稿共82页2 2、经济学
16、家对博弈论的贡献也越来越大,特别是在动态分、经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈论之后。析和不完全信息引入博弈论之后。3 3、最带根本性意义的原因是经济学和博弈论的研究模式是一、最带根本性意义的原因是经济学和博弈论的研究模式是一样的,即强调样的,即强调个人理性个人理性,也就是在给定的约束条件下追求,也就是在给定的约束条件下追求利益最大化。在这一点上,博弈论和经济学是完全一样利益最大化。在这一点上,博弈论和经济学是完全一样的。的。第25页,本讲稿共82页博弈论在经济学中的绝大多数应用模型都是在70年代中期之后发展起来的,大体从80年代开始,博弈论逐渐成为主流经济
17、学的一部分,甚至可以说成为微观经济学的基础。博弈论进入主流经济学,反映了经济学发展的以下几个趋势:第一,经济学研究的对象越来越转向个体,这正是博弈论研究的范式。第26页,本讲稿共82页第二,经济学越来越转向对人与人关系的研究,特别是对人与人之间行为的相互影响和作用。第三,经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。第27页,本讲稿共82页二、博弈论的基本要素和分类二、博弈论的基本要素和分类第28页,本讲稿共82页 A、局中人(、局中人(Player)博博弈弈中中的的每每个个决决策策者者被被称称为为局局中中人人(也也可可称称作作选选手手和和参参与与者者),在在具具体
18、体的的经经济济模模型型中中,它它们们可可以以是是厂厂商商,也也可可能能是是消消费费者者或或任任何何契契约约关关系系中中的的人人,根根据据经经济济学学的的理理性性假假定定,局局中中人人同同样是以利益最大化为目标。样是以利益最大化为目标。1、基本要素:参与者、支付和策略第29页,本讲稿共82页博弈中的参与人(局中人博弈中的参与人(局中人)独立决策、独立承担博弈结果的个人或组织博弈规则面前局中人之间平等,不因局中人之间权利、地位的差异而改变。局中人数量对博弈结果和分析有影响。根据局中人数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈。第30页,本讲稿共82页 支支付付是
19、是指指博博弈弈结结束束时时局局中中人人得得到到的的利利益益。支支付付有有时时以以局局中中人人得得到到的的效效用用来来表表示示,有有时时以以局局中中人人得得到到货货币币报报酬酬来来表表示示。局局中中人人的的利利益益最最大大化化也就是指支付或报酬最大化也就是指支付或报酬最大化。B、支付(PayoffStructure)第31页,本讲稿共82页博弈中的得益博弈中的得益得益对应博弈的结果,也就是各博弈方策略的组合。得益是各博弈方追求的根本目标及行为和判断的主要依据。根据得益的博弈分类:零和博弈、常和博弈、变和博弈。第32页,本讲稿共82页 策策略略(也也称称作作战战略略)是是局局中中人人为为实实现现其
20、其目目标标而而采采取取的的一一系系列列行行动动或或行行动动计计划划,它它规规定定在在何何种情况下采取何种行动。种情况下采取何种行动。C、策略(Strategies)第33页,本讲稿共82页博弈中的策略博弈中的策略 策略有定性定量、简单复杂之分。不同局中人之间不仅可选策略不同,而且可选策略数量也可不同。有限博弈:每个博弈方的策略数都是有限的。无限博弈:至少有某些博弈方的策略有无限多个。第34页,本讲稿共82页(1)(1)双人博弈和多人博弈双人博弈和多人博弈 (2)(2)静态博弈和动态博弈静态博弈和动态博弈 (3)(3)零和博弈与非零和博弈零和博弈与非零和博弈(4)(4)合作博弈与非合作博弈合作博
21、弈与非合作博弈 (5)(5)重复博弈重复博弈(6)(6)完全信息博弈和不完全信息博弈完全信息博弈和不完全信息博弈 2、博弈的分类第35页,本讲稿共82页 根根据据局局中中人人数数量量分分单单人人博博弈弈、两两人人博博弈弈、多多人人博博弈弈等等。最最常常见见的的是是两两人人博博弈弈,单单人人博博弈弈是是退退化的博弈。化的博弈。(1)双人博弈和多人博弈第36页,本讲稿共82页单人博弈:只有一个局中人的博弈单人博弈:只有一个局中人的博弈例一:单人迷宫例一:单人迷宫入口AB出口(奖金M)A,1B,1右左右左M00扩展形第37页,本讲稿共82页单人博弈:只有一个局中人的博弈单人博弈:只有一个局中人的博弈
22、例一:运输路线例一:运输路线-7000-16000-10000-10000好天气(75%)坏天气(25%)自 然商商人人水 路陆 路运输路线得益矩阵01-7000-10000-16000-10000运输路线扩展形好天气(75%)坏天气(25%)单人博弈实质个体最优化问题第38页,本讲稿共82页两人博弈两人博弈两人博弈即有两个博弈方的博弈。两人博弈最常见,研究最多,是最基本和有用的博弈类型。囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈。两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致。第39页,本讲稿共82页多人博弈多人博弈三个博弈方之间的博弈。可能存在“破坏者”:其策略选择对自身
23、的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法。第40页,本讲稿共82页 从从局局中中人人是是否否同同时时行行动动的的角角度度,博博弈弈可可以以划划分分为静态博弈和动态博弈。为静态博弈和动态博弈。静静态态博博弈弈:指指局局中中人人同同时时选选择择策策略略或或非非同同时时选选择择策策略略但但不不知知道道对对手手采采取取的的具具体体行行动动,并并且且这这种种选选择择是是一一次次性性的的,也也就就是是说说同同时时做做出出选选择择后后博博弈弈就出结果。就出结果。田忌赛马、猜硬币、古诺模型田忌赛马、猜硬币
24、、古诺模型 即即使使决决策策或或行行动动有有先先后后,但但只只要要局局中中人人在在决决策策时时都都还还不不知知道道对对手手的的决决策策或或者者行行动动是是什什么么,也也算算是静态博弈。是静态博弈。(2)静态博弈和动态博弈(staticgamesanddynamicgames)第41页,本讲稿共82页 动动态态博博弈弈:指指局局中中人人行行动动有有先先后后顺顺序序的的博博弈弈,后后行动者能观察到先行动者的行动。行动者能观察到先行动者的行动。弈棋、市场进入、领导弈棋、市场进入、领导追随型市场结构追随型市场结构日常生活中动态博弈比比皆是,比如购物中的砍日常生活中动态博弈比比皆是,比如购物中的砍价过程
25、就是一个典型的动态博弈。价过程就是一个典型的动态博弈。第42页,本讲稿共82页 零和博弈:零和博弈:指博弈双方的支付结果加起来为零。指博弈双方的支付结果加起来为零。这意味着双方的利益在博弈中是相互冲突的。从支这意味着双方的利益在博弈中是相互冲突的。从支付结果看,除了零和博弈外,还有付结果看,除了零和博弈外,还有正和博弈正和博弈,即双,即双方的支付结果加起来为一个正的常数。这意味着双方的支付结果加起来为一个正的常数。这意味着双方的利益冲突不再是那么激烈,有可能出现所谓双方的利益冲突不再是那么激烈,有可能出现所谓双赢或共赢局面。至于赢或共赢局面。至于负和博弈,负和博弈,如果假定局中人都如果假定局中
26、人都是理性的,理论上没有人会参与这种博弈,尽管现是理性的,理论上没有人会参与这种博弈,尽管现实中不乏损人不利己的事。实中不乏损人不利己的事。(3)零和博弈与非零和博弈(zero-sumgameandnon-zero-sumgame)第43页,本讲稿共82页 从从参参与与主主体体角角度度,可可以以把把博博弈弈划划分分为为合合作作博博弈弈和和非非合作博弈。合作博弈。在在非非合合作作博博弈弈中中,分分析析的的对对象象是是个个体体参参加加者者,考考察察的的是是单单个个的的参参与与人人在在具具体体的的博博弈弈规规则则以以及及一一定定的的信信息息条条件件约约束束下下,面面对对其其他他人人可可能能的的反反应
27、应将将如如何何行行动动。在在非非合合作作博博弈弈中中,局局中中人人之之间间通通常常无无法法达达成成有有约约束束力力的的协议进行合作,以获得合作收益。协议进行合作,以获得合作收益。非非合合作作博博弈弈强强调调的的是是个个人人理理性性、个个人人最最优优策策略略。但但结果可能有效率,也可能无效率。结果可能有效率,也可能无效率。(4)合作博弈与非合作博弈第44页,本讲稿共82页 在在合合作作博博弈弈分分析析中中,分分析析的的对对象象经经常常是是一一个个团团体体,用用博博弈弈论论的的术术语语称称之之为为“联联盟盟”。该该联联盟盟是是由由参参与与博博弈弈的的若若干干局局中中人人通通过过达达成成有有约约束束
28、力力的的协协议议形形成成。合合作作博博弈弈通通常常并并不不涉涉及及具具体体的的博博弈弈规规则则,而而集集中中于于不不同同的的人人结结盟盟将将得得到到什什么么。合合作作博博弈弈强强调调的是团体理性。的是团体理性。第45页,本讲稿共82页非合作博弈更受重视的主要原因非合作博弈更受重视的主要原因1.1.主导人们行为方式的主要还是个体理性而不是集体理性。主导人们行为方式的主要还是个体理性而不是集体理性。或者说,竞争是一切社会、经济关系的根本基础,不合作是或者说,竞争是一切社会、经济关系的根本基础,不合作是基本的,合作是有条件和暂时的,因此非合作博弈关系比合基本的,合作是有条件和暂时的,因此非合作博弈关
29、系比合作博弈关系更普遍。作博弈关系更普遍。2.2.搞清了非合作的博弈关系,合作的博弈关系就比较容易理搞清了非合作的博弈关系,合作的博弈关系就比较容易理解,在证明非合作博弈无效率或低效率的同时,就自然说明解,在证明非合作博弈无效率或低效率的同时,就自然说明了存在着合作的可能性和必要性,因此从某种意义上说非合了存在着合作的可能性和必要性,因此从某种意义上说非合作博弈理论是合作博弈论的基础。作博弈理论是合作博弈论的基础。3.3.集体理性是更高级和更复杂的理性,因此研究合作博弈的集体理性是更高级和更复杂的理性,因此研究合作博弈的难度更大,更难找到分析问题的一般概念和系统力法。难度更大,更难找到分析问题
30、的一般概念和系统力法。第46页,本讲稿共82页 重复博弈是动态博弈的一种特殊情况。重复博弈是动态博弈的一种特殊情况。无限期重复博弈无限期重复博弈 有限期的重复博弈有限期的重复博弈 (5)重复博弈第47页,本讲稿共82页(6)完全信息博弈与不完全信息博弈)完全信息博弈与不完全信息博弈(games of complete information and games of incomplete information)按照大家是否清楚对局情况下每个局中人的得益。按照大家是否清楚对局情况下每个局中人的得益。“各种对局情况下每个人的得益是多少各种对局情况下每个人的得益是多少”是所有局中人是所有局中人的共
31、同知识(的共同知识(common knowledgecommon knowledge)。)。据据“共同知识共同知识”的掌握分为完全信息与不完全信息博弈。的掌握分为完全信息与不完全信息博弈。第48页,本讲稿共82页完美信息博弈与不完美信息博弈完美信息博弈与不完美信息博弈(games with perfect information and games with imperfect information)是关于动态博弈进行过程之中面临决策或者行动的参与是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。人对于博弈进行迄今的历史是否清楚的一种刻划。如果在博弈
32、进行过程中的每一时刻,面临决策或者行动如果在博弈进行过程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈;经采取的决策或者行动完全清楚,则称为完美信息博弈;否则位不完美信息否则位不完美信息。第49页,本讲稿共82页行动顺序信息静态博弈动态博弈完全信息完全信息静态博弈;纳什均衡;代表人物:纳什(1950,1951)完全信息动态博弈;子博弈精炼纳什均衡;代表人物:泽尔腾(1965)不完全信息不完全信息静态博弈;贝叶斯纳什均衡;代表人物:海萨尼(1967-1968)不完全信息
33、动态博弈;精炼贝叶斯纳什均衡;代表人物:泽尔腾(1975);克瑞普斯和威尔逊(1982);弗登伯格和泰勒尔(1991)非合作博弈的基本分类第50页,本讲稿共82页 3、博弈的表述、博弈的表述 在在博博弈弈论论中中,一一个个博博弈弈一一般般可可以以用用两两种种不不同同的的方方式表述:式表述:战略式表述和扩展式表述。战略式表述和扩展式表述。战略式表述又称为标准式表述,在这种表述中,战略式表述又称为标准式表述,在这种表述中,每一参与人同时选择一个策略,而所有参与人的每一参与人同时选择一个策略,而所有参与人的策略组合又决定了每个参与人的支付。策略组合又决定了每个参与人的支付。第51页,本讲稿共82页博
34、弈的战略式表述:博弈的战略式表述:G=N,(SG=N,(Si i)i i N N,(U,(Ui i)i i N N 有三个基本要素有三个基本要素:(1 1)参与人(参与人(playersplayers)i i N=1,2,N=1,2,n,n;(2 2)战略(战略(strategiesstrategies),s,si i S Si i(战略空间战略空间);(3 3)支付()支付(payoffspayoffs),u,ui i=u=ui i(s(si i,s,s-i-i)。在在扩扩展展式式表表述述中中,各各参参与与人人先先后后或或重重复复选选择择各各自自的策略。的策略。第52页,本讲稿共82页 对于
35、不超过三个局中人的同时决策博弈,经对于不超过三个局中人的同时决策博弈,经济学上一般用一个支付矩阵(也称报酬矩阵)济学上一般用一个支付矩阵(也称报酬矩阵)来描述博弈的来描述博弈的3 3个基本要素,并运用它来分析个基本要素,并运用它来分析一个博弈。一个博弈。第53页,本讲稿共82页用同一个矩阵表示两个参与者的得失的做法,来自用同一个矩阵表示两个参与者的得失的做法,来自博弈理论的一位先驱者博弈理论的一位先驱者托马斯托马斯谢林(谢林(2005年诺贝年诺贝尔经济学奖获得者)。尔经济学奖获得者)。他曾经说过:他曾经说过:“假如真有人假如真有人问我有没有对博弈论做出一点贡献,我会回答有的。问我有没有对博弈论
36、做出一点贡献,我会回答有的。若问我是什么,我会说我发明了用一个矩阵反映双若问我是什么,我会说我发明了用一个矩阵反映双方得失的做法方得失的做法我不认为这个发明可以申请专利,我不认为这个发明可以申请专利,所以我免费奉送,不过,除了我的学生,几乎没有所以我免费奉送,不过,除了我的学生,几乎没有人愿意利用这个便利。现在,我也供给各位免费使人愿意利用这个便利。现在,我也供给各位免费使用我发明的矩阵。用我发明的矩阵。”第54页,本讲稿共82页 2005年诺贝尔经济学奖获得年诺贝尔经济学奖获得者托马斯者托马斯谢林谢林美国经济学家托马斯-谢林1921年出生于奥克兰,1951年获哈佛大学经济学博士学位,是马里兰
37、大学经济学系和公共政策学院的教授。第55页,本讲稿共82页乙乙 石头石头 剪刀剪刀 布布 石石头头 剪剪刀刀 布布甲甲0 ,0 1 ,-1-1,1-1 ,1 0 ,0 1,-11 ,-1-1,10 ,0 游戏游戏石头、剪刀、布石头、剪刀、布乙乙乙乙第56页,本讲稿共82页三、博弈均衡与一般均衡三、博弈均衡与一般均衡第57页,本讲稿共82页与传统微观经济学的比较与传统微观经济学的比较一致性一致性 利益最大化原则 均衡原则不一致不一致 人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性 信息不完全-委托-代理理论、信号传递与信息筛选模型第58页,本讲稿共82页
38、经济学中,均衡一般指某种稳定的状态。经济学中,均衡一般指某种稳定的状态。博博弈弈论论中中的的均均衡衡是是策策略略均均衡衡,它它是是指指由由各各个个局局中中人人所所使使用用的的策策略略构构成成的的策策略略组组合合处处于于一一种种稳稳定定状状态态,在在这这一一状状态态下下,各各个个局局中中人人都都没没有有动动机机来来改改变变自自己己所所选选择择的的策策略略。这这样样,各各人人的的策策略略都都已已给给定定,不不再再发发生生变变化化,博博弈弈的的结结果果必必将将确确定定。从从而而,每每一一个个局局中中人人从从中中得得到到的的支支付付也也就就确确定定了了。每每个个局局中中人人的的最最优优决决策策也也就就
39、可可以以确确定定了了。可可见见,要要解解一一个个博博弈弈问问题题,首首先先需需确确定定博弈的策略均衡。博弈的策略均衡。第59页,本讲稿共82页四、博弈论与诺贝尔经济学奖获得者四、博弈论与诺贝尔经济学奖获得者第60页,本讲稿共82页19941994年诺贝尔经济学奖获得者年诺贝尔经济学奖获得者 美国人约翰约翰-海萨尼海萨尼(John C.Harsanyi)和美国人约翰约翰-纳什纳什(John F.Nash Jr.)以及德国人莱因哈德莱因哈德-泽泽尔腾尔腾(Reinhard Selten)获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。第61页,本讲稿共8
40、2页约翰约翰纳什纳什19281928年生于美国年生于美国莱因哈德莱因哈德泽泽尔腾,尔腾,19301930年年生于德国生于德国约翰约翰海萨尼海萨尼19201920年生于年生于美国美国1994年诺贝尔经济学奖获得者第62页,本讲稿共82页1996年诺贝尔经济学奖获得者年诺贝尔经济学奖获得者英国人詹姆斯詹姆斯莫里斯莫里斯(James A.Mirrlees)和美国人威廉威廉-维克瑞维克瑞(William Vickrey)获奖理由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。第63页,本讲稿共82页詹姆斯詹
41、姆斯莫里斯莫里斯19361936年生年生于英国于英国威廉威廉维克维克瑞,瑞,1914-1914-19961996,生于,生于美国美国1996年诺贝尔经济学奖获得者第64页,本讲稿共82页2001年诺贝尔经济学奖获得者年诺贝尔经济学奖获得者 三位美国学者乔治乔治-阿克尔洛夫阿克尔洛夫(George A.Akerlof)、迈克尔迈克尔-斯彭斯斯彭斯(A.Michael Spence)和和约瑟夫约瑟夫-斯蒂格利茨斯蒂格利茨(Joseph E.Stiglitz)获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。第65页,本讲稿共82页2001年诺贝尔经济学奖获得者约瑟夫约瑟夫斯蒂格利茨,
42、斯蒂格利茨,19431943年年生于美国的印第安纳州,生于美国的印第安纳州,19671967年年获美国麻省理工学院博士头衔,获美国麻省理工学院博士头衔,曾担任世界银行的首席经济学家,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教现任美国哥伦比亚大学经济学教授授乔治乔治阿克尔洛夫阿克尔洛夫19401940年生于美国的纽黑文,年生于美国的纽黑文,19661966年获美国麻省理工学院年获美国麻省理工学院博士头衔,现为美国加利福博士头衔,现为美国加利福尼亚州大学经济学教授。尼亚州大学经济学教授。迈克尔迈克尔斯彭斯斯彭斯19481948年生于美国的新泽西,年生于美国的新泽西,19721972
43、年获美国哈佛大学博士年获美国哈佛大学博士头衔,现兼任美国哈佛和斯头衔,现兼任美国哈佛和斯坦福两所大学的教授。坦福两所大学的教授。第66页,本讲稿共82页2005年诺贝尔经济学奖获得者年诺贝尔经济学奖获得者以色列经济学家罗伯特奥曼罗伯特奥曼(Robert J.Aumann)和美国经济学家托马斯托马斯谢林谢林(Thomas C.Thomas C.SchellingSchelling)获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。第67页,本讲稿共82页 罗伯特罗伯特奥曼奥曼 托马斯托马斯谢林谢林2005年诺贝尔经济学奖获得者第68页,本讲稿共82页2007年10月15
44、日,瑞典皇家科学院宣布,将2007年诺贝尔经济学奖授予莱昂尼德莱昂尼德赫维奇、埃里克赫维奇、埃里克马斯金和罗杰马斯金和罗杰迈尔森迈尔森3 3名美国经济学家,以表彰他们在创立和发展“机制设计理论”方面所作的贡献。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效。此外,借助“机制设计理论”,人们还可以确定最佳和最有效的资源分配方式。2002007 7年诺贝尔经济学奖获得者年诺贝尔经济学奖获得者第69页,本讲稿共82页莱昂尼德莱昂尼德赫维奇赫维奇 埃里克埃里克马斯金马斯金 罗杰罗杰迈尔森迈尔森2007年诺贝尔经济学奖获得者第70页,本讲稿共82页五、主要参考
45、文献第71页,本讲稿共82页王则柯、李杰编著,博弈论教程,中国人民大学出版社,2004年版。张维迎著,博弈论与信息经济学,上海三联书店、上海人民出版社,1996年版。Roger B.Myerson著:Game Theory(原文版、译文版),中国经济出版社,2001年版。艾里克.拉斯缪森(Eric Rasmusen)著,博弈与信息:博弈论概论,北京大学出版社,2003年版。因内思马可-斯达德勒,J.大卫佩雷斯-卡斯特里罗著,信息经济学引论:激励与合约,上海财经大学出版社,2004年版。施锡铨编著,博弈论上海财大出版社,2000年版。谢识予编著,经济博弈论,复旦大学出版社,2002年版。谢识予主
46、编,经济博弈论习题指南,复旦大学出版社,2003年版。主要参考文献第72页,本讲稿共82页六、案例分析案例分析第73页,本讲稿共82页游戏规则:给你两个师的兵力,攻克敌人占据的一座城市,敌军的守备力量是三个师,规定双方的兵力只能是整师调动。通往城市的道路只有两条。当你发起进攻,只要你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或相等,则失败。问题(1)如何制定攻城方案?(2)成功的可能性有多大?实力与策略:诺曼底战役模拟实力与策略:诺曼底战役模拟第74页,本讲稿共82页敌方布防方案敌方布防方案A:三个师驻守甲方向;B:两师驻守甲方向,一师驻守乙方向;C:一师驻守甲方向,两师驻守乙方向;
47、D:三个师都驻守乙方向第75页,本讲稿共82页我方部署方案我方部署方案a:集中两个师的兵力从甲方向攻击;b:兵分两路,一师从甲方向,另一师从乙方向,同时发起攻击;c:集中两个师的兵力从乙方向攻击。第76页,本讲稿共82页诺曼底战役攻防作业演练诺曼底战役攻防作业演练-+-+-+-+-+-+-+-+-+-+敌军我军ABCDabc第77页,本讲稿共82页诺曼底战役攻防作业演练诺曼底战役攻防作业演练-+-+-+敌军我军BCac第78页,本讲稿共82页制度安排与博弈均衡:抓钱博弈制度安排与博弈均衡:抓钱博弈动态变化一般用博弈树表示制度安排不同,均衡结果不同第79页,本讲稿共82页利益一致的利益一致的“抓钱博弈抓钱博弈”甲乙甲乙不拿不拿不拿不拿拿拿拿拿(1,1)(2,2)(3,3)(4,4)(5,5)制度安排与博弈均衡:抓钱博弈第80页,本讲稿共82页甲乙甲乙不拿不拿不拿不拿拿拿拿拿(2,0)(0,4)(6,0)(0,8)(10,0)“你死我活你死我活”的的“抓钱博弈抓钱博弈”制度安排与博弈均衡:抓钱博弈第81页,本讲稿共82页甲乙甲乙不拿不拿不拿不拿拿拿拿拿(2,0)(1,3)(4,2)(3,5)(6,4)“温和对抗温和对抗”的的“抓钱博弈抓钱博弈”制度安排与博弈均衡:抓钱博弈第82页,本讲稿共82页
限制150内