MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡课件.ppt
《MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡课件.ppt》由会员分享,可在线阅读,更多相关《MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡课件.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Page 1博博 弈弈 论论(Game Theory)MBAMBA必修课必修课必修课必修课Page 2目录目录第第部分部分 博弈论导论博弈论导论 案例案例 诺贝尔经济学奖与博弈论诺贝尔经济学奖与博弈论第第部分部分 博弈论与纳什均衡博弈论与纳什均衡 基本概念(策略、局中人)与基本概念(策略、局中人)与 分类分类 囚徒困境及延伸(合作博弈、口头承诺)囚徒困境及延伸(合作博弈、口头承诺)智猪博弈及延伸智猪博弈及延伸 纳什均衡、零和博弈纳什均衡、零和博弈第第部分部分 博弈论与其他三类博弈博弈论与其他三类博弈第第部分部分 博弈论与信息(与机制设计)博弈论与信息(与机制设计)信息甄别信息甄别 道德风险和逆
2、向选择道德风险和逆向选择 Page 3 从从1到到100之间选择一个号码填到下面之间选择一个号码填到下面的方框内,不要让你同桌看到,我们会计的方框内,不要让你同桌看到,我们会计算全班的平均数,谁选的数字最接近平均算全班的平均数,谁选的数字最接近平均数的三分之二,谁就是赢家,赢家的奖金数的三分之二,谁就是赢家,赢家的奖金是是5分的平时分减去他所选数和平均数的分的平时分减去他所选数和平均数的三分之二之差的百分之一。三分之二之差的百分之一。游戏游戏 选数字选数字Page 4 为了让大家都听明白,我举一个例为了让大家都听明白,我举一个例子。三个同学分别选了子。三个同学分别选了25,5,6025,5,6
3、0,于是,于是25+5+60=9025+5+60=90平均数是平均数是3030,平均数的三分,平均数的三分之二是之二是2020,选,选2525的是赢家,的是赢家,他的奖金是他的奖金是5 5分分减减0.050.05分分,就是就是4.954.95分。分。Page 5 假设每个人都选择假设每个人都选择100100,平均数,平均数1001002/32/366.6666.66。所以不能选择所以不能选择67-10067-100之间的数(严格劣势策略)。现之间的数(严格劣势策略)。现实中有两名学生选择了。实中有两名学生选择了。剔除了剔除了step1step1中的严格劣势策略后,重复迭代,中的严格劣势策略后,
4、重复迭代,66662/32/34444。所以不能选择。所以不能选择44-6744-67之间的数(弱劣势之间的数(弱劣势策略)。现实中有四名学生选择了。策略)。现实中有四名学生选择了。解决方案解决方案Page 6解决方案解决方案 442/329,所以不能选择,所以不能选择29-44之间的数。现实中之间的数。现实中有有13个左右选择了个左右选择了30-34区间。选择这个数区间的学生区间。选择这个数区间的学生想法是想法是1-100平均数是平均数是50,502/333,所以选择,所以选择33附附近的数可能比较接近。这些学生低估了同班同学的智商。近的数可能比较接近。这些学生低估了同班同学的智商。292/
5、319,所以不能选择19-29之间的数。现实中有12个选择了。选择这个区间的学生就像螳螂捕蝉中的螳螂,却没有想到还有更多的黄雀在后。.Page 7解决方案解决方案 这么一直迭代下去,理论上如果所有学生都是理这么一直迭代下去,理论上如果所有学生都是理性人。平均数应当是性人。平均数应当是1 1。应该说选择了。应该说选择了1 1的学生都看的学生都看出了这个博弈的窍门。但是他们的选择不是最接近出了这个博弈的窍门。但是他们的选择不是最接近平均数的。因为在现实中不可能所有人都是理性人。平均数的。因为在现实中不可能所有人都是理性人。最终最终1212是最接近平均数是最接近平均数2/32/3的数。的数。Page
6、 8案例案例囚徒困境囚徒困境 两个嫌疑犯甲和乙作案后被警察抓住,分别关在不同的两个嫌疑犯甲和乙作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察将两人分别警察将两人分别置于两间房间分开审讯置于两间房间分开审讯:如果两人都抵:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。如何选择?如何选择?Page 9一、博弈的要素的要素v1、参与人、参与
7、人 playersv 一个博弈中的决策主体,他的目的是通过选择行动一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用水平)。参与人可能(或战略)以最大化自己的支付(效用水平)。参与人可能是自然人,也可能是团体,如企业,国家等。囚徒困境中是自然人,也可能是团体,如企业,国家等。囚徒困境中甲甲和乙是参与博弈的人,称为和乙是参与博弈的人,称为“局中人局中人”。v 重要的是:每个参与人必须有可供选择的行动和一个重要的是:每个参与人必须有可供选择的行动和一个很好定义的偏好函数。不做决策的被动主体只能被当作环境很好定义的偏好函数。不做决策的被动主体只能被当作环境参数。参数。Pa
8、ge 102、行动、行动 ACTIONS OR MOVES 参与人在博弈的某个时点的决策变量。参与人在博弈的某个时点的决策变量。(坦白)坦白)N个参与人的行动的有序集称为行动组合个参与人的行动的有序集称为行动组合 (坦白,抵赖)(坦白,抵赖)Page 113、信息、信息 information 参与人有关博弈的知识,特别是有关自然的选择,其他参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。参与人的特征和行动的知识。-1,-1-10,00,-10-8,-8囚徒甲 坦白抵赖坦白抵赖 囚徒乙囚徒乙 表表中中每每一一个个小小方方格格内内的的数数字字被被称称为为局局中中人人的的
9、支支付付,其其中中左左边边的的数数字字代代表表甲甲的的支支付付,右右边边的的是是乙乙的的支支付付。表表1中中的的双双变变量矩阵称为博弈支付矩阵。量矩阵称为博弈支付矩阵。Page 124、战略、战略strategies 参与人在给定信息集的情况下的行动规则,它规定参与参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。人在什么时候选择什么行动。战略与行动:战略是行动的规则而不是行动本身。战略与行动:战略是行动的规则而不是行动本身。在静态博弈中,战略和行动是相同的。在静态博弈中,战略和行动是相同的。战略必须是完备的,要给出参与人在每一种可想象得到战略必须是完备的,要给出参与人
10、在每一种可想象得到的情况下的行动选择。的情况下的行动选择。Page 135、支付、支付payoff(效用(效用utility)在一个特定的战略组合下参与人得到的确定效用水平,在一个特定的战略组合下参与人得到的确定效用水平,或是指参与人得到的期望效用水平。或是指参与人得到的期望效用水平。均衡均衡equilibrium:指所有参与人的最优战略的组合。指所有参与人的最优战略的组合。-1,-1-10,00,-10-8,-8囚徒甲 坦白抵赖坦白抵赖 囚徒乙囚徒乙Page 14二、分类 合作与非合作合作与非合作信息、动态信息、动态 完全信息静态、动态完全信息静态、动态 不完全信息静态、动态不完全信息静态、
11、动态Page 15非合作与合作非合作与合作 博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈力的协议。倘若不能,则称非合作博弈Non-Cooperative Game。合作博弈强调的是集体主义,团体理性合作博弈强调的是集体主义,团体理性Collective Rationality,是效率、公平、公正。是效率、公平、公正。非合作博弈主要研究人们在利益相互影响的局势中如何选择
12、策略使非合作博弈主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。均衡。Page 16信息和动态分类信息和动态分类静态静态动态动态完全完全信息信息完全信息静态博弈;完全信息静态博弈;纳什均衡;纳什均衡;Nash(1950)完
13、全信息动态博弈;完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾子博弈精炼纳什均衡;泽尔腾(1965)不完全不完全信息信息不完全信息静态博弈;贝叶斯纳不完全信息静态博弈;贝叶斯纳什均衡;什均衡;海萨尼(海萨尼(1967-1968)不完全信息动态博弈,不完全信息动态博弈,精炼贝叶斯纳什均衡;精炼贝叶斯纳什均衡;泽尔腾泽尔腾(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)Page 171、囚徒困境详解、囚徒困境详解称为占优策略,或占优于其他策略称为占优策略,或占优于其他策略 三、囚徒困境详解和延伸三、囚徒困境详解和延伸-1,-1-10,00,-10-8,-
14、8囚徒甲 坦白抵赖坦白抵赖 囚徒乙囚徒乙Page 18 -1,-1-10,00,-10-8,-8囚徒甲 坦白抵赖坦白抵赖 囚徒乙囚徒乙 每个参与人组成的优势策略称为占优策略均衡。每个参与人组成的优势策略称为占优策略均衡。甲甲和和乙乙都都不不会会选选择择劣劣战战略略“抵抵赖赖”,称称为为“剔剔除除劣劣战战略略的的占占优优战战略均衡略均衡”。其中。其中“坦白坦白”是占优于是占优于(优于优于)“抵赖抵赖”的占优战略。的占优战略。占优策略均衡占优策略均衡占优策略均衡占优策略均衡Page 192、囚徒困境特点、囚徒困境特点利己、理性利己、理性非合作非合作存在严格劣策略存在严格劣策略 囚徒困境假定每个参与
15、者(即囚徒困境假定每个参与者(即“囚徒囚徒”)都是利己的,)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为策略要低的话,此策略称为“严格劣势严格劣势”,理性的参与者绝,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。可完全按照自己意愿选择策略。Page 203、囚徒困境结论、囚徒困境结论结论结论1 不要选择严格劣势策略
16、,因为选择优势策略,我们每次都能得到更好的收益.结论结论2 汝欲得之,必先知之。结论结论3 站在别人的立场上去分析他们会怎么做。Page 21思考思考1 1 如果你是个如果你是个“恶魔饭桶恶魔饭桶”,你的对手是个,你的对手是个“愤怒天使愤怒天使”,这种情,这种情况下我们该怎么办?况下我们该怎么办?21博弈论信息整理表格如下 愤怒天使 恶魔饭桶 0,0 3,-3 -1,1 1,1Page 2222 正确答案选 ,因为 是优势策略,是劣势策略。大揭秘大揭秘Page 23 在位者在位者进入者进入者默许默许斗争斗争进入进入40,50-10,0不进入不进入0,3000,300思考思考2 市场进入阻挠市场
17、进入阻挠(静态)(静态)Page 24 价格竞争 两家互相打价格战的企业,可能会陷入囚徒困两家互相打价格战的企业,可能会陷入囚徒困境。为什么?境。为什么?因为不管你的对手怎么定价,你总有想削弱他们的动机。如果双因为不管你的对手怎么定价,你总有想削弱他们的动机。如果双方都采取这种策略,那么价格将会下降到边际成本,行业利润将会遭方都采取这种策略,那么价格将会下降到边际成本,行业利润将会遭受损失。如果两家企业相互削弱,最终会压低价格,这对消费者有利,受损失。如果两家企业相互削弱,最终会压低价格,这对消费者有利,但对企业不利。但对企业不利。思考思考3Page 25 假如有一个可利用的公共资源,比如是个
18、假如有一个可利用的公共资源,比如是个鱼群,或者是新鲜空气,这其中也会导致囚徒鱼群,或者是新鲜空气,这其中也会导致囚徒困境。你有过量捕鱼的动机。为什么呢?困境。你有过量捕鱼的动机。为什么呢?如果其他国家拥有这个鱼群,假设这个鱼群在大西洋,如果其如果其他国家拥有这个鱼群,假设这个鱼群在大西洋,如果其他国家打算正常捕捞,你应该也会正常捕捞。如果其他国家不打算他国家打算正常捕捞,你应该也会正常捕捞。如果其他国家不打算减少捕捞量,那么你现在就想把鱼捞出来,因为没准明天就会没鱼减少捕捞量,那么你现在就想把鱼捞出来,因为没准明天就会没鱼可捞了。可捞了。思考思考4Page 26 全球变暖和碳排放问题 大家能理
19、解碳排放也是一种囚徒困境吗?大家能理解碳排放也是一种囚徒困境吗?思考思考5Page 27(1)政府要负责修建公共设施)政府要负责修建公共设施 设设想想有有两两户户相相居居为为邻邻的的农农家家,十十分分需需要要有有一一条条好好路路从从居居住住地地通通往往公公路路。修修一一条条路路的的成成本本为为4,每每个个农农家家从从修修好好的的好好路路上上获获得得的的好好处处为为3。如如果果两两户户居居民民共共同同出出资资联联合合修修路路,并并平平均均分分摊摊修修路路成成本本,则则每每户户居居民民获获得得净净的的好好处处(支支付付)为为3-4/2=1;当当只只有有一一户户人人家家单单独独出出资资修修路路时时,
20、修修路路的居民获得的支付为的居民获得的支付为3-4=-1(亏损)(亏损)“搭搭便便车车”不不出出资资但但仍仍然然可可以以使使用用修修好好的的路路的的另一户人家获得支付另一户人家获得支付3-0=3,见下表。,见下表。4、囚徒困境案例、囚徒困境案例Page 28 修路博弈修路博弈 乙乙 修修 不修不修 修修 甲甲 不修不修 1,1-1,33,-10,0Page 29 我我们们看看到到,对对甲甲和和乙乙两两家家居居民民来来说说,“修修路路”都都是是劣战略,因而他们都不会出资修路。劣战略,因而他们都不会出资修路。这这里里,为为了了解解决决这这条条新新路路的的建建设设问问题题,需需要要政政府府强强制制性
21、性地地分分别别向向每每家家征征税税2单单位位,然然后后投投入入4单单位位资资金金修修好好这这条条对对大大家家都都有有好好处处的的路路,并并使使两两家家居居民民的的生生活活水水平平都都得到改善。得到改善。这这就就是是我我们们看看到到的的为为什什么么大大多多数数路路、桥桥等等公公共共设设施施都都是是由由政政府府出出资资修修建建的的原原因因。同同样样的的道道理理,国国防防、教教育育、社社会会保保障障,环环境境卫卫生生等等都都由由政政府府承承担担资资金金投投入入,私私人人一一般没有积极性承担这方面服务的积极性和能力。般没有积极性承担这方面服务的积极性和能力。Page 30 在在18世世纪纪以以前前,英
22、英国国苏苏格格兰兰地地区区有有大大量量的的草草地地,其其产产权权没没有有界界定定,属属公公共共资资源源,大大家家都都可可以以自自由由地地在在那那里里放放牧牧。草草地地属属于于“可可再再生生资资源源”,如如果果限限制制放放牧牧的的数数量量,没没有有被被牛牛羊羊吃吃掉掉的的剩剩余余草草皮皮还还会会重重新新长长出出大大面面积积草草场场,但但如如果果不不限限制制放放牧牧规规模模,过过多多的的牛牛羊羊将将草草吃吃得得一一光光二二净净,则今后不会再有新草生长出来,草场就会消失。则今后不会再有新草生长出来,草场就会消失。案例(案例(2)苏格兰的草地消失了)苏格兰的草地消失了Page 31 由由于于草草地地的
23、的产产权权没没有有界界定定,政政府府也也没没有有对对放放牧牧作作出出规规模模限限制制,每每家家牧牧民民都都会会如如此此盘盘算算:如如果果其其他他牧牧民民不不约约束束自自己己的的放放牧牧规规模模,让让自自己己的的牛牛羊羊过过多多地地到到草草地地上上吃吃草草,那那么么,我我自自己己一一家家约约束束自自己己的的放放牧牧规规模模规规模模对对保保护护草草场场的的贡贡献献是是微微乎乎其其微微的的,不不会会使使草草场场免免于于破破坏坏;相相反反,我我也也加加入入过过度度放放牧牧的的行行列列,至至少少在在草草场场消消失失之之前前还还会会获获得得一部分短期的收益。一部分短期的收益。Page 32 如如果果其其他
24、他牧牧民民约约束束放放牧牧规规模模,我我单单独独一一家家人人过过度度放放牧牧不不会会破破坏坏广广褒褒的的牧牧场场,但但自自己己却却获获得得了了高高额额的的收收益益。因因此此,任任何何一一位位牧牧民民的的结结论论都都会会是是:无无论论其其他他牧牧民民是是否否过过度度放放牧牧,我我选选择择“约约束束自自己己的的放放牧牧规规模模”都都是是劣劣战战略略,从从而而被被剔剔除除。大大家家最最终终都都会会选选择择过过度度放放牧牧,结结果果导导致致草草地消失,生态破坏。地消失,生态破坏。Page 33内蒙古草原的沙漠化内蒙古草原的沙漠化Page 34 渤海中的鱼愈来愈少了,工业化中的大气及河流污渤海中的鱼愈来
25、愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的海洋捕鱼中,每年有一段时间的“休渔期休渔期”,此时禁止,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体保护幼鱼的生存。又如在三峡库区,为了保护库
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 MBA 必修 课程 第二 部分 穷途 困境 均衡 课件
限制150内