《第九章博弈论初步张优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第九章博弈论初步张优秀PPT.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章博弈论初步张第一页,本课件共有31页1.2.2 赌胜博弈一、田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田田 忌忌齐齐威威王王得益矩阵第二页,本课件共有31页第一节、博弈论的基本概念坦白不坦白坦白-5 -5-1 -7不坦白-7 -1-2 -2嫌犯A嫌犯B一、囚犯困境(
2、prisoners dilemma)囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。上表给出了囚徒困境模型的表被关在不同的屋子里审讯。上表给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或不坦白。表中每一格述。每个囚徒都有两种选择:坦白或不坦白。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。的两个数字代表对应两个囚徒选择组合下各自的刑期。第三页,本课件共有31页二、博弈的三个基本要素n1、参与者参与者(player)(博奕方、局中人、对局者)(博奕方、局中人、对局者):即有哪些人参与博弈。一般至少有两个参与:即
3、有哪些人参与博弈。一般至少有两个参与者。可以是个人,团体,集团。者。可以是个人,团体,集团。n2、策略策略(strategy):参与人在给定信息集的情:参与人在给定信息集的情况下的行动方案。囚徒况下的行动方案。囚徒A、B都只有两种行动可都只有两种行动可供选择,即供选择,即“坦白坦白”和和“不坦白不坦白”。n3、(payoff)(支付)(支付):博弈的结果给参与人:博弈的结果给参与人带来的好处。在博弈论中指一个特定策略组合带来的好处。在博弈论中指一个特定策略组合下参与人得到的下参与人得到的确定效用水平确定效用水平,或者是指参与人,或者是指参与人得到的期望效用得到的期望效用第四页,本课件共有31页
4、囚徒困境 参与人小偷 参与人策略集坦白,抵赖 参与人的支付判刑年限第五页,本课件共有31页第二节 博弈的分类及其表达方式n一、博弈的分类n(一)合作博弈与非合作博弈:是否达成协议,是,合作博弈;否非合作博弈。n(二)静态博弈与动态博弈、完全信息博弈与不完全信息博弈n静态博弈:博弈中,参与人同时选择行动或者虽不同时但后行动者不知道先行动者采取了什么策略的博弈。n动态博弈:参与人的行动有先后顺序,且后行动者知道先行动者选择的策略。n完全信息博弈:每一个参与人对所有的其他参与人的特征、战略空间及支付有准确的认识,否则就是不完全信息博弈。第六页,本课件共有31页坦白不坦白坦白-10 -10-1 -12
5、不坦白-12 -1-2 -2嫌犯A嫌犯B二、博弈的表达方式(一)战略式描述(支付矩阵表示)第七页,本课件共有31页ANBB(1/2)(1/2)开发不开发开发开发开发开发不开发不开发不开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,1)(0,0)0,8)市场需求大小N大小(0,0)(2)n(二)扩展式描述(博弈树)第八页,本课件共有31页BB坦白坦白抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白A抵赖AA坦白坦白抵赖抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白B抵赖(3)第九页,本课件共有31页第三节 完全信息静态博弈(重点)n一、占优策略均
6、衡(以不变应万变)n占优策略:占优策略:无论其他参与者采取什么策略无论其他参与者采取什么策略,某,某参与者的参与者的惟一的最优策略惟一的最优策略就是他的占优策略。就是他的占优策略。n博弈均衡:是指博弈的所有参与者都不想改变博弈均衡:是指博弈的所有参与者都不想改变自己的策略的这样一种相对静止的状态。自己的策略的这样一种相对静止的状态。n占优策略均衡占优策略均衡:由博弈中的所有参与者的占优策由博弈中的所有参与者的占优策略所构成的均衡略所构成的均衡。n房地产开发商:市场需求大的开发商而言(开发,房地产开发商:市场需求大的开发商而言(开发,开发)是占优策略均衡,开发)是占优策略均衡,第十页,本课件共有
7、31页n(1)囚犯的两难困境(prisoners dilemma)坦白不坦白坦白-10 -10-1 -12不坦白-12 -1-2 -2嫌犯A嫌犯B囚犯困境的占优策略均衡反应了个人理性与团体理性的冲突囚犯困境的占优策略均衡反应了个人理性与团体理性的冲突n占优策略均衡第十一页,本课件共有31页囚徒困境的占优策略如果两个疑犯都能够选择不坦白的话,他如果两个疑犯都能够选择不坦白的话,他们将明显地得到一个更大的收益,但由于们将明显地得到一个更大的收益,但由于两人的信息无法沟通,选择不坦白并不是两人的信息无法沟通,选择不坦白并不是两人的理性选择。对于两人而言,不管对两人的理性选择。对于两人而言,不管对方坦
8、白或是不坦白,自己选择坦白都是更方坦白或是不坦白,自己选择坦白都是更优的选择,因而,优的选择,因而,坦白,坦白坦白,坦白就是均衡就是均衡战略。战略。第十二页,本课件共有31页二、纳什均衡n纳什均衡:纳什均衡:在一个纳什均衡里,任何一个参与者都在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者均不改变不会改变自己的策略,如果其他参与者均不改变各自的策略。各自的策略。n即:给定你的策略,我的策略是最好的策略;给即:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。双方在
9、给定的策略下不愿意调整自己的策略。n博弈中双方都没有绝对的最优策略,一方的最优策博弈中双方都没有绝对的最优策略,一方的最优策略取决于对方的选择。略取决于对方的选择。第十三页,本课件共有31页囚徒困境的纳什均衡 结果(坦白,坦白)(或(8,8)。该结果称为博弈的Nash均衡。(1,1)相对于(8,8)为Pareto最优。第十四页,本课件共有31页性别战 女 足球 足球 男 芭蕾 2,1 0,0 0,0 1,2 芭蕾 性别战博弈中存在两个Nash均衡(足球,芭蕾)和(芭蕾,足球)。博弈结果(2,1)和(1,2)。第十五页,本课件共有31页n 类似的囚犯困境 排队排队 闯红灯闯红灯占优战略均衡占优战
10、略均衡占优战略均衡占优战略均衡占优战略均衡占优战略均衡第十六页,本课件共有31页纳什均衡n交通博奕开等开-10 -101 0等0 1-1 -1你他第十七页,本课件共有31页纳什均衡与占优策略均衡的关系n占优策略均衡要求任何一个参与者对于其他参与者的任何选择来说,其最优战略都是唯一的。n纳什均衡只要求任何一个参与者的最优战略选择给定的条件下,其选择的战略也是最优的。n所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定是占有战略均衡。第十八页,本课件共有31页三、寡头垄断厂商的共谋及其特征n寡头间合作的可能性。寡头间合作的可能性。n寡头间合作的方式寡头间合作的方式n卡特尔卡特尔n价格领导制价格领导
11、制n寡头间的合作是不稳定的。每一个寡头寡头间的合作是不稳定的。每一个寡头都有强烈的利己动机去背离协议,以获都有强烈的利己动机去背离协议,以获得自身的利益最大化。得自身的利益最大化。第十九页,本课件共有31页卡特尔寡头乙(合作)不降价(不合作)降价 寡头甲(合作)不降价10,10 6,12(不合作)降价 12,6 8,8 价格战价格战囚犯困境模型的扩展应用:寡头厂商合作的不稳定性囚犯困境模型的扩展应用:寡头厂商合作的不稳定性第二十页,本课件共有31页第三节第三节 重复博弈重复博弈n前面的分析是完全信息静态博弈。在寡前面的分析是完全信息静态博弈。在寡头市场上每个寡头头市场上每个寡头出自个人理性出自
12、个人理性的占优的占优策略却导致了总体和个体利益的下降。策略却导致了总体和个体利益的下降。n在重复博弈(动态博弈的一种)中上述在重复博弈(动态博弈的一种)中上述情况有可能改变。情况有可能改变。n无限次重复博弈会走出无限次重复博弈会走出“囚徒困境囚徒困境”。n有限次重复博弈中仍然会存在有限次重复博弈中仍然会存在“囚徒困囚徒困境境”。第二十一页,本课件共有31页一、重复博弈下的合作解一、重复博弈下的合作解重复博弈重复博弈:是指同样结构的博弈重复多次。如果博弈只:是指同样结构的博弈重复多次。如果博弈只是进行了一次,参与人只会关心一次性支付;但如果博弈重是进行了一次,参与人只会关心一次性支付;但如果博弈
13、重复进行,参与人可能会为长期利益暂时牺牲眼前利益从而选复进行,参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。重复博弈分析遵循一个原则择不同的策略。重复博弈分析遵循一个原则“以牙还牙以牙还牙”n有限次重复博弈:相同结构的博弈可以有限次重复进行下去。假设只做5次重复博弈,用逆推法来分析。第5轮博弈,厂商出于理性占有策略会选择不合作的违约行为,在第四轮,每个参与者都知道大家第五轮会选择不合作,所以第四轮也会选择不合作,依次类推到第一轮,仍然选择不合作。所以在有限次重复博弈中,共谋是不稳定的,占有策略均衡是(不合作,不合作)第二十二页,本课件共有31页一、重复博弈下的合作解一、重复博弈下的
14、合作解n无限次重复博弈:第一个参与者为了避免“以牙还牙”策略给自己带来的长期损失,都会首先放弃采取不合作策略,寡头厂商们的合作协议可以维持,可以走出囚犯困境。第一个参与者首先选择合作的支付为10+10+10+,首先选择不合作的支付为12+8+8+。最终厂商都会选择合作,即博弈的占有策略均衡为(合作,合作)第二十三页,本课件共有31页二、序列博弈n序列博弈:参与者选择策略有时间的先后顺序,某些对局者可以率先采取行动的博弈。此博弈中,率先采取行动的参与者会选择对自己有力的策略,先行者有一定的有利地位,即先行者优势。比如沃尔玛考先行者优势获得成功。第二十四页,本课件共有31页市场进入博弈 厂商 B
15、进入 不进入 进入厂商A 不进入不是Nash均衡-20,-2050,0 0,50 0,0第二十五页,本课件共有31页 三、动态行动下的策略行为(了解)(一)阻扰市场进入的威胁 在某一产品生产领域,一厂商(称为在位者)单独生产该产品,获得高额利润300。现有另一厂商(进入者)准备进入该产品市场。第二十六页,本课件共有31页市场进入阻扰博弈 进入者面临的选择“进入”或“不进入”;在位者面临的选择“默许”或“斗争”。第二十七页,本课件共有31页市场进入阻扰博弈 该博弈同样存在两个Nash均衡(进入,不抵制)和(不进入,抵制)。博弈结果(40,50)和(0,300)。第二十八页,本课件共有31页抵制不抵制进入-10 2010 40不进入0 400 80在位者潜在进入者n阻止市场进入的博弈该博弈同样存在两个Nash均衡:(进入,不抵制)和(不进入,不抵制)。博弈结果:(10,40)和(0,80)。第二十九页,本课件共有31页抵制不抵制进入-10 2010 40不进入0 400 80在位者潜在进入者n实行承诺的阻止市场进入的博弈可信的承诺能够阻止市场的进入,但也给厂商自身带来一定的限制 第三十页,本课件共有31页人无我有“创新战略”人有我特“差别化战略”人特我廉“低成本战略”人廉我走“多元化战略”完全信息静态博弈第三十一页,本课件共有31页
限制150内