《第博弈论初步课件.pptx》由会员分享,可在线阅读,更多相关《第博弈论初步课件.pptx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1案例案例1 1情况:1、四个男生在酒吧里2、共有一个金发女郎和四个黑发女郎3、每个男生都想和金发女郎约会,但也不想最后连一个约会对象也没有4、第一次的上前搭讪如果约会失败,再转而追求别的女生,该女生都不会接受(没人愿意当“次品”)四个男生首先会如何选择?第1页/共35页2案例案例2 2“田忌赛马田忌赛马”齐威王与大将田忌赛马,双方各出三匹马,一对一比赛三场,三局两胜。由于齐威王的上等马、中等马和下等马分别跑得比田忌的三匹马快,所以田忌本应是以0:3告负。然而谋士孙膑给田忌出主意,让自己的下等马去与齐威王的上等马比,而让上等马去赢齐威王的中等马,让中等马去赢齐威王的下等马,这样便能以2:1取胜
2、。如果我们进一步设想,如果齐威王知道了田忌的策略后,便会在以后的比赛中也更改出马的次序,这时田忌的出马次序也应改动。出马次序怎样才是最合理的呢?双方会根据对方作出决策。这便是“博弈论”研究的问题。又如:剪刀、石头、布第2页/共35页3博弈论1994、1996、2005的诺贝尔经济学奖都是因几位经济学家在博弈论方面的贡献而获得。我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。被应用于政治、外交、军事、社会、经济等研究领域。第3页/共35页4本章内容本章内容 什么是博弈论?博弈的分类 博弈均衡 博弈论的启示第4页/共35页5一、什么是博弈论1 1、“博弈论”的定义弈下棋;博弈
3、论(Game TheoryGame Theory)主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,理性的行为主体如何决策以及这种决策的均衡等问题。博弈论是智斗的游戏。第5页/共35页62 2、博弈的基本要素参与者(局中人/博弈方):可以有一个、二个、多个;也可以是个人、企业、国家。策略:博弈中的任一参加者针对其他参加者的可能的行为,所采取的行为原则和应对办法。得益:博弈的结局。参与者选择策略,得到报酬。每一个参与者的报酬都是所有参与者各自所选择策略的共同作用的结果。得益不仅取决于自己的策略得益不仅取决于自己的策略选择,还取决于其他参加者的策略选择。选择,还取决于其他参加者的策
4、略选择。(得益矩阵)博弈均衡:博弈中的所有参与者从自我利益最大化出发的选择所组成的策略组合,每个参与者都不想改变自己策略的一种状态。第6页/共35页7案例案例3 3 囚徒困境囚徒困境警察抓住了两个犯罪嫌疑人,但证据不足。此时量刑取决于两者对犯罪事实的供认。参与者:囚徒A、囚徒B策略:交代、不交代得益矩阵:均衡?囚徒A囚徒B交代交代不交代不交代交代交代-5-5,-5-5 0 0,-8-8不交代不交代-8-8,0 0-1-1,-1-1第7页/共35页8二、博弈的分类二、博弈的分类合作博弈与非合作博弈零和博弈、常和博弈与变和博弈静态博弈与动态博弈完全信息博弈与不完全信息博弈(教材P96P96)第8页
5、/共35页9三、上策均衡与纳什均衡三、上策均衡与纳什均衡博弈均衡指博弈中的所有参与者从自我利益最大化出发的选择所组成的策略组合,每个参与者都不想改变自己策略的一种状态。(一)上策均衡上策:无论其他参与者采取什么策略,其参与者的唯一的最优策略就是他的占优策略。(交代就是囚徒的上策)上策均衡:由博弈中的所有参与者的占优策略组合所构成的均衡。也就是说,博弈各方采取的策略都为上策时,这样的策略组合就构成上策均衡。第9页/共35页10案例案例3 3 囚徒困境囚徒困境囚徒A囚徒B交代交代不交代不交代交代交代-5-5,-5-5 0 0,-8-8不交代不交代-8-8,0 0-1-1,-1-1寻找方法:在得益矩
6、阵中划横线(找唯一的两个数字都被划上横线的组合)。只要每一个参与者都具有上策,那么该博弈就一定存在上策均衡。第10页/共35页11囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。囚徒困境现象在现实生活中比比皆是。比如,公共楼道占用的问题。住户在公共楼道里堆满了杂物,结果大家都极不方便。但你如果不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。但占用的结果却最终损害了大家的利
7、益。理性的冷漠斗鸡博弈:上策就是要在气势上压倒对方(显示出破釜沉舟、背水一战),以迫使对方退却。案例案例3 3 囚徒困境囚徒困境第11页/共35页12每个人如果完全利己,都为自己考虑,事态的结果会对大家都不利。例如:不遵守红绿灯导致交通堵塞,车毁人亡;不排队、插队导致人流拥挤,影响效率;(地震、火灾时人员的疏散)相反,如果多为对方考虑,则对大家会带来意想不到的好处。囚徒困境的启示囚徒困境的启示第12页/共35页13其他上策均衡案例案例案例4 4 厂商对厂商对“做广告做广告”策略的取舍策略的取舍(教材P97)该例中的上策均衡:(做广告,做广告)厂商A厂商B做广告做广告不做广告不做广告做广告做广告
8、1010,5 51515,0 0不做广告不做广告 6 6,8 81010,2 2第13页/共35页14其他上策均衡案例案例案例5 5 斗鸡博弈斗鸡博弈两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,上策就是要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。第14页/共35页15(二)纳什均衡上策的条件极其苛刻。在有的博弈中,并非每一个参与者都存在上策,但仍可以达到博弈均衡。(教材P98)厂商A厂商B做广告做广告不做广告不做广告做广告做广告1010,5 51414
9、,0 0不做广告不做广告 6 6,8 82020,2 2该例中,A不存在上策,但B存在一个上策即做广告。(做广告,做广告)是一个纳什均衡。第15页/共35页16纳什均衡:在给定竞争对手的选择行为后,博弈方选择了它所能选择的最好的策略。如果其他参与者不改变策略,任何一个参与者都不会改变自己的策略。每一个上策均衡一定是纳什均衡,但并非每一个纳什均衡都是上策均衡。上策均衡是纳什均衡的特例。因为上策均衡意味着无论其他参与者采取何种策略都是最优的。而纳什均衡是在给定竞争对手策略的条件下才是最优。(二)纳什均衡第16页/共35页17案例案例6 6 智猪博弈智猪博弈不考虑揿按钮的耗费时:其他纳什均衡案例食槽
10、1010大猪小猪等待等待行动行动等待等待0 0,0 09 9,1 1行动行动4 4,6 67 7,3 3第17页/共35页18案例案例6 6 智猪博弈智猪博弈 每揿一次按钮耗费相当于2 2单位的猪食:其他纳什均衡案例食槽1010大猪小猪等待等待行动行动等待等待0 0,0 09 9,-1-1行动行动2 2,6 65 5,1 1该例中,大猪不存在上策,小猪存在上策即等待。(行动,等待)是一个纳什均衡。第18页/共35页19智猪博弈大猪知道小猪总是会选择等待,无奈之下只好去揿按钮。即所谓“搭便车”现象:大股东行使监督上市公司的职责,而小股东则坐享这种监督带来的利益;爱清洁的人经常打扫宿舍,其他人搭便
11、车;山村中出外跑运输、做生意的人掏钱修路,其他村民走修好的路。现实社会中如能创造出更多的大猪,发展的速度就会更快。第19页/共35页20非完全信息静态均衡:建筑工程招投标不同投标者之间进行的就是一场博弈。每个投标者在对其他投标者的出价不得而知的情况下将自己的标价写下装入信封,一同交给政府,信封打开后,政府选择最低者为中标者。报价越低,中标的可能性越大,但同时利润也就越小。每个投标人的标价依赖于它的生产成本。让更多的企业参加投标,对政府是一件有利的事情。非完全信息动态均衡:黔驴技穷1:叫了一声;2:踢了一脚;3:被老虎吃掉老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。事实上,毛
12、驴的行为也是很理性的,它知道自己的技能有限,总想掩藏自己的真实技能。老虎在最终了解了毛驴的真实本领后,选择了最优策略:吃掉毛驴。又如:员工试用期纳什均衡:完全信息静态均衡第20页/共35页21纳什均衡解的非唯一性(教材P99P99)潜在企业在位企业允许允许不允许不允许进入进入4040,5050-10-10,5 5不进入不进入0 0,200200 0 0,200200该例中,存在两个纳什均衡:(进入,允许)(不进入,不允许)第21页/共35页22(三)子博弈精炼纳什均衡 在位企业的报复策略是一种不可置信的威胁。潜在企业应该不会被这种威胁所吓倒,即这时就只有一个纳什均衡,那便是:潜在企业进入、在位
13、企业允许。当潜在企业选择进入策略之后,在位企业面临着策略选择来与之进行博弈。这一博弈是在潜在企业选择进入策略的母博弈基础上展开的,因而被称为“子博弈”。在纳什均衡的基础上定义“子博弈精炼纳什均衡”。这个概念的中心意义是将纳什均衡中包含的不可置信的威胁策略剔除出去。第22页/共35页23子博弈精炼纳什均衡:完全信息动态博弈 这个概念的中心意义是把不可置信的威胁战略剔除出去,决策者要“随机应变”、“一切向前看”、“摸着石头过河”,而不是固守一个陈旧的战略。不可置信的威胁引出“承诺行动”,当事人使自己的威胁战略变得可置信的行动,若不施行这种威胁就会遭受更大的损失。例如“破釜沉舟”、“孤注一掷”。第2
14、3页/共35页24案例案例7 7 父母威胁女儿交男友父母威胁女儿交男友 父母不同意女儿所交的男友,威胁女儿说:“如果你再同他交往,我们就与你断绝关系。”但这样的威胁往往是不可信的。对爱情执着的聪明女儿会置父母的不可置信的威胁于不顾,继续与男友交往甚至最终与之结婚,父母最后也会承认那个当初他们并不喜欢的女婿。这个结果便是剔除了不可置信的威胁后的“纳什均衡”,这就是子博弈精炼纳什均衡。第24页/共35页25四、重复博弈四、重复博弈重复博弈(repeated games)(repeated games):是指同一种结构的博弈反复进行所构成的博弈过程。它属于动态博弈的范畴。先看寡头厂商的一次静态博弈:
15、寡头甲寡头乙合作合作不合作不合作合作合作1010,1010 6 6,1212不合作不合作1212,6 6 8 8,8 8该例中,上策均衡:(不合作,不合作)第25页/共35页26案例案例8 寡头厂商的博弈寡头厂商的博弈在一次静态博弈中,卡特尔组织中每个寡头自身上策的选择却导致了整体的最坏结局。他们想合作来改善自己的境况,但又害怕被其他参与者欺骗而使自身落到更落的状况。一次性博弈中的任何欺骗和违约行为都不会遭到报复,寡头间的不合作或暗地悄悄违约通常是难以避免的。思考:如果换成在重复博弈下,情况会是什么样呢?第26页/共35页27案例案例8 寡头厂商的博弈寡头厂商的博弈在无限期重复博弈中,对于任何
16、一个参与者的欺骗和违约行为,其他叁与者总会有机会给予报复。对合作的成员,就继续保持合作;对背弃合作协议一次的成员,就再也不与其合作,采取违约或欺骗的寡头可能永远丧失与人合作的机会,并遭受长期的惨重损失。正是因为在无限次重复博弈中报复的机会总是存在,所有寡头都不会采取违约或欺骗的行为。又例如“买菜”。思考:如果换成有限期重复博弈,情况又会是什么样呢?第27页/共35页28案例案例8 寡头厂商的博弈寡头厂商的博弈在有限期重复博弈中,就得不到上述结论。假设博弈只重复5 5次,用逆推法。由于第5 5期是最后一期,以后不会再有报复的机会,那么第5 5期和一次性静态博弈一样。第5 5期的寡头欺骗或违约是不
17、可能被报复的,因为必然选择不合作。逆推到第4 4期,每个寡头都推知下一期肯定是不合作,所以他们在第4 4期也不会合作。如此一直逆推到博弈开始的第1 1期,每个寡头都会采取违约或欺骗的不合作策略。因此,在有限期重复博弈中,寡头的纳什均衡是不合作。第28页/共35页29案例案例8 寡头厂商的博弈寡头厂商的博弈思考:现实生活中的参与者的博弈总是有限期的,是否意味着寡头之间的长期合作不可能实现?其实,无限期重复的主要特征在于每一个参与者都不能准备的确定哪一期是末期,每一个参与者在每一期都认定下一期还要继续相互打交道,欺骗或违约行为总会被报复的这一威胁使得每一个参与者都会把合作策略维持下去。第29页/共
18、35页30案例案例9 9 分粥的故事分粥的故事规则一:指定一个人负责分粥。结果是权力腐败,换人的结果总是分粥的人最多最好。规则二:指定一名分粥人士和监督人士。结果是从权力制约走向权力合作。规则三:大家轮流主持分粥。结果是轮值的这天急不可耐。规则四:民主选举一个信得过的人分粥。结果在溜须拍马中放弃原则。规则五:民主选举一个分粥委员会和监督委员会。结果是效率太低,粥凉了还在讨论。规则六:每人均有一票否决权。结果是心态失衡,谁也喝不上。第30页/共35页31规则七:每个人轮流值日,先分好,再领粥;但分粥的那个人要最后一个领粥。由此可见,一个好的制度非常重要,好的制度也是在不断实践中完善的。第31页/
19、共35页32五、序列博弈五、序列博弈序列博弈(sequential games)(sequential games):是指参与者选择策略有时间先后的博弈形式。它也是一种典型的动态博弈。(教材P101-102P101-102)厂商1厂商2多糖型多糖型少糖型少糖型多糖型多糖型-5-5,-5-51010,2020少糖型少糖型2020,1010-5-5,-5-5先下手为强!第32页/共35页33关于博弈竞争策略的归纳上策均衡:不论对方如何,采取的最优策略纳什均衡:给定对方选择,采取的最优策略精炼纳什均衡:剔除不可置信威胁的最优策略重复博弈:通过信息传递,反复的动态博弈序列博弈:先下手为强的占先行动优势策略第33页/共35页34六、博弈论对我们的启示六、博弈论对我们的启示 1 1、合作博弈有利于整个社会福利的增加;2 2、为寻求合作,需要耐心的重复博弈;3 3、制定合理的规则更重要。学点博弈论收益无穷。无论是企业管理、企业竞争,还是日常生活行为,都可以用博弈来概括。博弈论是现代经济学中一个激荡人心的研究领域,好的东西也是难的东西,博弈论的理论很深,只有具有很强的逻辑思维能力才能理解它。在企业管理、企业竞争乃至于日常生活中,如果没有一点博弈意识,恐怕难于占得先机,取得主动,与成功为伍。第34页/共35页35感谢观看!第35页/共35页
限制150内