经济博弈论管理学与财务知识分析初步.pptx
第十章博弈论初步第十章博弈论初步第一节博弈论和策略行为第一节博弈论和策略行为第二节同时博弈:纯策略均衡第二节同时博弈:纯策略均衡第三节同时博弈:混合策略博弈第三节同时博弈:混合策略博弈第四节序贯博弈第四节序贯博弈博弈论博弈论game theory 在传统经济理论中,经济主体做出决策时,不考在传统经济理论中,经济主体做出决策时,不考虑自己的选择(决策)对其他人的影响,也不考虑其虑自己的选择(决策)对其他人的影响,也不考虑其他人对自己的影响。然而,在现实经济生活中,经济他人对自己的影响。然而,在现实经济生活中,经济主体之间的行为是主体之间的行为是相互作用、相互影响的相互作用、相互影响的。博弈论博弈论game theory博弈论博弈论是研究在是研究在策略性环境策略性环境中如何进行中如何进行策略性决策策略性决策和采取和采取策略性行动策略性行动的科学。的科学。u策略性环境是指,每一个人进行的决策和采取的策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;行动都会对其他人产生影响;u策略性决策和策略性行动是指,每个人要根据其策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。他人的可能反应来决定自己的决策和行动。博弈的三个基本要素博弈的三个基本要素u参与人参与人(局中人,(局中人,players):):可以是自然人,也可以是企业、国家,还可能是甚至是若可以是自然人,也可以是企业、国家,还可能是甚至是若干个国家组成的集团(干个国家组成的集团(OPEC,欧盟)。,欧盟)。u策略策略(strategies):局中人的行动规则,它指定局中人在每种情况下应如何行局中人的行动规则,它指定局中人在每种情况下应如何行动,动,至少有两个至少有两个可供选择的策略,可供选择的策略,“相机行动方案相机行动方案”。如。如“人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我不犯人;人若犯我,我必犯人”就是一种就是一种策略:策略:“犯犯”与与“不犯不犯”就是两种不同的行动,策略则规就是两种不同的行动,策略则规定了什么时候选择定了什么时候选择“犯犯”还是还是“不犯不犯”。u支付支付(payoffs)局中人得到的效用(或期望效用),局中人得到的效用(或期望效用),局中人真正关心的东西。局中人真正关心的东西。博弈的类型博弈的类型u根据参与人的数量:二人博弈和多人博弈根据参与人的数量:二人博弈和多人博弈u根据参与人的支付情况:零和博弈和非零和博弈根据参与人的支付情况:零和博弈和非零和博弈参与人的支付总和为参与人的支付总和为0时,零和博弈,这意味着参与人的利时,零和博弈,这意味着参与人的利益在博弈是相互冲突的。益在博弈是相互冲突的。u根据参与人拥有的策略的数量的多少:有限博弈根据参与人拥有的策略的数量的多少:有限博弈和无限博弈和无限博弈u根据参与人在实施策略上是否有时间的先后(参根据参与人在实施策略上是否有时间的先后(参与人在决策时是否已经知道了其他参与人的决策):与人在决策时是否已经知道了其他参与人的决策):同时博弈和序贯博弈;静态博弈(同时博弈和序贯博弈;静态博弈(static game)和)和动态博弈(动态博弈(dynamic game)。)。同时博弈:石头、剪刀、布。同时博弈:石头、剪刀、布。序贯博弈:下棋、打麻将。序贯博弈:下棋、打麻将。一、例子:寡头博弈一、例子:寡头博弈囚徒困境囚徒困境prisoners dilemma 两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一个供认或两个确凿证据可以判他们犯了抢劫罪,除非有一个供认或两个人都供认,即使两个人都不供认,也可判他们犯盗窃物品人都供认,即使两个人都不供认,也可判他们犯盗窃物品的轻罪。的轻罪。 囚徒被分离审查,不允许他们之间互通信息,并交代囚徒被分离审查,不允许他们之间互通信息,并交代政策如下:如果两个人都供认,每个人都将因抢劫罪加盗政策如下:如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判窃罪被判2年监禁;如果两个人都拒供,则两个人都将因盗年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪及抗拒从严而被重判盗窃罪及抗拒从严而被重判5年。年。二、支付矩阵二、支付矩阵payoffs table囚徒甲囚徒甲囚徒乙囚徒乙拒供拒供供认供认拒供拒供0.5年,年,0.5年年5年,年,0年年供认供认0年,年,5年年2年,年,2年年参与人参与人策略策略支付支付寡头的囚徒困境寡头的囚徒困境厂商甲厂商甲厂商乙厂商乙不降价不降价降价降价不降价不降价500,5000,800降价降价800,0200,200厂商甲厂商甲厂商乙厂商乙合作合作不合作不合作合作合作5,61,5不合作不合作7,12,3三、条件策略和条件策略组合三、条件策略和条件策略组合把甲厂商在乙厂商选择合作条件下的最优策略即把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略,合作叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。简称条件策略。把与甲厂商的条件策略相联系的策略组合叫做把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合,甲厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。简称条件策略组合。在乙厂商选择合作的条件下:在乙厂商选择合作的条件下:条件策略:不合作条件策略:不合作条件策略组合:不合作,合作条件策略组合:不合作,合作在乙厂商选择不合作的条件下:在乙厂商选择不合作的条件下:条件策略:不合作条件策略:不合作条件策略组合:不合作,不合作条件策略组合:不合作,不合作四、纳什均衡(非合作均衡)四、纳什均衡(非合作均衡)1、博弈均衡的概念、博弈均衡的概念 当两个厂商的条件策略组合恰好相同,从而,当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时两个厂商都不再有单独改变策略的倾向时,整个,整个博弈就达到了均衡,即博弈均衡。博弈就达到了均衡,即博弈均衡。 博弈均衡是博弈各方最终选取的策略组合,博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。是博弈的最终结果,是博弈的解。四、纳什均衡四、纳什均衡2、纳什均衡的概念、纳什均衡的概念 指的是参与人的这样一种策略组合,在该策略指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。组合上,任何参与人单独改变策略都不会得到好处。或者说,在一个策略组合中,如果所有其他人都不或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人会改变自己的策略,则该策略改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。组合就是一个纳什均衡。“单独改变策略单独改变策略”是指任何一个参与人在所有其他人是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其他人也都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列同时改变策略的情况不在考虑之列。“不会得到好处不会得到好处” 是指任何一个参与人在单独改变策是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情况:略之后自己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。或者支付减少,或者支付不变。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法 先用下划线法分别表示甲厂商和乙厂商的条件先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均衡(就是找到在两个数字策略,最后确定博弈的均衡(就是找到在两个数字之下都划线的单元格即可,与这些单元格相对应的之下都划线的单元格即可,与这些单元格相对应的策略组合就是所要求的均衡策略组合)。策略组合就是所要求的均衡策略组合)。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法第一步:分解矩阵第一步:分解矩阵5172甲的支付矩阵6513乙的支付矩阵第二步:在第二步:在甲甲的支付矩阵中,找出的支付矩阵中,找出每列的最大者每列的最大者。5172甲的支付矩阵=第三步:在第三步:在乙乙的支付矩阵中,找出的支付矩阵中,找出每行的最大者每行的最大者。6513乙的支付矩阵=五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法第四步:合并矩阵第四步:合并矩阵5,61,57,12,3甲和乙共同的支付矩阵第五步:找出两个数字下均有下划线的组合。第五步:找出两个数字下均有下划线的组合。五、寻找纳什均衡的方法五、寻找纳什均衡的方法条件策略下条件策略下划线法划线法 在一个单元格中,如果两个数字之下均划有线,在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数两个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略字之下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最的动机,因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略动机,没线的数字所代表的参与人有单独改变策略的动机。的动机。六、纳什均衡的存在性、唯一性和最优性六、纳什均衡的存在性、唯一性和最优性1、存在性:在同时博弈中,(纯策略的)纳什均衡存在性:在同时博弈中,(纯策略的)纳什均衡可能存在,也可能不存在可能存在,也可能不存在。没有纳什均衡的同时博弈没有纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙左左右右上上4,69,1下下7,32,8六、纳什均衡的存在性、唯一性和最优性六、纳什均衡的存在性、唯一性和最优性2、唯一、唯一性:在纳什均衡存在的情况下,可能唯一,性:在纳什均衡存在的情况下,可能唯一,也可能不唯一。也可能不唯一。存在多重纳什均衡的同时博弈存在多重纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙左左右右上上5,61,4下下4,12,3六、纳什均衡的存在性、唯一性和最优性六、纳什均衡的存在性、唯一性和最优性3、最优性:如果纳什均衡存在,可能是最优的,也最优性:如果纳什均衡存在,可能是最优的,也可能不是最优的。可能不是最优的。存在多重纳什均衡的同时博弈存在多重纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙左左右右上上5,61,4下下4,12,3七、二人同时博弈的一般理论七、二人同时博弈的一般理论二人同时博弈的一般模型二人同时博弈的一般模型AB策略策略1策略策略2 策略策略1a11,b11a12,b12策略策略2a21,b21a22,b2211122122aaAaa的支付矩阵1121122211211222112112221121122211211222112112221121122211211222112112221. , 2. , 3. ,4. , 5. , 6. , 7. , 8. , 9. ,aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b112,b12策略策略23,b212,b22类型类型1中:中:A在策在策略略上是上是“无差异无差异”的,可以选择策略的,可以选择策略1,也可,也可能选择策略能选择策略2,结果完全相同。,结果完全相同。112112221. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b117,b12策略策略23,b211,b22类型类型2、3、4、5中:中:A在某一策在某一策略略上具有不严格的绝对优势上具有不严格的绝对优势它选择策略它选择策略1所得到的支付不会小于策略所得到的支付不会小于策略2。112112222. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b113,b12策略策略23,b211,b22类型类型2、3、4、5中:中:A在某一策在某一策略略上具有不严格的绝对优势上具有不严格的绝对优势它选择策略它选择策略1所得到的支付不会小于策略所得到的支付不会小于策略2。112112222. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b112,b12策略策略23,b211,b22类型类型2、3、4、5中:中:A在某一策略上具有不严格的绝对优势在某一策略上具有不严格的绝对优势它选择策略它选择策略1所得到的支付不会小于策略所得到的支付不会小于策略2。112112222. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b117,b12策略策略22,b211,b22类型类型6、7中:中:A在某一策略上具有严格的绝对优势在某一策略上具有严格的绝对优势它选择策略它选择策略1所得到的支付总大于策略所得到的支付总大于策略2。112112226. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b113,b12策略策略22,b211,b22类型类型6、7中:中:A在某一策略上具有严格的绝对优势在某一策略上具有严格的绝对优势它选择策略它选择策略1所得到的支付总大于策略所得到的支付总大于策略2。112112226. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b112,b12策略策略22,b211,b22类型类型6、7中:中:A在某一策略上具有严格的绝对优势在某一策略上具有严格的绝对优势它选择策略它选择策略1所得到的支付总大于策略所得到的支付总大于策略2。112112226. ,aaaa11122122aaAaa的支付矩阵AB策略策略1策略策略2 策略策略13,b112,b12策略策略22,b213,b22类型类型8、9中:中:A在某一策略上不存在绝对优势在某一策略上不存在绝对优势112112228. ,aaaaA按按“列列”,划线法,划线法B按按“行行” A的支付矩阵有的支付矩阵有9种可能,种可能,B的支付矩阵也有的支付矩阵也有9种可能,种可能,因此,整个博弈(亦即因此,整个博弈(亦即A与与B两人合在一起)的支付矩阵两人合在一起)的支付矩阵总共就有总共就有99=81种可能。种可能。 全部的纳什均衡可分为五种类型,分别有全部的纳什均衡可分为五种类型,分别有四个均衡(包括四个均衡(包括1种情况)、种情况)、三个均衡(包括三个均衡(包括12种情况)、种情况)、两个均衡(包括两个均衡(包括38种情况)、种情况)、一个均衡(包括一个均衡(包括28种情况)、种情况)、零个均衡(包括零个均衡(包括2种情况)。种情况)。一、不存在纯策略均衡时的混合策略均衡一、不存在纯策略均衡时的混合策略均衡即使纯策略的纳什均衡不存在,即使纯策略的纳什均衡不存在,相应的混合策略均衡却总会存在。相应的混合策略均衡却总会存在。1、混合策略、混合策略第一,第一,“确定性确定性”选择选择 在没有纳什均衡的同时博弈里,所有参与人对在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是策略的选择都是“确定确定”的,即某参与人在选择某个的,即某参与人在选择某个策略的时候,他不能再同时选择其他的策略,此时策略的时候,他不能再同时选择其他的策略,此时相应的条件策略也是相应的条件策略也是“确定确定”的;最后,当参与人的的;最后,当参与人的条件策略是条件策略是“确定确定”的时候,最终的博弈均衡(如果的时候,最终的博弈均衡(如果有的话)也是有的话)也是“确定确定”的。的。第二,第二,“混合性混合性”选择选择 在现实生活中,人们对策略的选择常常并不像在现实生活中,人们对策略的选择常常并不像前面所说的那样前面所说的那样“非此即彼非此即彼”,而是会以一定的可能,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一性来选择某个策略,又以另外的可能性选择另外一些策略些策略。没有纳什均衡的同时博弈没有纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙0.30.7左左右右0.6上上4,69,10.4下下7,32,8第三,第三,“混合混合”策略的概念策略的概念 把甲厂商和乙厂商原来的策略叫做把甲厂商和乙厂商原来的策略叫做“纯纯”策略,策略,把赋予这些纯策略的概率向量叫做把赋予这些纯策略的概率向量叫做“混合混合”策略策略。没有纳什均衡的同时博弈没有纳什均衡的同时博弈厂商甲厂商甲厂商乙厂商乙q1q2左左右右p1上上4,69,1p2下下7,32,8121212120,1,1,1ppqqppqq且2、混合策略组合、混合策略组合 参与人的混合策略组合是一个概率向量组合,其参与人的混合策略组合是一个概率向量组合,其中,每一个概率向量是相应参与人的一个混合策略。中,每一个概率向量是相应参与人的一个混合策略。3、期望支付、期望支付 在混合策略博弈中,对于每一个混合策略组合,在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参也存在一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。不过,与人在该混合策略组合条件下所得到的支付。不过,由于现在每个参与人都是以一定的概率来选择其纯由于现在每个参与人都是以一定的概率来选择其纯策略的,故相应的支付也就成了所谓的策略的,故相应的支付也就成了所谓的“期望支期望支付付”,即支付的期望值。,即支付的期望值。4、条件混合策略条件混合策略 利用计算期望支付的公式可以求得甲厂商和乙厂利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略商的条件混合策略(即具有相对优势的混合策略)。)。111221221111111111149724917 12 1171052Ep qp qp qp qp qpqpqpqpqq甲上式含义:上式含义:甲厂商在乙厂商选择某个既定的甲厂商在乙厂商选择某个既定的q1时所选择时所选择的使的使E甲甲达到最大的达到最大的p1。11171052Epqq甲11111 0.70,10.70 0.7qpqq1112212211111111111638613 18 1152178Ep qp qp qp qp qpqpqpqqpp乙11110 0.50,10.51 0.5pqpp上式含义:上式含义:乙厂商在甲厂商选择某个既定的乙厂商在甲厂商选择某个既定的p1时所选择时所选择的使的使E乙乙达到最大的达到最大的q1。5、混合策略混合策略纳纳什均衡什均衡 参与人的条件混合策略可以分别确定,确定了参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进一步来确定混合策略的纳条件混合策略,就可以进一步来确定混合策略的纳什均衡。什均衡。二、存在纯策略均衡时的混合策略均衡二、存在纯策略均衡时的混合策略均衡 求解混合策略纳什均衡的方法不仅适用于纯策求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况,而且也适用于纯策略纳略纳什均衡不存在的情况,而且也适用于纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均什均衡将作为特例被包含在相应的混合策略纳什均衡之中。衡之中。存在纯策略纳什均衡的混合策略模型存在纯策略纳什均衡的混合策略模型厂商甲厂商甲厂商乙厂商乙q1q2合作合作不合作不合作p1合作合作5,61,5p2不合作不合作7,12,3110, 01pq1 1122 1221 1111111111572517 12 11152Epqpqp qp qpqpqp qpqpqq甲111221221111111111165365113 113223Ep qp qp qp qp qpqpqpqqpp乙111120 320,1321 3pqpp三、混合策略博弈的一般理论三、混合策略博弈的一般理论1、模型、模型ABq1q2策略策略1策略策略2p1策略策略1a11,b11a12,b12p2策略策略2a21,b21a22,b22混合策略博弈的一般模型混合策略博弈的一般模型2、混合策略和混合策略组合、混合策略和混合策略组合A的混合策略:的混合策略:121212,0,1,1pppppp且B的混合策略:的混合策略:121212,0,1,1q qq qqq且A与与B的混合策略组合:的混合策略组合: 121212121212,0,1,1,0,1,1ppq qppppq qqq3、期望支付、期望支付 运用两个参与人的混合策略组合,可以分别表运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。示出两个参与人得到的支付。A的期望支付:的期望支付:22111112122121222211ijijijEp q ap q ap q ap q ap q aA1111111211211122112122221111Ep q apqapq apqapaqaaa A 11121112221aq aaqaa 2211 1112122121222211ijijijEp q bp q bp q bp q bp q aB11 11111211211122111222221111Ep q bpqbpq bpqbqbpbbb B 11112121221bp bbpbb B的期望支付:的期望支付:4、A的条件混合策略的条件混合策略11212222EpaqaaaA 11121112221aqaaqaa 10 00,101 0aPaa 111121112221paq aaqaa 111121112221paq aaqaa 1111010,11qpq 111121112221paq aaqaa 1110010,11qpq 111121112221paq aaqaa 1110,10101qpq 111121112221paq aaqaa 1110010,10qpq 111121112221paq aaqaa 111,01pq110,01pq 11112111222111211222221211paqaaqaaqaaaaaaq正数正数2212112112221111*0*0,1*1*aaqaaaaqqpqqqq 11112111222111211222221211paqaaqaaqaaaaaaq负数正数2212112112221111*1*0,1*0*aaqaaaaqqpqqqq*0*1qq的 变 化*, *1qq 若, *1q 继续*0*1qq的 变 化*, *0qq 若, *0q 继续5、B的条件混合策略的条件混合策略1 1 11111211 211122111222221111Epqbpq bp qbpq bq bp bbb B 11112121221bp bbpbb 1000,1010bqbb111112121221qbpbbpbbq1p1Ob11=b12,b21=b2211111112121221qbpbbpbbq1p1Ob11=b12,b21b22111111010,11pqp111112121221qbpbbpbbq1p1Ob11=b12,b21b12,b21=b22111111010,10pqp111112121221qbpbbpbbq1p1Ob11b12,b21b221111101qp111112121221qbpbbpbbq1p1Ob11b12,b21b221111001qp11111212122111212122222111qbpbbpbbpbbbbbbp正 数正 数q1p1Ob11b12,b21b22112221111221221111*0*0,1*1*bbpbbbbppqppppp*11111212122111212122222111qbpbbpbbpbbbbbbp负 数 +正 数q1p1Ob11b22112221111221221111*1*0,1*0*bbpbbbbppqppppp*6、纳什均衡、纳什均衡q1p1Ob11=b12,b21=b2211单位平面单位平面6、纳什均衡、纳什均衡三条线段三条线段q1p1Ob11b12,b21b2216、纳什均衡、纳什均衡一条线段一条线段p1Ob11b12,b21b22116、纳什均衡、纳什均衡三个点三个点q1p1Ob11b12,b21b2211p*6、纳什均衡、纳什均衡两个点两个点q1p1Ob11b12,b21b2211p*一、例子:竞争者一、例子:竞争者垄断者博弈垄断者博弈1、两个参与者两个参与者:竞争者和垄断者。竞争者和垄断者。2、两个参与者的决策顺序及其策略:、两个参与者的决策顺序及其策略: 竞争者先决策,它决定进入还是不进入由垄断竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根据竞争者的行者独霸的市场;垄断者后决策,它根据竞争者的行动决定对其动决定对其“容忍容忍” 还是还是“抵抗抵抗” 。 竞争者有进入和不进入两个策略,垄断者也有竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗两个策略。因此,总共有四个策略组合。容忍和抵抗两个策略。因此,总共有四个策略组合。 每一策略组合中,第一项是先行动者即竞争者每一策略组合中,第一项是先行动者即竞争者的策略,第二项是后行动者即垄断者的策略。的策略,第二项是后行动者即垄断者的策略。二、博弈树二、博弈树game tree起点起点中间决策点中间决策点终点终点第一个数字是先行动者的支付,第二个数字是后行动者的支付。第一个数字是先行动者的支付,第二个数字是后行动者的支付。三、纳什均衡三、纳什均衡1、序贯博弈中的纳什均衡、序贯博弈中的纳什均衡 在竞争者在竞争者垄断者博弈中,第一个终点,即旁垄断者博弈中,第一个终点,即旁边标有支付组合(边标有支付组合(1,4)所代表的策略组合(进入,)所代表的策略组合(进入,容忍)是一个纳什均衡。因为在该策略组合上,没容忍)是一个纳什均衡。因为在该策略组合上,没有哪个参与人愿意单独改变自己的策略。有哪个参与人愿意单独改变自己的策略。三、纳什均衡三、纳什均衡2、序贯博弈中的纳什均衡可能不止一个、序贯博弈中的纳什均衡可能不止一个 情侣博弈情侣博弈battle of sex:有一对热恋中的情侣,:有一对热恋中的情侣,吕布和貂蝉,两人平时上班都很忙,没时间见面,吕布和貂蝉,两人平时上班都很忙,没时间见面,难得周六晚上能在一起过。两人就想:这么一个美难得周六晚上能在一起过。两人就想:这么一个美好的夜晚该怎么度过呢?好的夜晚该怎么度过呢? 这个吕布是个足球迷,正好周六晚上要直播一这个吕布是个足球迷,正好周六晚上要直播一场他最喜欢的意大利队的足球赛。而貂蝉是个芭蕾场他最喜欢的意大利队的足球赛。而貂蝉是个芭蕾迷,恰巧这晚上世界著名的俄罗斯芭蕾舞蹈团要进迷,恰巧这晚上世界著名的俄罗斯芭蕾舞蹈团要进行最后一场巡回演出。看足球赛还是看芭蕾呢?行最后一场巡回演出。看足球赛还是看芭蕾呢?2、序贯博弈中的纳什均衡可能不止一个、序贯博弈中的纳什均衡可能不止一个 假如两人决定一起看足球,对于吕布来说幸福假如两人决定一起看足球,对于吕布来说幸福感是感是2。而貂蝉对足球一窍不通,但是因为能和吕。而貂蝉对足球一窍不通,但是因为能和吕布在一起,晚上一起看球的幸福感是布在一起,晚上一起看球的幸福感是1。如果两人。如果两人一起去看芭蕾演出,对于貂蝉来说幸福感是一起去看芭蕾演出,对于貂蝉来说幸福感是2,可,可是吕布偏偏对芭蕾不太感兴趣,和貂蝉在一起看芭是吕布偏偏对芭蕾不太感兴趣,和貂蝉在一起看芭蕾对他来说幸福感只有蕾对他来说幸福感只有1。 现在两人正处于如胶似漆的热恋阶段,双方对现在两人正处于如胶似漆的热恋阶段,双方对在一起的每一刻都非常珍惜。所以,一旦分开,若在一起的每一刻都非常珍惜。所以,一旦分开,若吕布单独去看球、貂蝉单独去看芭蕾,幸福感为吕布单独去看球、貂蝉单独去看芭蕾,幸福感为(0,0);若吕布单独看芭蕾,貂蝉单独去看球,);若吕布单独看芭蕾,貂蝉单独去看球,幸福感为(幸福感为(-1,-1)。)。2、序贯博弈中的纳什均衡可能不止一个、序贯博弈中的纳什均衡可能不止一个四、纳什均衡的精炼:四、纳什均衡的精炼:逆向归纳法逆向归纳法backward induction1、逆向归纳法的两个步骤、逆向归纳法的两个步骤 第一步,先从博弈的最后阶段的每一个决策点第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;个简化博弈; 第二步,再对简化博弈重复步骤一的程序,直第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解。弈,就是原博弈的解。四、纳什均衡的精炼:逆向归纳法四、纳什均衡的精炼:逆向归纳法2、逆向归纳策略总是纳什均衡,尽管纳什均衡并不、逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也是逆向归纳策略一定也是逆向归纳策略3、先动优势:、先动优势:first-mover advantage 先行动者的得益大于后行动者的得益。先行动者的得益大于后行动者的得益。 比如,男方先动,逆向归纳的结果就是对男方比如,男方先动,逆向归纳的结果就是对男方更加有利的纳什均衡(足球,足球);如果情侣博更加有利的纳什均衡(足球,足球);如果情侣博弈改为女方先行动,则逆向归纳的结果就是对女方弈改为女方先行动,则逆向归纳的结果就是对女方更加有利的纳什均衡(芭蕾,芭蕾)。更加有利的纳什均衡(芭蕾,芭蕾)。情侣博弈:女方先动情侣博弈:女方先动四、纳什均衡的精炼:逆向归纳法四、纳什均衡的精炼:逆向归纳法4、序贯博弈与同时博弈的一个重要区别、序贯博弈与同时博弈的一个重要区别 当博弈是当博弈是“同时同时”的时候,如果出现多重纳什的时候,如果出现多重纳什均衡,常常无法确定最终实现的是哪一个纳什均衡,均衡,常常无法确定最终实现的是哪一个纳什均衡,但是,当博弈是但是,当博弈是“序贯序贯”的时候,即使纳什均衡是的时候,即使纳什均衡是多重的,往往能够从中确定一个最终的均衡。这是多重的,往往能够从中确定一个最终的均衡。这是因为,与同时博弈相比,序贯博弈提供了更多的信因为,与同时博弈相比,序贯博弈提供了更多的信息息关于参与人决策秩序的信息。关于参与人决策秩序的信息。