微观经济学-博弈论及应用ppt课件.ppt
《微观经济学-博弈论及应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《微观经济学-博弈论及应用ppt课件.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第2828章章 博弈论博弈论 博弈论关注的是对策略互动的一般性分析。博弈论关注的是对策略互动的一般性分析。第十讲 博弈论及应用28.1 28.1 博弈的收益矩阵博弈的收益矩阵 对于双人的简单博弈,我们用收益矩阵来描述博对于双人的简单博弈,我们用收益矩阵来描述博弈。此处的简单博弈指参与者的策略数量有限,且只弈。此处的简单博弈指参与者的策略数量有限,且只进行一次的博弈。进行一次的博弈。 假设两人进行简单的博弈。参与人假设两人进行简单的博弈。参与人A A有两个策略:有两个策略:“上上”或或“下下”。参与人。参与人B B有两个策略:有两个策略:“左左”或或“右右”。当两个人同时行动后,二人的收益情况
2、由收益。当两个人同时行动后,二人的收益情况由收益矩阵反映,该矩阵矩阵反映,该矩阵A A、B B完全了解。完全了解。参与人B左右参与人A上1,20,1下2,11,0博弈的收益矩阵博弈的收益矩阵当当A A上上B B左时,左时,A A得得1 1B B得得2 2;当当A A下下B B右时,右时,A A得得1 1B B得得0 0。当当A A下下B B左时,左时,A A得得2 2B B得得1 1;当当A A上上B B右时,右时,A A得得0 0B B得得1 1;那么在那么在A A、B B完全了解收益矩阵的情况下,完全了解收益矩阵的情况下,A A、B B如何确如何确定自己的策略呢?定自己的策略呢?参与人B左
3、右参与人A上1,20,1下2,11,0A A的思路如下:如果的思路如下:如果B B选左,选左,我就选下(我就选下(21)21);如果;如果B B选选右,我就选下右,我就选下(10)(10)。因此,。因此,A A的最优策略的最优策略“下下”与与B B的的策略并没有关系,此时策略并没有关系,此时A A的的最优策略为最优策略为“下下”。 B B做同样的思考:如果做同样的思考:如果A A选上选上,我就选左(我就选左(21)21);如果;如果A A选下,我就选左选下,我就选左(10)(10)。因此,。因此,B B决定采取决定采取“左左”。上述分析中,上述分析中,A的的“下下”、B的的“左左”被称为占优策
4、略被称为占优策略。占优策略:不论对方采取什么策略,该策略总是最优的。占优策略:不论对方采取什么策略,该策略总是最优的。 显然,在博弈中,参与人如果有占优策略,他一定显然,在博弈中,参与人如果有占优策略,他一定选择占优策略。上述博弈中,选择占优策略。上述博弈中,A一定选择下,一定选择下,B一定选一定选左左。该博弈的结果一定是(该博弈的结果一定是(2,1)。)。 此时,我们定义一个占优策略均衡,即双方占优策略此时,我们定义一个占优策略均衡,即双方占优策略的组合(下,左的组合(下,左)。运用该定义可以帮助我们寻找存在占运用该定义可以帮助我们寻找存在占优策略博弈的结果。优策略博弈的结果。28.2 28
5、.2 纳什均衡纳什均衡(Nash Equilibrium)(Nash Equilibrium)如果如下表所示,参与人不存在占优策略,那么该如何预如果如下表所示,参与人不存在占优策略,那么该如何预测博弈的结果呢?测博弈的结果呢?参与人B左右参与人A上2,10,0下0,01,2 A的思路如下:如果的思路如下:如果B选左,我就选上(选左,我就选上(20);如果;如果B选右,我就选下选右,我就选下(10)。因此,。因此,A没有占优策略。同样,没有占优策略。同样,B也没有占优策略。也没有占优策略。 如果参与人没有占优策略,那么我们需要借助纳什均衡如果参与人没有占优策略,那么我们需要借助纳什均衡的概念寻找
6、博弈的结果。的概念寻找博弈的结果。 纳什均衡纳什均衡(N.E.):如果给定:如果给定B的选择,的选择,A的选择是最优的,的选择是最优的,并且给定并且给定A的选择,的选择,B的选择也是最优的,这样的策略组合的选择也是最优的,这样的策略组合称为纳什均衡。称为纳什均衡。 寡头垄断下,古诺均衡实际上就是纳什均衡。即给定寡头垄断下,古诺均衡实际上就是纳什均衡。即给定A厂商的产量,厂商的产量,B实现了利润最大化;给定实现了利润最大化;给定B厂商的产量,厂商的产量,A实现了利润最大化。实现了利润最大化。 在上面收益矩阵描述的博弈中,存在四个策略组合:在上面收益矩阵描述的博弈中,存在四个策略组合:(上,左)、
7、(上,右)、(下,左)、(下,右)。(上,左)、(上,右)、(下,左)、(下,右)。参与人B左右参与人A上2,10,0下0,01,2根据根据N.E.N.E.的定义,请找出的定义,请找出N.E.N.E.借助借助N.E.预测博弈的结果,往往会遇到两个问题:预测博弈的结果,往往会遇到两个问题:1、N.E.不止一个。不止一个。2、一些博弈中不存在纳什均衡。如下面收益矩阵描述的、一些博弈中不存在纳什均衡。如下面收益矩阵描述的博弈:博弈:参与人B左右参与人A上0,00,-1下1,0-1,328.3 28.3 混合策略混合策略 而现实中,参与人完全可以随机选择策略,例如参与而现实中,参与人完全可以随机选择策
8、略,例如参与人采取抛硬币的方法确定自己的策略人采取抛硬币的方法确定自己的策略硬币正面朝上就硬币正面朝上就“上上”,反面朝上就下。该策略实际就是以,反面朝上就下。该策略实际就是以50%50%的概率选择的概率选择上,以上,以5050的概率选择下。这种随机策略称为混合策略。的概率选择下。这种随机策略称为混合策略。 如果将策略扩展到混合策略,那么对于简单博弈而言,如果将策略扩展到混合策略,那么对于简单博弈而言,混合策略纳什均衡总是存在的。混合策略纳什均衡总是存在的。 迄今为止,参与人的策略均为纯策略。纯策略指参迄今为止,参与人的策略均为纯策略。纯策略指参与人以与人以100100概率选择的策略。概率选择
9、的策略。28.4 28.4 囚徒困境囚徒困境 本节通过一个例子说明纳什均衡并不一定会导致帕本节通过一个例子说明纳什均衡并不一定会导致帕累托有效率的结果。累托有效率的结果。 囚徒困境:合伙犯罪的两个囚徒被分别关在两个房间囚徒困境:合伙犯罪的两个囚徒被分别关在两个房间接受审讯。每个囚徒可以选择坦白,也可以选择抵赖。如接受审讯。每个囚徒可以选择坦白,也可以选择抵赖。如果只有一人坦白,坦白者免刑,抵赖者入狱果只有一人坦白,坦白者免刑,抵赖者入狱6 6个月;如果个月;如果两人同时坦白,两人将被判入狱两人同时坦白,两人将被判入狱3 3个月;如果两个人都抵个月;如果两个人都抵赖,证据不足,两人被判入狱赖,证
10、据不足,两人被判入狱1 1个月。个月。囚徒囚徒B B:坦白也是坦白也是B B的占优策略。的占优策略。囚徒囚徒A A:如果如果B B坦白,我最好坦白(坦白,我最好坦白(-3-6)-3-6);如果;如果B B抵赖,我抵赖,我最好坦白最好坦白(0-1)(0-1)。因此,不论。因此,不论B B做什么,做什么,A A的最优选择就是坦的最优选择就是坦白。实际上,此处坦白是白。实际上,此处坦白是A A的占优策略。的占优策略。参与人B坦白抵赖参与人A坦白-3,-3 0,-6抵赖-6,0-1,-1囚徒困境 现实中囚徒困境的例子很多,例如冷战中的美苏争霸现实中囚徒困境的例子很多,例如冷战中的美苏争霸。 当参与人具
11、有占优策略时,博弈存在占优策略均衡,当参与人具有占优策略时,博弈存在占优策略均衡,此处为(坦白、坦白),博弈结果为(此处为(坦白、坦白),博弈结果为(-3,-3-3,-3)。)。 该结果有帕累托改进的可能,如果双方达成共识,该结果有帕累托改进的可能,如果双方达成共识,互相信任,同时抵赖,大家的境况都可以改善。互相信任,同时抵赖,大家的境况都可以改善。28.5 28.5 重复博弈重复博弈 上节中囚徒无法摆脱困境,很大程度上源于假定双方上节中囚徒无法摆脱困境,很大程度上源于假定双方是一锤子买卖,如果双方今后还要合作,即双方进行的是是一锤子买卖,如果双方今后还要合作,即双方进行的是重复博弈,那么结果
12、可能会有所改变。重复博弈,那么结果可能会有所改变。 重复博弈分为有限重复博弈和无限重复博弈。重复博弈分为有限重复博弈和无限重复博弈。 我们从最后一次博弈开始分析,第我们从最后一次博弈开始分析,第1010次博弈大家将面次博弈大家将面临永远不再合作的局面,那么临永远不再合作的局面,那么A A、B B均会毫不犹豫地选择坦均会毫不犹豫地选择坦白,因为这是一次囚徒博弈中的占优策略。白,因为这是一次囚徒博弈中的占优策略。 第第9 9次博弈会出现什么情况呢?次博弈会出现什么情况呢?A A清楚地知道对方最后清楚地知道对方最后一次肯定选择坦白。如果本次我选抵赖,对方可以选坦白一次肯定选择坦白。如果本次我选抵赖,
13、对方可以选坦白而获利。既然下一次已经没有合作的可能,为避免单独入而获利。既然下一次已经没有合作的可能,为避免单独入狱狱6 6个月的不幸发生,个月的不幸发生,A A决定第决定第9 9次也选择坦白。当然次也选择坦白。当然B B也会也会这样推理,进而选择坦白。这样推理,进而选择坦白。有限博弈有限博弈:如果囚徒博弈进行如果囚徒博弈进行1010次,那么结果会怎样呢?次,那么结果会怎样呢? 第第8 8、7 7.1.1次博弈中,第次博弈中,第9 9次的故事反复发生。所以次的故事反复发生。所以只要博弈重复有限次,囚徒依然无法摆脱困境。只要博弈重复有限次,囚徒依然无法摆脱困境。 如果,囚徒博弈重复无数次,结果会
14、怎样呢?如果,囚徒博弈重复无数次,结果会怎样呢? 当博弈没有最后一次时,双方均意识到无休止地坦当博弈没有最后一次时,双方均意识到无休止地坦白非明智之举。白非明智之举。 经济学家证明:经济学家证明:“针锋相对针锋相对”的策略可以使博弈双方境的策略可以使博弈双方境况得到改善。况得到改善。 “针锋相对针锋相对”的策略:第一局选择抵赖(即表明愿意与的策略:第一局选择抵赖(即表明愿意与对方合作),从第二局开始采用对方上一局的策略。例如,对方合作),从第二局开始采用对方上一局的策略。例如,如果对方第一局抵赖,那么我第二局依然抵赖;如果对方第如果对方第一局抵赖,那么我第二局依然抵赖;如果对方第一坦白,那么我
15、第二局坦白。如果对方第二局抵赖,那么我一坦白,那么我第二局坦白。如果对方第二局抵赖,那么我第三局选择抵赖,如此等等。第三局选择抵赖,如此等等。 该策略该策略相当相当灵活,既可以对对方的背信进行及时惩罚,灵活,既可以对对方的背信进行及时惩罚,又体现了宽恕的一面,即对每次背信仅处罚一次。又体现了宽恕的一面,即对每次背信仅处罚一次。28.7 28.7 序贯博弈序贯博弈 迄今为止,我们考察的博弈均是两个人同时采取行动。迄今为止,我们考察的博弈均是两个人同时采取行动。本节我们学习一个人首先行动,然后,另一个人再作出反本节我们学习一个人首先行动,然后,另一个人再作出反应。第应。第2727章描述的斯塔克伯格
16、模型就是这样的例子章描述的斯塔克伯格模型就是这样的例子。 一个序贯博弈的例子:第一阶段,参与人一个序贯博弈的例子:第一阶段,参与人A A选择选择“上上”或或“下下”。参与人。参与人B B观察到观察到A A的选择,再选择的选择,再选择“左左”或或“右右”,该博弈的收益矩阵如下所示:,该博弈的收益矩阵如下所示:参与人B左右参与人A上1,91,9下0,02,1 此处介绍一种寻找纳什均衡的简便方法此处介绍一种寻找纳什均衡的简便方法画线法:画线法:前者纵向比,大者下面画线;后者横向比,大者下面画线;前者纵向比,大者下面画线;后者横向比,大者下面画线;出现两条线者即纳什均衡。出现两条线者即纳什均衡。我们对
17、收益矩阵画线,得到两个纳什均衡我们对收益矩阵画线,得到两个纳什均衡: (上,左)(下,右)(上,左)(下,右) 原因在于收益矩阵在描述序贯博弈时,无法体现参与双原因在于收益矩阵在描述序贯博弈时,无法体现参与双方的策略是序贯做出的,因此描述序贯博弈我们采用博弈方的策略是序贯做出的,因此描述序贯博弈我们采用博弈树或博弈的扩展形式来描述。树或博弈的扩展形式来描述。 而实际上,这两个纳什均衡中有一个是不合理。而实际上,这两个纳什均衡中有一个是不合理。AB上上B左左左左右右右右下1,91,90,02,1博弈的扩展形式参与人B左右参与人A上1,91,9下0,02,1AB上上B左左左左右右右右下1,91,9
18、0,02,1序贯博弈中,先行者需要分析跟随者的反应,因此,分析序贯博弈中,先行者需要分析跟随者的反应,因此,分析博弈树是由后往前推算。博弈树是由后往前推算。首先考虑首先考虑B的选择:的选择:如果如果A A选选“下下”,如果如果A A选选“上上”, 那么那么B B选选“左左”或或“右右”无差异;无差异;那么那么B B选选“右右”比较明智(比较明智(1010)。)。A上上1,9下2,1经过上述分析,博弈树可变成如下形式:然后考虑然后考虑A的选择,的选择,A上上1,9下2,1如果选如果选“上上”,得,得1 1;如果选;如果选“下下”,可得,可得2 2。因此。因此A A的最优的最优选择是选择是“下下”
19、。当先行者A选“下”,B的最优选择是“右”,因此该序贯博弈的均衡为(下,右) 在该序贯博弈中,我们依据收益矩阵找到的在该序贯博弈中,我们依据收益矩阵找到的N.E.N.E.(上,左)并不是合理的均衡,因为(上,左)并不是合理的均衡,因为A A选择选择“上上”是愚蠢是愚蠢的。的。 从博弈的结果看,从博弈的结果看,B B非常不幸,最终他只能得到非常不幸,最终他只能得到1 1而非而非9 9。面临巨大落差,面临巨大落差,B B极有可能威胁极有可能威胁A A,声称如果声称如果A A选选“下下”,那,那他就选他就选“左左”,让大家一无所获。,让大家一无所获。AB上上B左左左左右右右右下1,91,90,02,
20、1 A A对对B B的威胁不予理睬,因为的威胁不予理睬,因为A A一旦选一旦选“下下”,B B就考虑自就考虑自己的利益,明智地选己的利益,明智地选“右右”而非而非“左左”。针对针对B B的威胁,的威胁,A A会如何反应?会如何反应? B B为了改善自己的境况,就必须让为了改善自己的境况,就必须让A A相信自己的威胁。相信自己的威胁。 B B可以跟第三方签一个合约,规定如果可以跟第三方签一个合约,规定如果A A选选“下下”,B B若选若选“右右”,B B支付第三方支付第三方2 2。右右AB上上左左右右1,91,9B左左下0,02,1-2=-1若若A A知道知道B B签了类似签了类似合约,就知道如
21、果合约,就知道如果自己选自己选“下下”,B B一一定选定选“左左”(0-0-1 1),那么为避免一),那么为避免一无所获,无所获,A A就会选就会选“上上”。本章小结1、纳什均衡的概念及应用2、纳什均衡应用中的问题(不唯一、不存在、无效率)3、序贯博弈求解应用逆向归纳法。第第2929章章 博弈论的应用博弈论的应用 本章我们考察博弈论中本章我们考察博弈论中4 4个非常重要的问题个非常重要的问题合作问题、竞争问题、共存问题和承诺问题。合作问题、竞争问题、共存问题和承诺问题。 首先了解一个重要的分析工具首先了解一个重要的分析工具最优反应曲线最优反应曲线(反应函数的图像)。(反应函数的图像)。29.1
22、 29.1 最优反应曲线最优反应曲线 考虑一个双人博弈,假定你是其中的一个参与人。对另考虑一个双人博弈,假定你是其中的一个参与人。对另外一人的任何选择,你的最优反应就是使你的收益最大化。外一人的任何选择,你的最优反应就是使你的收益最大化。B的选择:左的选择:左 A的选择:上的选择:上 列参与人B左右行参与人A上2,1 0,0下0,0 1,2A的最优反应:上的最优反应:上 B的最优反应:左的最优反应:左 B的选择:右的选择:右 A的最优反应:下的最优反应:下 B的最优反应:右的最优反应:右 A的选择:下的选择:下 如果行参与人如果行参与人A A的可能选择的可能选择r1r1(上)(上),r2,r2
23、(下)(下), ,. .,列参与人列参与人B B的可能选择的可能选择c1c1(左)(左),c2,c2(右)(右). .。对于行参对于行参与人与人A A的每一个选择的每一个选择r r,列参与人列参与人B B的最优反应函数为:的最优反应函数为:( )Bbr 对于行参与人对于行参与人B B的每一个选择的每一个选择c c,行参与人行参与人A A的最优的最优反应函数为反应函数为:( )Abc在上例中,列参与人在上例中,列参与人B的最优反应函数:的最优反应函数:()()BBbb上 左 ;下 右行参与人行参与人A的最优反应函数的最优反应函数:()()AAbb左 上 ;右 下列参与人B左右行参与人A上2,10
24、,0下0,01,2纳什均衡纳什均衡是使得以下两个式子成立的一个策略组合是使得以下两个式子成立的一个策略组合(,)rc()()BAcbrrbc上例中纳什均衡为(上,左)(下,右),这两个组合满足上例中纳什均衡为(上,左)(下,右),这两个组合满足:()()ABbb上 左 ; 左 上()()ABbb下 右 ; 右 下纳什均衡一旦实现,纳什均衡一旦实现,A、B均满意,无人愿意偏离该状态。均满意,无人愿意偏离该状态。最优反应曲线(函数)提供了一种相对简单的求解纳什均最优反应曲线(函数)提供了一种相对简单的求解纳什均衡的方法。衡的方法。在第在第27章求解古诺均衡时,实际就是最优反应曲线的应用:章求解古诺
25、均衡时,实际就是最优反应曲线的应用:122abyyb212abyyb两个厂商的反应函数如下两个厂商的反应函数如下:联立上述反应函数,得到古诺均衡(也是纳什均衡)。联立上述反应函数,得到古诺均衡(也是纳什均衡)。29.2 29.2 混合策略混合策略 本节利用最优反应曲线来寻求混合策略纳什均衡和纯本节利用最优反应曲线来寻求混合策略纳什均衡和纯策略纳什均衡。策略纳什均衡。列参与人B左c右(1-c)行参与人A上r2,10,0下(1-r)0,01,2 我们令我们令A A选择上的概率为选择上的概率为r r,那么那么(1-(1-r)r)就表示选下的概率。就表示选下的概率。c c表示表示B B选择左的概率,那
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 微观经济学 博弈 论及 应用 ppt 课件
限制150内