《产业经济学企业行为附博弈论进阶.pptx》由会员分享,可在线阅读,更多相关《产业经济学企业行为附博弈论进阶.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 企业的策略性行为附:博弈论进阶第1页/共57页完全信息静态博弈性别战博弈(多重解)划线法重复剔除严格劣策略现实为什么很少出现?假设太严格现实动态、信息不对称男女拳击芭蕾拳击 2 ,10 ,0芭蕾 0 ,01 ,2第2页/共57页完全信息动态博弈博弈树逆向归纳法第3页/共57页博弈树动态博弈涉及时间顺序,普通矩阵结构难以表达若女生下午2节课,男生下午4节课,女生具有先选择权男女拳击芭蕾拳击2 ,10 ,0芭蕾0 ,01 ,2第4页/共57页动态市场争夺战博弈的扩展型表达方式(1)博弈参与者(2)行动顺序:在动态博弈中,博弈参与者的行动存在先后次序。(3)行动策略空间(Action Set
2、):指博弈参与者可以采取的所有可能策略。(4)信息集(Information Set):指博弈参与者在博弈过程中所知道的信息。(5)支付函数指博弈参与者采用特定策略与所能得到的收益之间的关系。第5页/共57页动态市场争夺战博弈的扩展型表达方式博弈树中包含若干“节点”,节点用小圆圈表示。位于博弈树最上端的节点称为“初始节点”,用空心小圆圈表示,其他节点均用实心小圆圈表示。在每个节点处均对应某个博弈参与者,将节点对应的博弈参与者标识在节点旁边。第6页/共57页动态市场争夺战博弈的扩展型表达方式将潜在进入者标识在博弈树初将潜在进入者标识在博弈树初始节点旁边。始节点旁边。当潜在进入者决策之后,轮到当潜
3、在进入者决策之后,轮到在位者进行决策。在位者进行决策。在位者所在的节点称为在位者所在的节点称为“后续后续节点节点”。在位者位于两个后续。在位者位于两个后续节点上。节点上。在位者都有两种策略选择:在位者都有两种策略选择:“斗争斗争”和和“默许默许”。第7页/共57页动态市场争夺战博弈的扩展型表达方式如果初始节点处的博弈参与者如果初始节点处的博弈参与者存在存在 N 种策略,那么就从初种策略,那么就从初始节点处分出始节点处分出 N 条路径。条路径。路径用线段表示。在线段旁注路径用线段表示。在线段旁注明相应的策略。明相应的策略。当博弈不再有后续节点时,需要将博弈的收益标识在博弈树末端。需要注意的是:各
4、博弈参与者的收益需要按照各参与者行动顺序进行排列。第8页/共57页博弈树各节点之间存在顺序关系,博弈树由上至下的节点顺序表示各博弈参与者进行决策的顺序。博弈树与博弈顺序第9页/共57页从博弈树的节点可以引出多条线段,但不能从博弈树多个节点共同到达博弈树下方同一个后续节点。错误的博弈树构造方法第10页/共57页构造博弈树时只能按照由上至下的路径,而不能存在由下向上的路径,也不能形成循环路径。回溯路径唯一性在求解完全信息动态博弈时非常重要。错误的博弈树构造方法第11页/共57页信息集:三人罢工模型第12页/共57页信息集:三人罢工模型在完全信息动态博弈中,如果将博弈树的多个节点用虚线连接起来,表明
5、这多个节点位于同一个博弈信息集中。也就是说:博弈参与者不知道自己位于同一个信息中的哪个博弈节点上。可以通过“三人罢工博弈”来说明信息集的含义以及信息集在动态博弈中的重要性。第13页/共57页员工 2 只有一个信息集的博弈树,即他不知道员工1如何决策信息集:三人罢工模型第14页/共57页员工 3 不能观察到员工 2 的决策策略信息集:三人罢工模型第15页/共57页员工 3 不知道员工 1 的决策策略信息集:三人罢工模型第16页/共57页员工 3 不知道员工 1 和员工 2 的决策策略信息集:三人罢工模型第17页/共57页员工2、3都只有一个信息集的博弈信息集:三人罢工模型第18页/共57页信息集
6、与信息分割结论:信息集包含的元素越多,越“糊涂”信息集个数越多,越“清楚”信息多未必是好事,信息少未必是坏事确定性程度至关重要陈平脱衣自救的故事第19页/共57页博弈树的方法不仅能表示动态博弈,还能表示静态博弈。所谓的“博弈先后顺序”,主要是一个信息的概念,而不是一个纯时间先后的概念。用博弈树表示囚徒困境博弈树与静态博弈第20页/共57页嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)三种博弈表达方式内涵相同第21页/共57页有 A B 两家公司,各有两种选择 开发开发/放弃放弃A公司资金充足 先行B公司需要筹措资金 后行只一
7、家开发,获利20002000万万两家都开发,各损失10001000万万博弈的矩阵表达式第22页/共57页AB B1 1B B2 2(-1-1,-1-1)(2 2,0 0)(0 0,2 2)(0 0,0 0)放弃放弃开发开发开发开发开发开发放弃放弃放弃放弃博弈的矩阵表达式第23页/共57页B B开发开发,开发开发开发开发,放弃放弃放弃放弃,放弃放弃放弃放弃,开发开发A A开发开发-1-1,-1-1-1-1,-1-12 2,0 02 2,0 0放弃放弃0 0,2 20 0,0 00 0,0 00 0,2 2博弈的矩阵表达式不论A开发还是不开发,B开发,记为(开发,开发)A开发,B开发;A不开发,B
8、不开发,记为(开发,放弃)不论A开发还是不开发,B都不开发,记为(放弃,放弃)A开发,B不开发;A不开发,B开发,记为(放弃,开发)第24页/共57页AB B1 1B B2 2(-1-1,-1-1)(2 2,0 0)(0 0,2 2)(0 0,0 0)放弃放弃开发开发开发开发开发开发放弃放弃放弃放弃博弈的矩阵表达式含义:B不能区分A的两种策略,尽管A可能确实选的是开发,B依然当作两种情形处理第25页/共57页B B开发开发,开发开发开发开发,放弃放弃放弃放弃,放弃放弃放弃放弃,开发开发A A开发开发-1-1,-1-1-1-1,-1-12 2,0 02 2,0 0放弃放弃0 0,2 20 0,0
9、 00 0,0 00 0,2 2博弈的矩阵表达式NE解:(开发,(放弃,放弃),(放弃,(开发,开发),(放弃,(开发,放弃),不论A开发还是不开发,B开发,记为(开发,开发)A开发,B开发;A不开发,B不开发,记为(开发,放弃)不论A开发还是不开发,B都不开发,记为(放弃,放弃)A开发,B不开发;A不开发,B开发,记为(放弃,开发)第26页/共57页信息的分类第27页/共57页完美信息动态博弈完美信息动态博弈(Dynamic Game with Perfect Information)中,每个博弈参与者均知道在自己之前进行决策的参与者选择的策略和博弈结构。博弈树中每个节点都独立构成一个信息集
10、,没有虚线连接两个或多个博弈树节点。第28页/共57页完美信息动态博弈问题:能否以开发博弈的战略式(矩阵式)表述求解的三个纯战略NE作为完美信息博弈开发博弈的NE?NE的缺陷:一些NE包含不可置信的战略原因:作为NE,参与人在选择自己的最优战略时假定其他参与人的战略给定,而参与人并不考虑自己的选择对其他参与人的(直接)影响第29页/共57页完全信息动态博弈博弈树逆向归纳法第30页/共57页逆向归纳法逻辑基础:动态博弈中先行动的参与人,在前面阶段选择行为时必然会考虑后行动的参与人在后面阶段中的行为选择只有在最后一阶段的参与人才能不受其他参与人的制约而直接做出选择(牵制最少,决策最明确)当后面阶段
11、的参与人的选择确定后,前一阶段的参与人的行为也随之确定适用范围:有限次重复动态博弈排除了不可信的威胁和承诺第31页/共57页课堂练习:数30游戏由甲、乙两人依次从1开始报数,每次可以连续报数一个或两个,谁抢到30就胜出。第32页/共57页课堂练习:数30游戏如果要想抢到30,那么对手一定要留下1个或2个数,即留下30或留下29、30再往前追溯一步,应该给对手留下几个数呢?如果留下1个数或2个数,那么对手直接获胜;如果留下3个数,那么对手只能给我们留下1个或2个数,我方肯定获胜;如果留下4个数,对手可以留下3个数,只好输掉结论:要抢到30,必须抢到27,要抢到27,必须抢到24!关键数30、27
12、、24、21、3。只要在报数过程中,一旦抢到3的倍数,就可以每次都抢到3的倍数,直到最后获得胜利。第33页/共57页经典案例:海盗分金5个海盗抢来了100枚金币分赃方式:海盗1提出一种分配方案,如果同意这种方案的人达到半数,那么该提议就通过并付诸实施;若同意这种方案的人未达半数,则提议不能通过且提议人将被扔进大海喂鲨鱼然后由接下来的海盗继续重复提议过程假设每个海盗都绝顶聪明,也不相互合作,并且每个海盗都想尽可能多得到金币第一个提议的海盗将怎样提议既可以使得提议被通过又可以最大限度得到金币呢第34页/共57页经典案例:海盗分金第一个海盗将提出怎样的分配方案?(98,0,1,0,1)要求:完美信息
13、害怕:颤抖的手轮次轮次分配方案提出者分配方案提出者分配方案分配方案最后一轮最后一轮海盗海盗5自己独吞全部自己独吞全部100个金币个金币倒数第二轮倒数第二轮海盗海盗4自己独吞全部自己独吞全部100个金币个金币倒数第三轮倒数第三轮海盗海盗3分分配配自自己己99个个金金币币,第第四四个个海海盗盗0个个金金币币,第五个海盗第五个海盗1个金币。个金币。倒数第四轮倒数第四轮海盗海盗2分分配配给给自自己己98个个金金币币,第第三三个个海海盗盗0个个金金币币,第第四四个个海海盗盗1个个金金币币、第第5个个海海盗盗0个个金币。金币。第35页/共57页子博弈与逆向归纳法在图中,用虚线框起来的部分称作一个子博弈(S
14、ub-Game)。一个博弈的子博弈需要满足四个条件。1子博弈的起始节点不能是原来博弈的起始节点2子博弈不能分割信息集3有些博弈包含多个子博弈4有些博弈没有子博弈第36页/共57页子博弈与逆向归纳法逆向归纳法:首先找到博弈顺序在最后的子博弈,找到子博弈中博弈参与者的策略选择,然后按博弈顺序由后向前逆向归纳,直至博弈树的初始节点,从而找到博弈的均衡。第37页/共57页子博弈与逆向归纳法第38页/共57页子博弈与逆向归纳法第39页/共57页斯塔克伯格寡头博弈根据逆向归纳法,首先考虑厂商 2 如何选择自己的产量.作为领先者,厂商 1 在决定自己的产量时会考虑自己的决策产量对厂商 2 的影响。求解得到:
15、作为领先者的厂商 1 的产量为:作为跟随者的厂商 2 的产量为:第40页/共57页古诺模型与斯塔克伯格模型在古诺寡头博弈中,市场需求函数和厂商成本函数与斯塔贝尔伯格博弈均相同。二者的主要区别是:在古诺寡头博弈中,两家厂商同时进行决策,是一个完全信息静态博弈。在斯塔贝尔伯格寡头博弈中,厂商 1 先行动,厂商 2 后行动,是一个完全信息动态博弈。古诺寡头博弈的均衡是:斯坦贝尔伯格寡头博弈的均衡是:第41页/共57页斯塔克伯格寡头博弈均衡示意图斯塔克伯格模型第42页/共57页q1q 2a-c(a-c)/2(a-c)/4(a-c)/4(a-c)/2a-c0竞争性均衡古诺均衡串谋均衡R2(q1)R1(q
16、2)古诺模型古诺寡头垄断均衡示意图第43页/共57页子博弈精炼纳什均衡泽尔滕(Selten)在 1965 年提出了“子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium)”的概念。子博弈精炼纳什均衡也被称为子博弈完美纳什均衡。子博弈精炼纳什均衡与纳什均衡不同:纳什均衡要求:给定其他参与者在均衡处的策略,任何一方博弈参与者在均衡处选择的策略都是自己所能选择的最优策略,没有博弈参与者有动机改变自己在均衡时的策略。子博弈精炼纳什均衡不仅要求均衡解是纳什均衡,而且要求均衡解在每一个信息集上都是最优解。第44页/共57页通过逆向归纳法求解博弈树得到的均衡是子博弈精炼纳什均
17、衡。纳什均衡只对均衡处的策略有要求。子博弈精炼纳什均衡不仅对均衡处的策略有要求,而且对到达均衡的路径有要求。(要求从博弈初始节点开始,博弈参与者到达均衡处所经过的路径也必须是最优的。)子博弈精炼纳什均衡第45页/共57页子博弈精炼纳什均衡NE解:(斗争,不进入),(默许,进入),SPNE解:(默许,进入),对潜在进入者来说,在位者的“斗争”策略是一种不可置信的威胁第46页/共57页子博弈精炼纳什均衡就是把包含不可置信威胁的纳什均衡从可能的均衡中剔除出去。“子博弈精练纳什均衡”是对纳什均衡的“精练”。通过剔除包含不可置信威胁的纳什均衡,减少纳什均衡的数目。子博弈精炼纳什均衡第47页/共57页不可
18、置信的威胁在很多完全信息动态博弈中,都存在不可置信的威胁。但不可置信威胁可以通过某种途径成为一个可置信的威胁(Credible Threat),那么博弈的均衡就会不同。第48页/共57页例:法律上的要挟诉讼PDP(0,0)不指控 指控(提出要求s0)拒绝 接受起诉 放弃(s-c,-s)(x-c-p,-x-d)(-c,0)两个参与人:原告P,被告DC0 指控成本S0 要求的支付P0 原告的起诉成本d0 被告的辩护成本X 起诉后以的概率赢得X不可信威胁和承诺第49页/共57页PDP(0,0)不指控 指控(提出要求s0)拒绝 接受起诉 放弃(s-c,-s)(x-c-p,-x-d)(-c,0)不可置信
19、威胁和承诺如果X-c-p,所以原告在最后阶段会起诉,由于被告辩护成本很高,只要-rX-d=rX,原告就希望私了,所以要求的支付s的取值范围是rX,rX+d(赔偿区域),如果双方讨价还价能力相当,则最后s=rX+d/2。原告总成本为c+p,所以即使胜诉概率很小,即rX c+p还是可能会满足,此时子博弈精炼纳什均衡为(指控,起诉),接受注意:d越大,条件越容易满足。这就是大企业、大人物常受无端指控的原因之一第51页/共57页不可信威胁和承诺被告承诺行动被告在被控之前就支付律师费y,则赔偿区域变为rX,rX+d-y,讨价还价解为s=rX+(d-y)/2,这样,即使rX+d/2c+p,rX+(d-y)
20、/2c+p的条件也可能不满足,即若y2rX+d-2c-2p时,rX+(d-y)/2c+p,此时,原告将不会提出指控。这就是大企业、大人物雇佣内部律师或私人律师的原因之一第52页/共57页逆向归纳法的局限通过逆向归纳法有时也会求解出“不合理”的均衡。经济学家罗森赛尔(Rosenthsal)提出的“蜈蚣博弈(Centipede Game)”就是这样一个典型例证。虽然通过逆向归纳法可以求出蜈蚣博弈的均衡解,但此均衡解的合理性受到了普遍挑战。因此,蜈蚣博弈有时也被称为“蜈蚣博弈悖论”,简称“蜈蚣悖论(Centipede Paradox)”。第53页/共57页蜈蚣博弈假设有两名博弈参与者:参与者 1 和
21、参与者 2。两名参与者轮流进行决策。在博弈的初始节点处,参与者 1 有两个策略可以选择:T 和 C。策略 T 表示结束博弈(Terminate),策略 C 表示继续(Continue)博弈。在蜈蚣博弈中,包含初始节点在内,共有 198 个博弈节点。第54页/共57页蜈蚣博弈的支付矩阵v参与者参与者 1 和参与者和参与者 2 轮流决策。轮流决策。v参与者参与者 1 对应对应 98 个节点,参与者个节点,参与者 2 也对应也对应 98 个节点。个节点。v即:在奇数节点上,都是参与者即:在奇数节点上,都是参与者 1 进行决策。进行决策。v在偶数节点上,都是参与者在偶数节点上,都是参与者 2 进行决策。进行决策。蜈蚣博弈第55页/共57页蜈蚣博弈悖论通过逆向归纳法可以求解出蜈蚣博弈的子博弈精炼纳什均衡。通过逆向归纳法求解出的蜈蚣博弈的子博弈精炼纳什均衡是:在初始节点处,参与者 1 选择策略 T,博弈结束。两名博弈参与者均得到收益 1。在“蜈蚣博弈”中,越是位置靠后的博弈节点对应的博弈收益普遍越高,对两名博弈参与者均如此。在实际生活中,蜈蚣博弈的参与者们往往通过各种努力使得博弈尽可能进行下去,而不是理性的在初始节点处就终止博弈。第56页/共57页感谢您的观看!第57页/共57页
限制150内