博弈论复习题及答案(DOC)12807.pdf
囚徒困境说明个人的理性选择不一定是集体的理性选择。()子博弈精炼纳什均衡不是一个纳什均衡。()若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。()纳什均衡一定是上策均衡。()上策均衡一定是纳什均衡。()在一个博弈中只可能存在一个纳什均衡。()在一个博弈中博弈方可以有很多个。()在一个博弈中如果存在多个纳什均衡则不存在上策均衡。()在博弈中纳什均衡是博弈双方能获得的最好结果。()在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。()上策均衡是帕累托最优的均衡。()因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。()在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。()在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。()纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。()不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。()多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。()如果阶段博弈G=A1,A2,An;u1,u2,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的tT,在t阶段的结局并不是G的Nash均衡。()(或:如果阶段博弈G=A1,A2,An;u1,u2,un)具有多重Nash均衡,那么该重复博弈G(T)的子博弈完美均衡结局,对于任意的t10,000,则该笔钱就没收。问该博弈的纳什均衡是什么如果你是其中一个博弈方,你会选择什么数额为什么 答十、纳什均衡有无数个。最可能的结果是(5000,5000)这个聚点均衡。9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得 500000 元的垄断利润,但不受限制的竞争会使每一方的利润降至 60000 元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利 900000 元。(1)将这一市场用囚徒困境的博弈加以表示。(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。答:(1)用囚徒困境的博弈表示如下表:北方航空公司 合作 竞争 新华航空公司 合作 500000,500000 0,900000 竞争 900000,0 60000,60000 (2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(600000);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(600000);若北方航空公司选择合作,新华航空公司仍会选择竞争(9000000)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为 600000 元。12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡(2)两厂商合作的结果是什么 答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B 两企业利用广告进行竞争。若 A、B 两企业都做广告,在未来销售中,A 企业可以获得 20 万元利润,B 企业可获得 8 万元利润;若 A 企业做广告,B 企业不做广告,A 企业可获得 25 万元利润,B 企业可获得 2 万元利润;若 A 企业不做广告,B 企业做广告,A 企业可获得 10 万元利润,B 企业可获得 12 万元利润;若 A、B 两企业都不做广告,A 企业可获得 30 万元利润,B 企业可获得 6 万元利润。(1)画出 A、B 两企业的支付矩阵。(2)求纳什均衡。3.答:(1)由题目中所提供的信息,可画出 A、B 两企业的支付矩阵(如下表)。B 企业 做广告 不做广告 A 企业 做广告 20,8 25,2 不做广告 10,12 30,6 (2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。如果 A 厂商做广告,则 B 厂商的最优选择是做广告,因为做广告所获得的利润 8 大于不做广告获得的利润 2,故在 8 下面划一横线。如果 A 厂商不做广告,则 B 厂商的最优选择也是做广告,因为做广告获得的利润为 12,而不做广告的利润为 6,故在 12 下面划一横线。如果 B 厂商做广告,则 A 厂商的最优选择是做广告,因为做广告获得的利润 20 大于不做广告所获得的利润 10,故在 20 下面划一横线。如果 B 厂商不做广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润 30 大于做广告所获得的利润 25,故在 30 下面划一横线。在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是 A、B 两厂商都做广告。15、求出下面博弈的纳什均衡(含纯策略和混合策略)。乙 L R 甲 U 5,0 0,8 D 2,6 4,5 由划线法易知,该矩阵博弈没有纯策略 Nash 均衡。可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 可得混合策略 Nash 均衡(9891,),(7374,)16、某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由如下得益矩阵给出:(1)该博弈是否存在纳什均衡如果存在的话,哪些结果是纳什均衡 参考答案:由划线法可知,该矩阵博弈有两个纯策略 Nash 均衡,即(低质量,高质量),(高质量,低质量)。乙企业 高质量 低质量 甲企业 高质量 50,50 100,800 低质量 900,600-20,-30 该矩阵博弈还有一个混合的纳什均衡 Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630,可得13863y,9712x 因此该问题的混合纳什均衡为)13875,13863(),9785,9712(。17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施 乙企业 开发 不开发 甲企业 开发-10,-10 100,0 不开发 0,100 0,0 解:用划线法找出问题的纯策略纳什均衡点。0,0100,00,10010,10 所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。该博弈还有一个混合的纳什均衡(111,1110),(111,1110)。如果乙企业所在国政府对企业开发新产品补贴 a 个单位,则收益矩阵变为:0,0a100,00,100a10,10,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需 a10。此时乙企业的收益为 100+a。18、博弈的收益矩阵如下表:乙 左 右 甲 上 a,b c,d 下 e,f g,h (1)如果(上,左)是占优策略均衡,则 a、b、c、d、e、f、g、h 之间必然满足哪些关系(尽量把所有必要的关系式都写出来)(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足 (3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡为什么(4)在什么情况下,纯战略纳什均衡不存在 答:(1)ea,gc,db,hf。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为),(),(hdfb;而对甲而言,占优策略为),(),(geca。综合起来可得到所需结论。(2)纳什均衡只需满足:甲选上的策略时,db,同时乙选左的策略时,ea。故本题中纳什均衡的条件为:db,ea。(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。(4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。19、Smith 和 John 玩数字匹配游戏,每个人选择 1、2、3,如果数字相同,John 给 Smith 3 美元,如果不同,Smith 给 John 1 美元。(1)列出收益矩阵。(2)如果参与者以 1/3 的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少 答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。John 1 2 3 Smith 1 3,-3-1,1-1,1 2-1,1 3,-3-1,1 3-1,1-1,1 3,-3 (2)Smith 选(1/3,1/3,1/3)的混合概率时,John 选 1 的效用为:31131131)3(311U John 选 2 的效用为:31131)3(311312U John 选 3 的效用为:31)3(311311313U 类似地,John 选(1/3,1/3,1/3)的混合概率时,Smith 选 1 的效用为:31)1(31)1(313311U Smith 选 2 的效用为:31)1(31331)1(312U Smith 选 3 的效用为:31331)1(31)1(313U 因为321UUU,321UUU,所以:)31,31,31(),31,31,31(是纳什均衡,策略值分别为 John:31U;Smith:31U。20、假设双头垄断企业的成本函数分别为:1120QC,2222QC,市场需求曲线为QP2400,其中,21QQQ。(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润,并以图形表示。(3)说明导致上述两种均衡结果差异的原因。答:(1)对于垄断企业 1 来说:219020)(2400max211121QQQQQQ 这是垄断企业 1 的反应函数。其等利润曲线为:21211122380QQQQ 对垄断企业 2 来说:4502)(2400max1222221QQQQQQ 这是垄断企业 2 的反应函数。其等利润曲线为:22212242400QQQQ 在达到均衡时,有:308024501902111QQQQ 均衡时的价格为:180)3080(2400P 两垄断企业的利润分别为:12800802308028038021 3600304308023040022 均衡点可图示为:(2)当垄断企业 1 为领导者时,企业 2 视企业 1 的产量为既定,其反应函数为:4/5012QQ 则企业 1 的问题可简化为:3/803/280204502400max211111QQQQQQ 均衡时价格为:16038032802400P 利润为:3/392001,9/256002 该均衡可用下图表示:企业 2 领先时可依此类推。(3)当企业 1 为领先者时,其获得的利润要比古诺竞争下多。而企业 2 获得的利润较少。这是因为,企业 1 先行动时,其能考虑企业 2 的反应,并以此来制定自己的生产计划,而企业 2 只能被动地接受企业 1 的既定产量,计划自己的产出,这是一种“先动优势”21、在一个由三寡头操纵的垄断市场中,逆需求函数为 p=a-q1-q2-q3,这里 qi是企业 i 的产量。每一企业生产的单位成本为常数 c。三企业决定各自产量的顺序如下:(1)企业 1 首先选择 q10;(2)企业 2 和企业 3 观察到 q1,然后同时分别选择 q2和 q3。试解出该博弈的子博弈完美纳什均衡。答:该博弈分为两个阶段,第一阶段企业 1 选择产量 q1,第二阶段企业 2 和 3 观测到 q1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。(1)假设企业 1 已选定产量 q1,先进行第二阶段的计算。设企业 2,3 的利润函数分别为:223212cqq)qqqa(323213cqq)qqqa(由于两企业均要追求利润最大,故对以上两式分别求一阶条件:0232122cqqqaq (1)0cq2qqaq32133 (2)求解(1)、(2)组成的方程组有:3cqaqq1*3*2 (3)(2)现进行第一阶段的博弈分析:对与企业 1,其利润函数为;113211cqq)qqqa(将(3)代入可得:3)cqa(q111 (4)式(4)对 q1求导:0cq2aq111 解得:)ca(21q*1 (5)此时,2*1)ca(121(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:)ca(21q*1,)ca(61qq*3*2 25、某寡头垄断市场上有两个厂商,总成本均为自身产量的 20 倍,市场需求函数为 Q=200-P。求(1)若两个厂商同时决定产量,产量分别是多少(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何 答:(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60(2)200-2Q=20,Q=90,Q1=Q2=45 26、一个工人给一个老板干活,工资标准是 100 元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于 50 元的负效用,老板想克扣工资则总有借口扣掉 60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80 元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问:(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型用得益矩阵或扩展形表示 该博弈并作简单分析。(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型用得益矩阵或扩展形表示该博 弈并作简单分析。(1)完全信息动态博弈。博弈结果应该是工人偷懒,老板克扣。(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。28、给定两家酿酒企业 A、B 的收益矩阵如下表:A 企业 白酒 啤酒 B 企业 白酒 700,600 900,1000 啤酒 800,900 600,800 表中每组数字前面一个表示 B 企业的收益,后一个数字表示 B 企业的收益。(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡(2)存在帕累托改进吗如果存在,在什么条件下可以实现福利增量是多少(3)如何改变上述 A、B 企业的收益才能使均衡成为纳什均衡或占优策略均衡如何改变上述 A、B 企业的收益才能使该博弈不存在均衡 答:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由 800+900 变为 900+1000,增量为 200。(3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。30、在纳税检查的博弈中,假设 A 为应纳税款,C 为检查成本,F 是偷税罚款,且 C1/4 时,才存在子博弈完美纳什均衡。37、在Bertrand价格博弈中,假定有n个生产企业,需求函数为P=a-Q,其中P是市场价格,Q是n个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子是多少。并请解释与n的关系。分析:此题可分解为3个步骤 (1)n个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得垄断利润 (3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。参考答案:(1)设每个企业的边际成本为c,固定成本为0 P=a-Q TR=P*Q=(a-Q)*Q MR=a-2Q 因为:MR=MC a-2Q=c 则:Q=(a-c)/2 P=(a+c)/2 =(P-c)*Q=(a-c)2/4 每家企业的利润为(a-c)2/4n (2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场,获得所有的垄断利润(a-c)2/4 (3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0 考虑:A企业不降价:(a-c)2/4n,(a-c)2/4n,A企业降价:(a-c)2/4,0,使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。设贴现因子为 A不降价的贴现值:(a-c)2/4n1/(1-)A降价的现值:(a-c)2/4 于是:(a-c)2/4n1/(1-)(a-c)2/4 解得:1-1/n 38、假设某劳动市场为完全竞争市场,其供求函数如下:SL:W=120+2L DL:W=360-L 已知某厂商(在完全竞争市场下)的生产函数为 f(L,K)=10L(K=100)且其产品的需求与供给函数分别为 D:P=60-2q S:P=20+2q 试求(a)该厂商的 ACL,MCL及 VMPL各为多少 (b)劳动工资为多少厂商会雇用多少劳动 由:SL=DL解得:W=280 由于产品市场为完全竞争市场,且要素市场也为完全竞争市场 所以,满足:产品市场均衡:P=MR=MC=W/MPL 要素市场均衡:W=ACL=MCL=VMPL 得到:ACL=MCL=VMPL=280 由:D=S解得:P=40,q=10 厂商追求利润最大化的情况下:W*=VMPL=P*MPL=P*50/L*=100/2*PW*2=51(取整数)1.试计算表 1 中的战略式博弈的重复剔除劣战略均衡。表 1 一个战略式表述博弈 B L M R A U 1,2 3,1 2,4 M 5,6 7,1 2,6 D 3,1 2,0 7,8 对 B 而言,战略 M 严格劣于 R;(因为 14,16,08),因此剔除B 的战略 M;构成新的博弈如下 B L R A U 1,2 2,4 M 5,6 2,6 D 3,1 7,8 在新的博弈中,对于 A 而言,战略 U 严格劣于 D(因为 13,27),因此剔除 A 的战略 U,构成新的博弈如下:B L R A M 5,6 2,6 D 3,1 7,8 对于新的博弈中,已经没有严格的劣战略,因此没有严格的劣战略可以剔除。所以该博弈不是重复剔除严格劣战略可解的。但是存在弱劣战略。对于 B 而言,战略 L 弱劣于 R(因为 6=6,18),因此剔除 B 的弱劣战略 L,构成新的博弈如下:B R A M 2,6 D 7,8 在新的博弈中,对于 A 而言,战略 M 严格劣于 D(因为 27),因此剔除 A 的战略 M,构成新的博弈如下:B R A D 7,8 因此,重复剔除(弱)劣战略均衡为(D,R)(ps:如果同学们用划线的方法求纳什均衡,就可以发现纯战略nash 均衡有两个:(M,L)和(D,R)但采用剔除弱劣战略的方法,把其中一个纳什均衡剔除掉了)2.试给出下述战略式表述博弈的所有纳什均衡。2 L R 1 U 2,2 3,3 D 4,4 1,2 给定 1 选择 U,2 的最佳选择是 R(因为 22),在相应位置划线 给定 2 选择 L,1 的最佳选择是 D(理由自己写),在相应位置划线 给定 2 选择 R,1 的最佳选择是 U(理由自己写),在相应位置划线 找两个数字下都划线的,显然有两个纯战略纳什均衡:),(RU和),(LD 据 Wilson 的奇数定理,可能有一个混合战略均衡。设 1 选U的概率为,那么选 D 的概率为1 设 2 选L的概率为,那么选 R 的概率为1,如果存在混合战略,那么 2 选战略 L 和 R 的期望收益应该应该相等,因此应有)1(23)1(42RLUU?自己求解 (2 分)同样,1 选战略 U 和 D 的期望收益应该应该相等)1(14)1(32DUUU?得混合均衡:3.市场里有两个企业 1 和 2。每个企业的成本都为 0。市场的逆需求函数为 P=16-Q。其中 P 是市场价格,Q 为市场总产量。(1)求古诺(Cournot)均衡产量和利润。(2)求斯坦克尔伯格(Stackelberg)均衡产量和利润。(1)设两个企业的产量分别为1q,2q,有21qqQ,因此利润函数分别为:21211121116)16(qqqqqqq 21222221216)16(qqqqqqq 利润最大化的一阶条件分别为:02162111qqq 02161222qqq 因此企业 1 和企业 2 的反应函数分别为:21621qq 21612qq 联立,得到?21 qq。自己求解(2)设企业 1 先行,企业 2 跟进。两个企业的产量分别为1q,2q,因此利润函数分别为:21211121116)16(qqqqqqq 21222221216)16(qqqqqqq 由逆向归纳法,在第二阶段,企业 2 在已知企业 1 的产量的情况下,最优化自己的产量,从而得到企业 2 的反应函数:02161222qqq 因此企业 2 的反应函数为:21612qq 在第一阶段,企业 1 考虑到企业 2 的反应,从而自己的利润函数为:)216(1616)16(11211212111211qqqqqqqqqqq (2 分)要使企业 1 的利润最大,应满足一阶条件:011q 得到?1q。所以?2q。(PS:古诺模型是完全信息静态博弈,求的是纳什均衡;斯坦伯格模型是完全信息动态博弈,求的是子博弈精炼纳什均衡)4.(1)试给出图 1 中的完全信息动态博弈的子博弈精炼均衡和均衡结果。(2)倘若 2 告诉 1:2 的战略是),(jic,问此时 1 的最优战略是什么(3)在(2)中,1 和 2 的战略组合构成一个纳什均衡吗均衡结果是什么(4)(3)中的纳什均衡不是子博弈精炼的,原因是什么 1 a b 2 2 c d e j (1,2)(2,1)1 (6,3)f g (3,2)l i (4,6)(0,2)答:(1)1 a b 2 2 c d e j (1,2)(2,1)1 (6,3)(2 分)f g (3,2)l i (4,6)(0,2)由逆向归纳法,子博弈精炼均衡为),(),(lecgb,均衡结果为(4,6)。(2)若 2 的战略为),(jic,则 1 的最优战略为),(fb。(3)给定 2 的战略为),(jic,1 的最优战略为),(fb;反之,给定1 的战略),(fb,战略),(jic是 2 的一个最优战略。所以它们构成一个纳什均衡,均衡结果为(6,3)。(4)因为 2 的战略),(jic中含有不可置信的威胁i,使 1 在f和g之间不敢选g。当博弈进行到 2 在l与i之间进行选择的时候,2 必会选l,给定如此,1 选g而不是f,此时 2 会选e,这就是子博弈精炼均衡。5、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。1 R (1,2)L L 2 l r l r (2,4)(0,1)(3,1)(7,2)当“2”看见“1”未选R时,设他认为“1”选L的概率为P,“1”选L的概率为 1P,则“2”选l的期望支付为:PPP31)1(14“2”选r的期望支付为 PPP2)1(21 当PP231,即41P时,“2”选l,而给定“2”选l,“1”选L 收益为 2,选L的收益为 3,选 R 的收益为 1,因此“1”会选L。而给定“1”选L,“2”认为410 P(注意:P 是“1”选L的概率),与41P矛盾。故41P不会有均衡;当PP231,即41P时,“2”选r,给定“2”选r,“1”选 L 收益为 0,选L的收益为 7,选 R 的收益为 1,因此“1”会选L。而给定“1”选L,“2”认为0P,与41P吻合。于是,得到均衡战略:rPL,0,,即“1”在第一阶段选择L,“2”虽然看不到“1”的选择,但“2”认为“1”选择 L 的概率为 0,所以“2”在第二阶段选择r,这样的战略构成了一个贝叶斯精炼纳什均衡。均衡结果为(7,2)。