博弈论完整课件[浙江大学]GAME_Cha(1).ppt
Chapter 4 Static Games of Incomplete Information This chapter begins our study of games of incomplete information,also called Bayesian games.Recall that in a game of complete infor-mation the players payoff functions are common knowledge.In a game of incomplete information,in contrast,at least one player is uncertain about another playerpayoff function.One common example of a static game of incomplete informa-tion is a sealed-bid auction:each bidder knows his or her own valuation for the good being sold but does not know any other bidders valuation;bids are submitted in sealed envelopes,so the players moves can be thought of as simultaneous.Most economically interesting Bayesian games,however,are dynamic.As we will see in Chapter 5,the existence of private information leads naturally to attempts by informed parties to com-municate(or mislead)and to attempts by unin-formed parties to learn and respond.This are inherently dynamic issues.一、一、Theory:Static Bayesian Games and Bayesian Nash Equilibrium(一)(一)An Example:Cournot Competition under Asymmetric InformationC1(q1)=Cq1,common knowledge,butC2(q2)=?,firm 2s private informationFirm 2 knows its cost function and firm 1s,but firm 1 only knows its cost function(does not know firm 2s cost function).All of this is common knowledge.Firm 1 knows:firm 2s cost function is C2(q2)=CHq2 with probability and C2(q2)=CLq2 with probability 1-,where CL CH.common knowledge q2*(CH)will solvea-q1*-q2-cH q2q2q2*(CH)=a-q1*-cH2max(1)式:式:q2*(CL)Will solve a-q1*-q2-cL q2maxq2q2*(CL)=a-q1*-cL2q1*Will solvea-q1-q2*(CL)-c q1a-q1-q2*(CH)-c q1(1-)+max q1(2)式:)式:q1*=(1-)a-q2*(CL)-c+a-q2*(CH)-c 2(3)式)式The solutions to 1,2 and 3 areq2*(CH)=(a-2CH+C)/3+(1-)(CH Cl)/6q2*(CL)=(a-2CL+C)/3 (CH Cl)/6 q1*=a-2C+CH+(1-)CL/3不完全信息下古诺竞争的贝叶斯不完全信息下古诺竞争的贝叶斯NE与完全信息下古诺竞争的与完全信息下古诺竞争的NE作比较:作比较:令令a=8,C=2,CH=3,CL=2不完全信息不完全信息(=50%):q2*(CH)=1.45 ,q2*(CL)=1.92,q1*=2.17完全信息完全信息CH=3 也是共同信息(即也是共同信息(即=1):):q2*(CH)=(a-2CH+C)/3=1.33 q2*(CH)=1.45 q1*=2.17q1*=(a-2C+CH)/3=2.33完全信息完全信息CL=2也是共同信息(即也是共同信息(即=0):):q2*(CL)=(a-2CL+C)/3=2 q2*(CL)=1.92 q1*=(a-2C+CL)/3=2 q1*=2.17firm 1的决策要把的决策要把CH和和CL都都考虑在内,考虑在内,firm 2 知道自己的边际成本是知道自己的边际成本是CH(或或CL),),为什么也为什么也要把要把CL(CH)考虑在内?(考虑在内?(#6)(二)、(二)、Normal-Form Representation of Static Bayesian GamesThe normal-form representation of an n-player game of complete information is G=S1,Sn;1,nIn a simultaneous-move game of complete information a strategy for a player is simply an action,so we can write G=A1,An;1,nWe now want to develop the normal-form representation of a simultaneous-move game of incomplete information,also called a static Bayesian game.只要在完全信息静态博弈的标准式表述的基础只要在完全信息静态博弈的标准式表述的基础上家进不完全信息这个因素就行了。上家进不完全信息这个因素就行了。Private Information:共同知识之外的信息;只共同知识之外的信息;只有参与人有参与人i自己知道,其他参与人不知道的信息。自己知道,其他参与人不知道的信息。例如:例如:C2=CL?还是还是C2=CH?厂商厂商2自己知道,自己知道,厂商厂商1不知道,不知道,C2是厂商是厂商2的私人信息。的私人信息。类型类型Types不完全信息古诺竞争中不完全信息古诺竞争中厂商厂商2的支付函数有两种可能的支付函数有两种可能:(a-q1-q2-CL)q2 或或 (a-q1-q2-CH)q2厂商厂商1的支付函数只有一种可能的支付函数只有一种可能:(a-q1-q2-C)q1我们说厂商我们说厂商2的类型空间为的类型空间为T2=CH,CL,厂厂商商1的类型空间为的类型空间为T1=C。对参与人私人信息的一个完备描述。对参与人私人信息的一个完备描述。注意注意说参与人说参与人i知道自己的支付函数等同于说参与人知道自己的支付函数等同于说参与人i知道自己的类型,类似地,说参与人知道自己的类型,类似地,说参与人i可能不确可能不确定其他参与人的支付函数,也就等同于说参与定其他参与人的支付函数,也就等同于说参与人人i不能确定其他参与人的类型。不能确定其他参与人的类型。tk 表示参与人表示参与人i的第的第k种类型(参与人种类型(参与人i共有共有 K种类型;种类型;Ti 表示参与人表示参与人i的类型空间(类的类型空间(类型集),既型集),既Ti=t1,tk,tK;t=t1,ti,tn 表示一个类型组合,表示一个类型组合,ti-1=t1,ti-1,ti+1,tn 表示除参与人表示除参与人 i之外其他参与人的类型组合。之外其他参与人的类型组合。ti是一个是一个random注意:注意:Ti=t1,tk,tK 及及Pi=p1,pk,pK 是是common knowledge对存在对存在private information 的博弈,的博弈,1967年前年前被认为是没法分析的。被认为是没法分析的。1967-1968年年Harsanyi提出了如下的解决办法提出了如下的解决办法被称为被称为“Harsanyi-Transformation”(囚犯有无江湖义气囚犯有无江湖义气 巫)巫)(1)引入一个虚拟的参与人,记为)引入一个虚拟的参与人,记为N。无须无须确定它的支付函数;它的唯一作用是决定确定它的支付函数;它的唯一作用是决定Ti=t1,tk,tK 及及Pi=p1,pk,pK;(2)N把参与人把参与人i的真实类型只告诉参与人的真实类型只告诉参与人i自自己,把己,把Ti=t1,tk,tK 及及Pi=p1,pk,pK 告诉所有参与人;告诉所有参与人;(3)所有参与人同时行动,从各自的)所有参与人同时行动,从各自的A1中选中选择择a1;(4)除)除N之外所有参与人的支付函数为之外所有参与人的支付函数为i=a1,ai,an;ti。由此某个参与人对参与人由此某个参与人对参与人i的类型不确定转变成的类型不确定转变成为对为对N为参与人为参与人i类型决定的不确定。从而可利类型决定的不确定。从而可利用用Bayesian法则进行分析。法则进行分析。Definition The normal-form representation of an n-player static Bayesian game specifies the players action spaces A1,Ai,An,their type spaces T1,Ti,Tn,their beliefs P1,Pi,Pn,and their payoff functions 1,i,n.Player is type,ti,is privately known by player i,determines player is payoff function,i=a1,ai,an;ti,and ti is a member of the set of possible types,Ti.Player is belief P-i describes is uncertainty about the n-1 other players possible types.We denote this game by G=A1,An;T1,Tn;P1,Pn;1,n.(三三)Definition of Bayesian Nash Equilibrium因为因为N首先行动(决定首先行动(决定ti),),所以参与人的行动所以参与人的行动ai是类型依存的,即有是类型依存的,即有ai(ti),or si(ti),例例 q2*(CL)=q2*(CL,q1*)=q2*CL,q1*C,q2*(CH),q2*(CL)“策略策略”的定义的定义:Definition:在静态贝叶斯博弈在静态贝叶斯博弈G=A1,An;T1,Tn;P1,Pn;1,n中,参与人中,参与人i的的一个策略一个策略就是一个类型依存的函数就是一个类型依存的函数si(ti),其中对其中对Ti,中中的每一个类型的每一个类型ti,si(ti)包含了自然赋予包含了自然赋予i的的 可能可能类型为类型为ti时,时,i将从自己的策略空间将从自己的策略空间Si中选择策中选择策略略si或者说从自己的行动空间或者说从自己的行动空间Ai中选择行动中选择行动ai。Definition 在静态贝叶斯博弈在静态贝叶斯博弈G=A1,An;T1,Tn;P1,Pn;1,n中,如果对任意博弈方中,如果对任意博弈方i和和他的每一种可能的类型他的每一种可能的类型tiTi,si*(ti)所选择的行所选择的行动动ai都能满足:都能满足:max uis1*(t1),si-1*(ti-1),ai,si+1*(ti+1),sn*(tn),ti p(t-i ti 则称策略组合则称策略组合 s*=(s1*,sn*)为为G的一的一个个(纯策略)贝叶斯纳什均衡。(纯策略)贝叶斯纳什均衡。(BNE)ai Ai t-i二、二、Applications(一一)不完全信息下公共物品的提供不完全信息下公共物品的提供公共物品的提供涉及搭便车的问题公共物品的提供涉及搭便车的问题Palfrey and Rosenthal,(,(1989)的模型描述:的模型描述:参与人参与人:i=1、2;同时决定是否提供某种公共同时决定是否提供某种公共 物品。物品。行动行动:Ai=0,1,即即ai=1,提供;提供;ai=0,不提供。不提供。支付支付:只要有一人提供,每人得到:只要有一人提供,每人得到1个单位的个单位的 正效用,无人提供,每人效用为零。当正效用,无人提供,每人效用为零。当 然,提供者必须承担成本,设成本分别为然,提供者必须承担成本,设成本分别为c1和和c2,c1和和c2是是私人信息私人信息。支付矩阵如下:支付矩阵如下:参参与与人人1参与人参与人2提供提供不提供不提供提供提供不提供不提供1-c1,1-c21-c1,11,1-c20,0策略策略:si(ci)是从是从c,c到到0,1的所有可能的函数。的所有可能的函数。假定假定c1和和c2具有独立的、相同的具有独立的、相同的c,c上的上的分布分布P(),即有即有P(c)=0,P(c)=1.此为此为共同知识共同知识。从支付矩阵可看出,参与人从支付矩阵可看出,参与人i的的支付函数也可支付函数也可表示为:表示为:i(si,sj,ci)=max(ai,aj)-ciai,如果成本如果成本“过高过高”(cc*),),无人提供,尽管无人提供,尽管有正的效用存在。有正的效用存在。二、第一价格密封拍卖二、第一价格密封拍卖 (first-price,sealed-bid auction)两个两个Bidder,投标人对商品的估价为投标人对商品的估价为 v,叫价为叫价为 b,叫价最高者得标的物,成交价叫价最高者得标的物,成交价就是他(她)的叫价。就是他(她)的叫价。三、双向拍卖三、双向拍卖买方与卖方对自己的估价都存在私人信息买方与卖方对自己的估价都存在私人信息股市中交易的电子撮合系统:股市中交易的电子撮合系统:p=Pb+ps2标准式表述:标准式表述:参与人:一个买方、一个卖方;参与人:一个买方、一个卖方;策略:买方策略:买方pb(vb),卖方卖方 ps(vs),卖方估价卖方估价vs,顺序:同时报价顺序:同时报价信息:信息:vb、vs 均为私人信息,并且服从均为私人信息,并且服从 0,1区间的均匀分布区间的均匀分布信息不完全信息不完全支付函数:买方支付函数:买方 vb-(pb+ps)/2 卖方(卖方(pb+ps)/2-vs 前提是前提是pb大于或等于大于或等于 ps,否则不成否则不成 交,双方支付均为零。交,双方支付均为零。进一步的,支付函数分别是:进一步的,支付函数分别是:买方有买方有:vb Pb+Eps(vs)|Pb=ps(vs)/2 Prob.Pb=ps(vs)其中其中E为在卖方价格小于买方价格的条件下,为在卖方价格小于买方价格的条件下,卖方价格的期望值。卖方价格的期望值。卖方有:卖方有:Ps+Epb(vb)|Pb(vb)=ps/2 vs Prob.Pb=ps(vs)其中其中E为在买方价格大于卖方价格的条件下,为在买方价格大于卖方价格的条件下,买方价格的期望值。买方价格的期望值。考虑两种类型的策略:考虑两种类型的策略:“一价均衡一价均衡”策略和策略和 线性策略线性策略一价策略:一价策略:买方买方如果如果vb=x,Pb=x,否则否则Pb=0;卖方卖方如果如果vs w时,选择时,选择芭蕾,否则选足球;大海在芭蕾,否则选足球;大海在th 超过某临界值超过某临界值h,即即th h时,选择足球,否则选芭蕾时,选择足球,否则选芭蕾.上述策略中,小娟选芭蕾的概率上述策略中,小娟选芭蕾的概率 pw(芭芭)=(x-w)/x,选足球的概率选足球的概率 pw(足足)=w/x;大海选足球的概率大海选足球的概率ph(足足)=(x-h)/x,选选芭蕾的概率芭蕾的概率ph(芭芭)=h/x。对每个给定的对每个给定的x,计算计算w和和h,以使双方上述策以使双方上述策略组合满足略组合满足BNE条件。条件。当当W=h=(-3+.)时,双方的上述策略构成时,双方的上述策略构成纯策略纯策略BNE。pw(芭芭)=pw(芭芭)=(x-w)/x=(x-h)/x=(-3+)/2x当当x趋向于趋向于0时,上述概率趋向于?时,上述概率趋向于?2/3也就是,随着不完全信息的消失,参与人在静也就是,随着不完全信息的消失,参与人在静态贝叶斯博弈纯策略态贝叶斯博弈纯策略BNE下的行动趋向于完全下的行动趋向于完全信息静态博弈混合策略信息静态博弈混合策略NE下的行动。下的行动。三、机制设计(三、机制设计(mechanism design)拍卖方式选择、商家价格优惠表的设计、拍卖方式选择、商家价格优惠表的设计、国家税收政策的制订、保险公司收费和赔国家税收政策的制订、保险公司收费和赔偿政策的制订,等等。偿政策的制订,等等。机制设计是一种特殊的不完全信息博弈。存在机制设计是一种特殊的不完全信息博弈。存在一个一个“委托人委托人”(principal)和一个或多个代理和一个或多个代理人人(agents);往往是委托人的支付函数是往往是委托人的支付函数是 common knowledge,代理人的支付函数是代理人的支付函数是private information委托人的目的是要使自己的期望效用委托人的目的是要使自己的期望效用最大化,为此他要选择一个机制,而最大化,为此他要选择一个机制,而不是使用一个给定的机制。这是机制不是使用一个给定的机制。这是机制设计的一个基本特征。设计的一个基本特征。1、参与约束(、参与约束(participation constraint)个人理性约束个人理性约束(individual constraint)委托人在设计机制时面临两个约束:委托人在设计机制时面临两个约束:2、激励相容约束、激励相容约束(incentive-compatibility constraint)给定委托人不知道代理给定委托人不知道代理 人类型的情况下,代理人在该机制下人类型的情况下,代理人在该机制下 必须有积极性选择委托人希望他选择必须有积极性选择委托人希望他选择 的行动。显然,只有当代理人选择委的行动。显然,只有当代理人选择委 托人希望他选择的行动所得到的期望托人希望他选择的行动所得到的期望 效用不小于他选择其他行动所得到的效用不小于他选择其他行动所得到的 期望效用时,代理人才会有积极性选期望效用时,代理人才会有积极性选 择委托人希望他选择的行动。这一约择委托人希望他选择的行动。这一约束束条件要求所设计的机制能激励代条件要求所设计的机制能激励代理人说出自己的私人信息、公布自理人说出自己的私人信息、公布自己的真实类型,即要能保证代理人己的真实类型,即要能保证代理人按照机制的要求做比不按照机制的按照机制的要求做比不按照机制的要求做要好。要求做要好。可行机制可行机制(feasible machanism)可实施机制可实施机制(implementable)可行的可实施的机制可行的可实施的机制 委托人的问题就是要选择一个可行的可实委托人的问题就是要选择一个可行的可实施的机制以最大化他的期望效用。施的机制以最大化他的期望效用。典型的机制设计是一个三阶段的不完全信息典型的机制设计是一个三阶段的不完全信息动态博弈:动态博弈:(1)委托人设计一个机制)委托人设计一个机制/constraint/incentive scheme.这里,机制这里,机制是一个博弈规则(它规定是一个博弈规则(它规定代理人以什么方式代理人以什么方式发发message,并根据实现的并根据实现的message来决定资来决定资源配置结果。源配置结果。(2)代理人对委托人设定的机制代理人对委托人设定的机制同时决定接受或不接受。(同时决定接受或不接受。(3)接受的代理人)接受的代理人根据机制的规定进行博弈。根据机制的规定进行博弈。可行的可实施的机制会很多,逐一设计出可行的可实施的机制会很多,逐一设计出它们,比两两比较以选择最优是一项十分它们,比两两比较以选择最优是一项十分庞大的工作。庞大的工作。“显示原理显示原理”使这项工作简化使这项工作简化显示原理显示原理The revelation principle(Myerson,1979):任何贝叶斯博弈的任何任何贝叶斯博弈的任何BNE,都可以重新表示为一个激励相容的直接机都可以重新表示为一个激励相容的直接机制。制。“直接直接”指代理人的策略空间等同于指代理人的策略空间等同于类型空间。类型空间。显示原理意味着委托人可通过代理人显示原理意味着委托人可通过代理人之间的静态贝叶斯博弈来获得自己的之间的静态贝叶斯博弈来获得自己的最大期望效用。最大期望效用。比如拍卖的直接机制的设计:比如拍卖的直接机制的设计:第一第一 卖方可以将其分析集中在以下类型的博卖方可以将其分析集中在以下类型的博弈:弈:(1)买方同时申明(可能并不诚实)自)买方同时申明(可能并不诚实)自己对己对拍卖物品的估价(类型)。买方拍卖物品的估价(类型)。买方i可以可以自称其类型空间自称其类型空间Ti 中的任一类型中的任一类型ti#,而不管他的真实类型是什么。而不管他的真实类型是什么。(2)给定买方的声明组合)给定买方的声明组合(t1#,t2#,tn#),买方买方i以以概率概率p(t1#,t2#,tn#)、以以价格价格v(t1#,t2#,tn#)拍得拍得物品。物品。第二第二 卖方把分析集中于这样的直接机制,卖方把分析集中于这样的直接机制,其中每一个卖方都声明自己所属的真实类其中每一个卖方都声明自己所属的真实类型(实话实说)构成一个型(实话实说)构成一个BNE。即设计适当的中标概率和价格函数,使得实即设计适当的中标概率和价格函数,使得实话实说构成话实说构成BNE的直接机制就是满足激励相的直接机制就是满足激励相容约束条件的直接机制。容约束条件的直接机制。例子例子P169作业:作业:1.Watson书,书,P244,第第3题;题;2.Watson书,书,P260,第第6题;题;3.Watson书,书,P270,第第6题;题;4.试解出下面静态贝叶斯博弈的所有纯策略试解出下面静态贝叶斯博弈的所有纯策略贝叶斯纳什均衡:贝叶斯纳什均衡:(1)自然以均等的概率决定参与人的支付由)自然以均等的概率决定参与人的支付由下面的支付矩阵下面的支付矩阵1给出还是由支付矩阵给出还是由支付矩阵2给出;给出;(2)参与人)参与人1观测到自然的选择是支付矩阵观测到自然的选择是支付矩阵1还是支付矩阵还是支付矩阵2,但参与人,但参与人2无法观测到;无法观测到;(3)参与人)参与人1选择选择T或或B,参与人参与人2选择选择L或或R;(4)根据自然的选择,两参与人得到相应的根据自然的选择,两参与人得到相应的支付。支付。2L B T 1B1,1 0,00,0 0,0 2L B T 1B0,0 0,00,0 2,2支付矩阵支付矩阵1支付矩阵支付矩阵2 5、在第一价格密封拍卖博弈中,投标者的估价相互、在第一价格密封拍卖博弈中,投标者的估价相互独立并均匀分布于区间独立并均匀分布于区间0,1上。设有上。设有n个投标者,个投标者,使证明该博弈的贝叶斯纳什均衡是各投标者都以各自使证明该博弈的贝叶斯纳什均衡是各投标者都以各自估价的估价的(n-1)/n倍作为投标价格。倍作为投标价格。