博弈论与信息经济学讲义8blwf.pptx
博弈论与信息经济学(Game Theory and Information Economics)张玲玲中国科学院研究生院管理学院主要内容简介第一章 概述-人生处处皆博弈n 第一篇 非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡第三章 完全信息动态搏弈-子博弈精炼纳什均衡第四章 不完全信息静态博弈-贝叶斯纳什均衡第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n第二篇 信息经济学 第六章 委托-代理理论(I)第七章 委托-代理理论(II)第八章 逆向选择与信号传递 主要内容简介第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n 一 精练贝叶斯纳什均衡 基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡n 二 信号传递博弈及其应用举例n 三 博弈论概念简要总结基本思路-不完全信息动态博弈n 类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不知道。-不完全信息n 行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观测到其类型。-动态博弈 但是,参与人是类型依存型的,每个参与人的行动都传递有关自己类型的信息,后行动者可以通过观察先行动者的行动来推断自己的最优行动。先行动者预测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息。n 不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。n 精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。基本思路-不完全信息动态博弈n 成语故事:黔之驴-驴虎博弈 老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的,毛驴也是如此。最终老虎将毛驴吃掉。基本思路-不完全信息动态博弈n 市场进入博弈:n 参与人:在位者,进入者;T=1,市场上只有一个垄断企业,在位者,一个潜在进入者考虑是否进入;如果进入者进入,两个企业进行库挪特博弈,在位者获得垄断利润。n 类型:在位和有两种类型,高成本或低成本,进入者在博弈开始时只知道在位者高成本的概率是x,低成本概率是1-x。称为先验概率。n 对于在位者:价格 P=4 P=5 P=6在位者高成本时的利润 2 6 7在位者低成本时的利润 6 9 8基本思路-不完全信息动态博弈 进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在位者高成本函数相同。T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为高成本,企业企业成本函数相同,对称库诺特均衡产量下的价格p=5时,每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本,两个企业成本函数不同,非对称库诺特均衡产量下的价格p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。价格 P=4 P=5 P=6在位者高成本时的利润 2 6 7在位者低成本时的利润 6 9 8进入者进入在位者 进入者在位者高成本p=5 3 1在位者低成本p=4 5-1N高 低在位者P=5P=6进入不进入进入不进入进入不进入 进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在位者高成本函数相同。T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为高成本,p=5时,每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本,p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。基本思路-不完全信息动态博弈n T=2,企业的行动选择是一个简单的静态博弈决策问题,但在第一阶段,情况要复杂得多:n 进入者是否进入依赖于它对在位者成本函数的判断:给定在位者是高成本时,进入者进入的净利润是1,低成本时进入者的利润是-1,当只当进入者认为在位者是高成本的概率大于1/2时,进入者才选择进入。n 但与静态博弈不同的是,在观测到在位者第一阶段的价格选择后,进入者可以修正对在位者成本函数的先验概率x,因为在位者的价格可能包含其成本函数的信息。价格 P=4 P=5 P=6在位者高成本时的利润 2 6 7在位者低成本时的利润 6 9 8N高 低在位者P=5P=6进入不进入进入不进入进入不进入 进入不进入(6,0)(6,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在位者高成本函数相同。T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为高成本,p=5时,每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本,p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。(7,0)高成本在位者不会选择p=6低成本在位者不会选择p=5基本思路-不完全信息动态博弈n 如:低成本的在位者不会选择p=6,因此,如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本,选择进入是有利可图的。预测到p=6会招致进入者进入,即使高成本的在位者也可能不会选择p=6,而招致进入者的进入。相反,低成本在位者也不会选择p=5,如果p=5会招致进入者进入的话。n 问题的核心是:不同的价格如何影响进入者的后验概率从而影响进入者的进入决策。价格 P=4 P=5 P=6在位者高成本时的利润 2 6 7在位者低成本时的利润 6 9 8基本思路-不完全信息动态博弈n 一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入,从而使在位者在第二阶段得到的是垄断利润而不是库诺特均衡利润,如果垄断利润与库诺特均衡利润的差距足够大,如果在位者有足够的信心选择一个非单阶段最优价格可能是最优的。n 在均衡情况下,在位者究竟选择什么价格,不仅与成本函数有关,而且与进入者的先验概率x有关。而不关x为多少,单阶段最优垄断价格不构成均衡。基本思路-不完全信息动态博弈n 在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡该概念没有规定参与人如何修正自己的信念。但是,如果进入者可以任意修订自己有关在位者成本函数的信念,上述不完全信息动态博弈可以有任意均衡。n 如假定x1/2,下列战略组合是一个贝叶斯均衡:不论在位者选择什么价格,进入者总认为在位者是低成本的概率为x*1/2,总是选择不进入;搞成本在位者选择p=6,低成本在位者选择p=5。n 但显然这个均衡是不合理的,因为它包含了一个不可置信威胁:进入者不会修正对在位者成本函数的信念。n 给定p=6不可能是低成本在位者的最优选择,如果在位者选择了p=6,进入者为什么仍然认为在位者是高成本的概率小于1/2呢?基本思路-不完全信息动态博弈 完全信息动态博弈中引入了子博弈精练纳什均衡的概念概念剔除那些不可置信的威胁,但是不完全信息动态博弈中,只有一个子博弈,不能将上述方法直接用于求不完全信息动态博弈的均衡解,但可以借用这一方法逻辑。将每个信息集开始的博弈的剩余部分称为一个“后续博弈”,一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。剔除这种不可信行为的方式是:假定参与人(在所有可能情况下)根据贝叶斯规则修正先验概念,并且,每个参与人都假定其他参与人选择的是均衡战略。基本思路-不完全信息动态博弈n 精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:n 1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);n 2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;n 3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n 一 精练贝叶斯纳什均衡 基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡n 二 信号传递博弈及其应用举例n 三 博弈论概念简要总结贝叶斯法则n 在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。n 统计学上,修正之前的判断称为“先验概率”n 修正后的判断称为“后验概率”n 贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。贝叶斯法则n 假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,k和ah分别代表一个特定的类型和一个特定的行动。n 如果我们观察到i选择了ah,i属于k的后验概率是多少?贝叶斯法则 人:好人(GP),坏人(BP)事:好事(GT),坏事(BP)一个好人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):ProbGT=p(GT|GP)*p(GP)+p(GT|BP)*p(GT|BP)假定观测到一个人干了一件好事,那么这个人的是好人的后验概率是:贝叶斯法则 假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:1、是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1 p(GT|BP)=02、这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1 p(GT|BP)=13、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1/2 p(GT|BP)=1/2贝叶斯法则 假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。假定我们原来认为他是个好人,大突然发现他干了一件好事,我们如何看待呢?第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n 一 精练贝叶斯纳什均衡 基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡n 二 信号传递博弈及其应用举例n 三 博弈论概念简要总结精练贝叶斯纳什均衡n 精练贝叶斯均衡是均衡战略和均衡信念的结合,给定信念:是使用贝叶斯法则从均衡战略和所观测到的行动得到的。因此,精练贝叶斯均衡是一个对应的不动点:N高 低在位者P=5P=6进入不进入进入不进入进入不进入 进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 x=1/2时,精练贝叶斯均衡为:低成本在位者选择p=4,高成本在位者选择p=6;进入者选择不进入,如果观测到p=4;进入者选择进入,如果观测到p=6.分离均衡精练贝叶斯纳什均衡高-在位者P=6进入者进入在位者利润:7+3X1/2在位者P=5进入者不进入在位者利润:6+7牺牲1单位换取4单位利润是合算的在位者P=5 给定在位者的后验概率和战略低-在位者P=5进入者不进入在位者利润:9+9最优选择给定两类在位者都选p=5,进入者不能从观测到价格中得到任何信息,x(5)=(1*x)/(1*x+1*(1-x)=x1/2,进入的期望利润x(1)+(1-x)*(-1)=2x-10,不进入的期望利润为0,因此不进入是最优的。混同均衡价格 P=4 P=5 P=6在位者高成本时的利润 2 6 7在位者低成本时的利润 6 9 8精练贝叶斯纳什均衡n 混同均衡n 因为两类在位者选择同样的价格,直观地讲,因为x1/2,如果进入者不能从在位者的价格选择中得到新的信息,她选择不进入。因此,高成本在位者可以通过选择与低成本在位者相同的价格隐藏自己是高成本的事实,低成本在位者也没有必要批露自己是低成本的事实。低-在位者P=4进入者不进入在位者利润:6+9X=1/2低-在位者P=5进入者进入在位者利润:9+5最优选择在位者P=4 给定在位者的后验概率和战略高-在位者P=4进入者不进入在位者利润:2+7给定在位者的战略,x(6)=1和x(4)=0是正确的,因此进入者的最优战略是:如果观测到p=6,选择进入,如果观测到p=4,选择不进入。分离均衡高-在位者P=6进入者进入在位者利润:7+3最优选择在位者P=6精练贝叶斯纳什均衡分离均衡 因为不同类型的在位者选择了不同的价格。低成本在位者选择了非单阶段最优价格p=4;高成本在位者选择了单阶段最优垄断价格p=6 如果低成本在位者选择p=5,无法将自己与高成本在位者分开,进入者将进入,但如果他选择p=4,高成本在位者不会模仿,进入者不进入,因此低成本在位者宁愿放弃3单位的现期利润换取4单位的下期利润。高成本在位者之所以不选择p=4,是因为成本太高,下阶段的4单位例如不足以弥补现期5单位的损失。不完全信息带来的唯一后果是,低成本在位者损失3单位的利润,这也可以说是他为了证明自己是低成本而支付的“认证”费用。价格 P=4 P=5 P=6在位者高成本时的利润 2 6 7在位者低成本时的利润 6 9 8精练贝叶斯纳什均衡n 啤酒-蛋糕博弈n 参与人1是一个善于打架的强者的概率是0.9,是一个不善于打架的弱者的概率是0.1,但是,即使参与人1知道自己能打赢,也不想和别人打架。如果参与人1是弱者,参与人2就想和他打架。参与人2不知道参与人1的类型,但他能够观察参与人1早餐吃什么,如。参与人2知道若者喜欢以蛋糕为早餐,而强者喜欢以啤酒为早餐。两个均衡:无论参与人1是什么类型,都选择啤酒做早餐,参与人2选择不打架;无论参与人是什么类型,都选择蛋糕作为早餐,参与人2选择不打架。-被排除第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n 一 精练贝叶斯纳什均衡 基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡n 二 信号传递博弈及其应用举例n 三 博弈论概念简要总结信号传递博弈及其应用举例n 信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。n 参与人:两个,信号发送者1和信号接收者2;1的类型是私人信息,2 的类型是公共信息(即只有一个类型)。n 博弈顺序:n 1、“自然”首先选择参与人1的类型,参与人1知道,但参与人2不知道。只知道1属于该类型x的先验概率。n 2、参与人1观测到类型x后发出信号n 3、参与人2观测到参与人1发出的信号,使用贝叶斯法则从先验概率得到后验概率,然后选择行动。N高 低在位者P=5P=6进入不进入进入不进入进入不进入 进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)参与人?博弈顺序?博弈结果?市场进入博弈精练贝叶斯纳什均衡n 信号传递博弈的所有可能的精练贝叶斯均衡可以划分为3类:n 分离均衡:不同类型的发送者(参与人1)以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号在分离均衡下,信号准确地揭示出类型。n 混同均衡:不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。n 准分离均衡:一些类型的发送者随机地选择信号,另一些类型的发送者选择特定的信号。练习n 下图是一个信号传递博弈:自然首先选择参与人1的类型,参与人1知道自然的选择,参与人2 不知道,只知道参与人1属于类型t1和t1的可能性相等,参与人1然后选择信号L或R,参与人2选择行动U或D,博弈结束,支付向量如图所示,给出这个博弈所有纯战略分离均衡和混同均衡。Nt1 t21LRUDUDUD UD(1,1)(2,0)(2,2)(0,0)(0,0)(0,1)(1,0)(1,1)0.50.51R L参与人?博弈顺序?博弈结果?22第五章 不完全信息动态博弈-精练贝叶斯纳什均衡n 一 精练贝叶斯纳什均衡 基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡n 二 信号传递博弈及其应用举例n 三 博弈论概念简要总结占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE请各对每种均衡举个例子完全信息静态博弈-纳什均衡占优战略均衡 案例1-囚徒困境-8,-8 0,-10-10,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖抵赖是A的严格劣战略抵赖是B的严格劣战略重复剔除的占优均衡 5,1 4,49,-1 0,0等待小猪大猪按等待按案例2-智猪博弈按是小猪的严格劣战略-剔除4大于10大于-1“按”是大猪的占优战略,纳什均衡:大猪按,小猪等待纳什均衡n 寻找纳什均衡0,4 4,0 5,34,0 0,4 5,33,5 3,5 6,6C2R1R2C1 C3R3参与人B参与人A(R3,C3)是纳什均衡混合战略纳什均衡n 社会福利博弈 23,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的概率:0.2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略完全信息动态搏弈-子博弈精炼纳什均衡n 强盗分金1UDL(1,1)22,0RU(3,0)(0,2)2D 子博弈精练纳什均衡(U,U),L).U和L分别是参与人1和参与人2在非均衡路径上的选择。逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。不完全信息静态博弈-贝叶斯纳什均衡n 贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型i和其他参与人类型依存战略的情况下,最大化自己的期望效用。n 空城计不完全信息动态博弈-精练贝叶斯纳什均衡n 精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:n 1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);n 2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;n 3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。n 黔之驴