不完全信息条件下演化博弈均衡的稳定性分析.pdf
2003年7月系统工程理论与实践第7期文章编号:100026788(2003)0720011206不完全信息条件下演化博弈均衡的稳定性分析孙庆文1,陆柳1,严广乐2,车宏安2(1.第二军医大学基础部数学物理教研室,上海200433;2.上海理工大学管理学院,上海200093)摘要:基于不完全信息假设,借鉴生物进化过程中“复制动态”的思想,对非对称22演化博弈均衡进行渐近稳定性分析,完整地给出了其定性行为的拓扑等价分类,针对一些熟知的博弈模型介绍了若干新的结果,最后简要讨论了演化博弈论分析框架对经济行为模式动力学解释的意义关键词:演化博弈论;渐近稳定性;动力系统;拓扑等价;系统科学中图分类号:F224.32文献标识码:AA symptotic Stability of Evolutionary Equilibriumunder I mperfect Know ledgeSUN Q ing2w en1,LU L iu1,YAN Guang2le2,CHE Hong2an2(1.Department ofM athematics and Physics,SecondM ilitaryM edicalU niversity,Shanghai 200433,China;2.DepartmentofM anagement Science,U niversity of Shanghai for Science and Technology,Shanghai 200093,China)Abstract:Based on i mperfect know ledge and the strategic adjustment process,the paper establishesthe dynam ic equations of 22 asymmetric evolutionary game and classifies topologically its qualitativeproperty to dealw ith the problem of evolutionary stability.W ith the application of these studies to someeconom ic game models,we come to some rigorous conclusions.Finally,we surveys the practical valueof the framework based on evolutionary game theory.Key words:evolutionary game theory;asymptotical stability;dynam ic system;topological equivalence收稿日期:2002205228作者简介:孙庆文(1968-),男,安徽人,副教授,理学硕士,研究方向为博弈论、信息经济学、卫生经济与医院管理1引言纳什均衡是博弈论中最重要的概念,它描述了“任何博弈方都不值得单独改变自己的策略”这一境况纳什均衡得以实现的前提是现代主流博弈论的“完全理性”假设,它要求博弈参与人具备“无限回归推理”能力1,或即,参与人掌握了“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道,”这类共同知识2 特别地,完全理性要求参与人必须具备“理性的共同知识(common know ledge of rationality)”,例如,在复杂的、多层次的交互推理中,参与人不会犯错误,不会相互怀疑对方的理性、能力、信任和对信任的信任,等等3 我们并不反对“经济人”假设,即人总是在约束条件下争取自身效用最大化,但在实际经济生活中,我们不可能假定参与人总是处于“喜怒哀乐之未发”的“中庸”之“中”态,冷静地做出完全理性的决策,而必须考虑到博弈参与人的决策可能会受到很多暂时性的非理性因素的干扰,这种暂时性的干扰可能会破坏其他参与人对该参与人的理性的预期,从而导致均衡未必能够实现另一方面,由于信息总是不完全的(这本身就是一种约束条件),例如,博弈的一方不可能对西蒙所谓的“潜藏在消费者(博弈的另一方)内心的影子般的效用函数”给予充分的关注并获得完备的信息4,所以,博弈参与人一般无法满足现代主流博弈论关于“完全理性”的前提假设,而是在实践中遵循“试 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.探、学习、适应、成长”的行为逻辑,即通常所谓的“摸着石头过河”为研究策略的动态调整过程,人们从生物进化中得到启示,基于策略在世代更迭中的适应性提出了“演化稳定策略”(evolutionary stable strategy,ESS)的概念5,即,在重复博弈中,仅仅具备有限信息的个体根据其既得利益不断地在边际上对其策略进行调整以追求自身利益的改善,不断地用“较满足的事态代替较不满足的事态”,最终达到一种动态平衡,在这种平衡状态中,任何一个个体不再愿意单方面改变其策略,称这种平衡状态下的策略为演化稳定策略,并称这样的博弈过程为演化博弈由于信息有限的缘故,这种调整过程不可避免地会缺乏远见,但正如凯恩斯所说的“从长期来说,我们都会死去”,因而,这种“短视”又不可避免地在历史过程中获得了其存在的合理性由于涉及到策略的动态调整过程,对不完全信息演化稳定性的分析需要利用动态系统方法,而且这样的调整过程一般都是非线性的,因此,即便是对最简单的不完全信息22重复博弈,目前的结果仍然局限于具有对称支付矩阵的情形,而对于具有非对称支付矩阵的不完全信息演化博弈,虽然存在着一些个案分析,但尚无一般化的结果6-8 本文结合系统科学关于动态过程和动力机制的观点,用动力系统方法分析非对称的22重复博弈的演化稳定性,对其定性行为给出完整的拓扑等价分类2演化博弈的动态复制系统考虑22非合作重复博弈,其阶段博弈的矩阵式表述如表1.其中,y和1-y分别表示参与人A在一次博弈中采取策略A1和A2的概率,x和1-x分别表示参与人B采取策略B2和B1的概率(这样的表示只是为了方便后面对系统相图进行描绘),其中,概率也可以解释为群体博弈中选取该策略的参与人比例BB1(1-x)B2(x)AA1(y)A2(1-y)a,eb,fc,gd,h显然,参与人A采取纯策略A1和A2的平均支付(payoff)分别是E(A1)=a(1-x)+bx,E(A2)=c(1-x)+dx以y和(1-y)的概率选取策略A1和A2的平均支付是E(A)=ya(1-x)+bx+(1-y)c(1-x)+dx而参与人B采取纯策略B1和B2的平均支付分别是E(B1)=ey+g(1-y),E(B2)=f y+h(1-y)以(1-x)和x的概率选取策略B1和B2的平均支付是E(B)=(1-x)ey+g(1-y)+xf y+h(1-y)值得注意的是,这里并不需要假设阶段博弈的支付参数a,b,c,d,e,f,g,h对参与人构成共同知识实际上,参与人甚至可以不知道自己的支付参数,他们只需对既往的对局结果加以统计便可以得到上述各种平均支付水平的有关信息因此,这里的博弈参数仅供研究者用来做比较静态分析以及对经济行为进行预测时使用9假设参与人的理性层次较低、学习速度较慢,他们只是简单地依据过去多次博弈之所得而调整各自对两种策略的选择概率,这种动态调节机制类似于生物进化中生物性状和行为特征的动态演化过程的“复制动态”3,10 如果统计结果表明某一特定策略的平均支付高于混合策略的平均支付,则他将倾向于更多地使用这种策略,假设其使用频率的相对调整速度与其支付超过平均支付的幅度成正比,则A、B对y和x的调整方程为21系统工程理论与实践2003年7月 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.dxdt=xE(B2)-E(B)dydt=yE(A1)-E(A)即动态系统dxdt=x(1-x)(f-e+g-h)y-(g-h)dydt=y(1-y)(a-c)-(a-c+d-b)x一般地,我们称其为动态复制系统3演化平衡策略的渐近稳定性分析显然,对任意的初始点(x(0),y(0)0,10,1,有(x(t),y(t)0,10,1,因此,动态复制系统的解曲线上任意一点(x,y)均对应着演化博弈的一个混合策略偶(1-x)?x,y?(1-y)定义1称动态复制系统平衡点所对应的策略组合为演化博弈的一个均衡,简称为演化均衡显然,该动态复制系统有平衡点E1(0,0),E2(1,0),E3(0,1),E4(1,1),又,当0a-ca-c+d-b,g-hf-e+g-hc,bd,ef,gh时,复制系统有四个平衡点E1E4,其中,E3为稳定的结点,E1为不稳定的结点,E2与E4为鞍点2)当ac,bd,eh时,系统有四个平衡点E1E4,其中,E1为稳定的结点,E3为不稳定的结点,E2与E4为鞍点类似地,我们有:3)当ad,ef,gc,bf,gh时,复制系统有四个平衡点E1E4,其中,E3为稳定的结点,E4为不稳定的结点,E1与E2为鞍点5)当ac,bf,gc,bd,eh时,复制系统有四个平衡点E1E4,其中,E4为稳定的结点,E2为不稳定的结点,E1与E3为鞍点7)当ad,ef,gh时,复制系统有四个平衡点E1E4,其中,E1为稳定的结点,E2为不稳定的结点,E3与E4为鞍点8)当ac,bd,ef,gc,bd,ef,gh时,复制系统有四个平衡点E1E4,其中,E4为稳定的结点,E1为不稳定的结点,E2与E3为鞍点10)当ac,bf,gh时,复制系统有四个平衡点E1E4,其中,E1为稳定的结点,E4为不稳定的结点,E2与E3为鞍点类似地,我们有:(11)当ac,bd,ef,gc,bd,ef,gh时,复制系统有四个平衡点E1E4,其中E3为稳定的结点,E2为不稳定的结点,E1与E4为鞍点定理313)当ac,bf,gh时,复制系统有五个平衡点E1E5,其中,E2和E3为稳定的结点,E1和E4为不稳定的结点,E5为鞍点14)当ad,eh时,复制系统有五个平衡点E1E5,其中,E1和E4为稳定的结点,E2为E3为不稳定的结点,E5为鞍点根据a,b,c,d,e,f,g,h的相对大小,对复制系统在平衡点附近进行线性稳定性分析,容易证明定理1、定理2和定理3(参见9)定理415)当ad,ef,gc,bd,eh时,复制系统有五个平衡点E1E5,其中,E1E4为鞍点,E5为中心为证明定理4,我们先给出如下引理:31第7期不完全信息条件下演化博弈均衡的稳定性分析 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.引理1设H为平面C1动力系统的初积分(即H是一个实值函数,它在系统的轨线上是常数),若H在任何开集上不为常数,则不存在极限环11,12定理证明9只证明15)令A=h-g,B=h-g+e-f,C=-(a-c+d-b),D=-(a-c),显然,A,B,C,D 0,B-A=e-f 0,C-D=b-d 0,则动态复制系统可写做:dxdt=x(1-x)(A-B y)dydt=y(1-y)(Cx-D)直线x=D?C和y=A?B将闭区域Q=0,10,1分为四个部分,在右上角区域中,dx?dt 0,在左上角区域中,dx?dt 0,dy?dt 0,dy?dt 0,dy?dt 0所以,对任意的(x(0),y(0)intQ,轨线(x(t),y(t)Q并且在Q内绕E5沿逆时针方向运动 下面讨论轨线是闭轨,还是螺旋地向内趋于E5或趋于一个极限环或趋于Q的边界 5Q令H(x,y)=(D-C)ln(1-x)-Dlnx+(A-B)ln(1-y)-Alny,(x,y)intQ,则H=5H5xdxdt+5H5ydydt=C-D1-x-Dxx(1-x)(A-B y)+B-A1-y-Ayy(1-y)(Cx-D)0故H在复制系统的解曲线上是常数 注意到5H(D?C,A?B)5x=0,5H(D?C,A?B)5y=05H5x 0,x(D?C,1),y(0,1)5H5x 0,x(0,1),y(A?B,1)5H5y 0,wE5,wintQV(w)0,wintQ所以,E5是稳定的平衡点(但并非渐近稳定)又,根据H的偏导数符号,易知H在intQ内的任何开集中不为常数,由引理1,动态复制系统不存在极限环下面证明intQ内每一条解曲线(E5除外)均为闭轨对任意的wintQE5,从w出发的轨线L绕E5螺旋转动,所以,可在开区间S=(x,y):x=D?C,A?By 1上取两点u(D?C,y1)L和v(D?C,y2)L 注意到5H5y在S中严格为正,若y1y2,则H(u)H(v),但H在L上为常数,故H(u)=H(v),矛盾,所以y1=y2,从而L为闭轨 证毕如果将a,b和c,d标记在纵轴上,将e,f和g,h标记在横轴上,则动态复制系统的轨线的走向总是由小参数指向大参数,于是,定理1-4的结果可以很方便地转化为系统的相图 我们有,定理5 系统的相图与图1-图4四种之一或其镜像拓扑等价.定理5完整地给出了动态复制系统定性行为的拓扑等价分类,对具体问题的分析和讨论只需利用该定理的结果 另外,一些退化情形(例如a=c或e=f等)的相图也不难在定理5的基础上做出,不赘述41系统工程理论与实践2003年7月 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.图1定理1情形(1)图2定理2情形(9)图3定理3情形(13)图4定理4情形(15)4应用举例基于不完全信息演化博弈均衡渐近稳定性的分析思路,我们考察了一些被广泛讨论过的非合作博弈模型,得出了一些清晰而严格的结果9,10对合伙制企业,我们发现:1)当合伙人之间相互监督的成本比较低时,合伙制企业得以维持是一个渐近稳定的结果;2)在两人合伙制中,即使监督成本比较高,但只要搭便车的效应不是特别大,合伙制仍然可以得到维持,这也许可以解释为什么产权不清晰的家族制企业在复杂多变的竞争环境中仍然具有生命力;3)在多人合伙制中,如果监督成本高,则“散伙”将是一个渐近稳定均衡对广告均衡问题,我们发现:在行业发展的初期,如果广告的外部效应特别强(即大多数消费者并不是只购买广告宣传中的特定品牌),则所有厂商都将致力于宣传自己的产品,如果广告的外部效应不够强,则特定比例的厂商将大张旗鼓地宣传自己的品牌,另一部分则利用外部效应销售自己的产品这正是W.哈勒根所观察到的广泛存在于经济现实中的“广告多态均衡”现象;在行业发展的成熟期,所有厂商均做广告或均不做广告都是渐近稳定的博弈均衡,做广告还是不做广告取决于产品的需求弹性对公共政策,诸如质量检查、惩治犯罪、税收等,考虑到公共选择理论对政府的经济人假设,我们的模型表明,公共政策的实施过程可以表现出一种周期行为模式(即复制系统的平衡点E5是中心),这是现实经济生活中的一个常见现象,但在一般的博弈模型中,这种周期行为模式是不会出现的针对一个产权博弈模型,我们的结果表明,演化博弈的分析方法可以为博弈论中的“非均衡”、“多重均衡”概念的现实意义以及制度经济学关于“锁定(lock in)”、“路径依赖性”等有关制度变迁的观念模型提供较好的动力学解释5系统观念与演化博弈的经济分析框架经济学本质上应该是一种关于相互作用的过程的科学,但除了奥地利学派(其代表人物有熊彼特和哈耶克)保留了关于“市场过程”的观念之外,主流的新古典经济学基本上只是静态经济学,它们只讨论均衡的性态以及均衡状态的制度是如何运行的,而不考虑偏离均衡以后的动态调整过程以及制度是如何形成和演化的,用Peyton Young的话来说,新古典经济学只描述尘埃落定之后的世界是什么样子,而不管尘埃是如何落定的有鉴于此,用系统的观点考察经济问题,例如,经济系统的自组织、内在动力机制、动态演51第7期不完全信息条件下演化博弈均衡的稳定性分析 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.化等正逐渐引起普遍的关注,在充分认识到新古典经济分析局限性的基础上,经济学家、数学家、物理学家已开始重新思考和审视经济系统13 事实上,经济学诺奖得主萨缪尔森早在1947年就曾经指出,为了使比较静态分析产生较好的结果,必须首先发展动态理论,这就是著名的萨缪尔森反论14我们无法相信人类可以在不完全信息条件下,依靠不完全理性设计出未来的一切,因此,基于完全理性和完全信息假设的主流博弈论在研究制度变迁和制度演化时会遇到很多难以克服的困难另一方面,结合前面的分析,我们不难发现,渐近稳定的均衡点一定是阶段博弈的纳什均衡,但阶段博弈的纳什均衡却不一定渐近稳定例如,在定理3的条件下,E5是阶段博弈的一个纳什均衡,它是鞍点稳定的,在定理4的条件下,阶段博弈的唯一纳什均衡是E5,它是中心稳定的 虽然如此,它们却都具有某种稳定性(例如,鞍点存在着稳定的流形,类似于Ram sey经济增长模型中的“政策函数”),因此,演化博弈均衡的稳定性分析实际上表明了这样一个事实,即,为了实现纳什均衡,完全理性和完全信息假设并非必不可少 换句话说,演化博弈的分析方法为研究人们如何在变动不居的环境中借助不完全理性通过“试探、学习、适应、成长”的行为逻辑而不断地在边际上进行制度创新提供了可能性系统学包括从可识别、可度量的方面阐明系统及其产生、演化的系统形态学和试图解释系统为什么这样产生、演化的系统动力学15系统形态学有三个基本观点:第一,系统或者说事物作为系统,最根本的性质是“稳态”;第二,系统演化需经历两个过程:通信过程以及建立在通信基础上的行为响应过程;第三,系统演化的基本形式是(子)系统耦合生成层级结构(hierarchy)从系统动力学方面考虑,联系三个基本观点的是(子)系统之间相互作用的动态过程:通信和行为响应过程导致“稳态”结果(系统),系统之间相互作用导致新一层次的系统(即新的稳态)这样的系统观事实上概括了几乎所有事物演化过程的规律,诸如,汤因比有关“挑战与回应”的历史观,文化的积淀、融合与传统文化的创造性转化,企业产权制度和企业组织架构的演变,等等演化博弈的分析框架恰恰是对上述系统观的响应,它将经济学中的“均衡观”与生物学中的“适应性”和“物竞天择”的观念相结合,在理性不完全、信息不对称、对别人行为的预期有偏差的条件下,演化博弈描述人们如何通过模仿、学习、试错而不断地对外部世界的冲击做出响应的过程及结果如果我们在这种“适应性”概念中融入文化、知识和信息(例如,法治理念、规则意识)等只有人类才具有的“符号系统”因素(这种“符号系统”使得人类理性对善与正义的辨识得以传播交流并形成共识),演化博弈的建模分析思路有可能形成一种以“知识结构(信息)制度行为稳定的均衡对均衡的认识和理解新的知识结构(信息)”为纲领的制度经济分析模式,实际上,这就是前述系统科学基本观念在经济学中的应用,也正是古典作家如斯密、穆勒、马克思等关于哲学、经济、政治三位一体的政治经济学的学术理想参考文献:1汪丁丁.从交易费用到博弈均衡A.汪丁丁.在经济学与哲学之间C.北京:中国社会科学出版社,1996.2张维迎.博弈论与信息经济学M.上海:三联书店,上海人民出版社,1996.48-50.3谢识予.有限理性条件下的进化博弈理论J.上海财经大学学报,2001,3(5):3-9.4H A西蒙.人工科学M.武夷山 译.北京:商务印书馆,1987.29-55.5L C Thmas.对策论及其应用M.靳敏,等译.北京:解放军出版社,1988.230-242.6Kandori M.Evolutionary game theory in econom ics A.Kreps D,W allis K.A dvances in Econom ics andEconometrics:Theory and Application(Vol.2)C.Cambridge:Cambridge U niversity Press,1997.243-277.7陈学彬.博弈学习理论M.上海:上海财经大学出版社,1999.71-79.8盛昭瀚,蒋德鹏.演化经济学M.上海:上海三联书店,2002.281-326.9孙庆文.经济均衡稳定性分析及应用D.上海:上海理工大学系统工程与系统科学院,1997.31-48.10 孙庆文,严广乐,车宏安.经济均衡稳定性分析及应用J.上海理工大学学报,1998,20(增刊):55-58.11H irschM W,Smale S.微分方程,动力系统和线性代数(下册)M.黄杰 译.北京:高等教育出版社,1987.78-79.12Jackson E A.Perspectives of nonlinear Dynam ics(Vol.1)M.Cambridge:Cambridge U niversity Press,1989.409-413.13方福康.复杂经济系统的演化分析A.许国志.系统研究C.杭州:浙江教育出版社,1997.239-254.14P A萨谬尔森.经济分析基础M.费方域 译.北京:商务印书馆,1992.2-72.15车宏安.软科学方法论研究M.上海:上海科技文献出版社,1995.19-34.61系统工程理论与实践2003年7月 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.