不完全信息条件下演化博弈均衡的稳定性分析.pdf
《不完全信息条件下演化博弈均衡的稳定性分析.pdf》由会员分享,可在线阅读,更多相关《不完全信息条件下演化博弈均衡的稳定性分析.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2003年7月系统工程理论与实践第7期文章编号:100026788(2003)0720011206不完全信息条件下演化博弈均衡的稳定性分析孙庆文1,陆柳1,严广乐2,车宏安2(1.第二军医大学基础部数学物理教研室,上海200433;2.上海理工大学管理学院,上海200093)摘要:基于不完全信息假设,借鉴生物进化过程中“复制动态”的思想,对非对称22演化博弈均衡进行渐近稳定性分析,完整地给出了其定性行为的拓扑等价分类,针对一些熟知的博弈模型介绍了若干新的结果,最后简要讨论了演化博弈论分析框架对经济行为模式动力学解释的意义关键词:演化博弈论;渐近稳定性;动力系统;拓扑等价;系统科学中图分类号:F
2、224.32文献标识码:AA symptotic Stability of Evolutionary Equilibriumunder I mperfect Know ledgeSUN Q ing2w en1,LU L iu1,YAN Guang2le2,CHE Hong2an2(1.Department ofM athematics and Physics,SecondM ilitaryM edicalU niversity,Shanghai 200433,China;2.DepartmentofM anagement Science,U niversity of Shanghai for
3、Science and Technology,Shanghai 200093,China)Abstract:Based on i mperfect know ledge and the strategic adjustment process,the paper establishesthe dynam ic equations of 22 asymmetric evolutionary game and classifies topologically its qualitativeproperty to dealw ith the problem of evolutionary stabi
4、lity.W ith the application of these studies to someeconom ic game models,we come to some rigorous conclusions.Finally,we surveys the practical valueof the framework based on evolutionary game theory.Key words:evolutionary game theory;asymptotical stability;dynam ic system;topological equivalence收稿日期
5、:2002205228作者简介:孙庆文(1968-),男,安徽人,副教授,理学硕士,研究方向为博弈论、信息经济学、卫生经济与医院管理1引言纳什均衡是博弈论中最重要的概念,它描述了“任何博弈方都不值得单独改变自己的策略”这一境况纳什均衡得以实现的前提是现代主流博弈论的“完全理性”假设,它要求博弈参与人具备“无限回归推理”能力1,或即,参与人掌握了“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道,”这类共同知识2 特别地,完全理性要求参与人必须具备“理性的共同知识(common know ledge of rationality)”,例如,在复杂的、多层次
6、的交互推理中,参与人不会犯错误,不会相互怀疑对方的理性、能力、信任和对信任的信任,等等3 我们并不反对“经济人”假设,即人总是在约束条件下争取自身效用最大化,但在实际经济生活中,我们不可能假定参与人总是处于“喜怒哀乐之未发”的“中庸”之“中”态,冷静地做出完全理性的决策,而必须考虑到博弈参与人的决策可能会受到很多暂时性的非理性因素的干扰,这种暂时性的干扰可能会破坏其他参与人对该参与人的理性的预期,从而导致均衡未必能够实现另一方面,由于信息总是不完全的(这本身就是一种约束条件),例如,博弈的一方不可能对西蒙所谓的“潜藏在消费者(博弈的另一方)内心的影子般的效用函数”给予充分的关注并获得完备的信息
7、4,所以,博弈参与人一般无法满足现代主流博弈论关于“完全理性”的前提假设,而是在实践中遵循“试 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.探、学习、适应、成长”的行为逻辑,即通常所谓的“摸着石头过河”为研究策略的动态调整过程,人们从生物进化中得到启示,基于策略在世代更迭中的适应性提出了“演化稳定策略”(evolutionary stable strategy,ESS)的概念5,即,在重复博弈中,仅仅具备有限信息的个体根据其既得利益不断地在边际上对其策略进行调整以追求自身利益的改善,不断地用“较满足的
8、事态代替较不满足的事态”,最终达到一种动态平衡,在这种平衡状态中,任何一个个体不再愿意单方面改变其策略,称这种平衡状态下的策略为演化稳定策略,并称这样的博弈过程为演化博弈由于信息有限的缘故,这种调整过程不可避免地会缺乏远见,但正如凯恩斯所说的“从长期来说,我们都会死去”,因而,这种“短视”又不可避免地在历史过程中获得了其存在的合理性由于涉及到策略的动态调整过程,对不完全信息演化稳定性的分析需要利用动态系统方法,而且这样的调整过程一般都是非线性的,因此,即便是对最简单的不完全信息22重复博弈,目前的结果仍然局限于具有对称支付矩阵的情形,而对于具有非对称支付矩阵的不完全信息演化博弈,虽然存在着一些
9、个案分析,但尚无一般化的结果6-8 本文结合系统科学关于动态过程和动力机制的观点,用动力系统方法分析非对称的22重复博弈的演化稳定性,对其定性行为给出完整的拓扑等价分类2演化博弈的动态复制系统考虑22非合作重复博弈,其阶段博弈的矩阵式表述如表1.其中,y和1-y分别表示参与人A在一次博弈中采取策略A1和A2的概率,x和1-x分别表示参与人B采取策略B2和B1的概率(这样的表示只是为了方便后面对系统相图进行描绘),其中,概率也可以解释为群体博弈中选取该策略的参与人比例BB1(1-x)B2(x)AA1(y)A2(1-y)a,eb,fc,gd,h显然,参与人A采取纯策略A1和A2的平均支付(payo
10、ff)分别是E(A1)=a(1-x)+bx,E(A2)=c(1-x)+dx以y和(1-y)的概率选取策略A1和A2的平均支付是E(A)=ya(1-x)+bx+(1-y)c(1-x)+dx而参与人B采取纯策略B1和B2的平均支付分别是E(B1)=ey+g(1-y),E(B2)=f y+h(1-y)以(1-x)和x的概率选取策略B1和B2的平均支付是E(B)=(1-x)ey+g(1-y)+xf y+h(1-y)值得注意的是,这里并不需要假设阶段博弈的支付参数a,b,c,d,e,f,g,h对参与人构成共同知识实际上,参与人甚至可以不知道自己的支付参数,他们只需对既往的对局结果加以统计便可以得到上述各
11、种平均支付水平的有关信息因此,这里的博弈参数仅供研究者用来做比较静态分析以及对经济行为进行预测时使用9假设参与人的理性层次较低、学习速度较慢,他们只是简单地依据过去多次博弈之所得而调整各自对两种策略的选择概率,这种动态调节机制类似于生物进化中生物性状和行为特征的动态演化过程的“复制动态”3,10 如果统计结果表明某一特定策略的平均支付高于混合策略的平均支付,则他将倾向于更多地使用这种策略,假设其使用频率的相对调整速度与其支付超过平均支付的幅度成正比,则A、B对y和x的调整方程为21系统工程理论与实践2003年7月 1995-2005 Tsinghua Tongfang Optical Disc
12、 Co.,Ltd.All rights reserved.dxdt=xE(B2)-E(B)dydt=yE(A1)-E(A)即动态系统dxdt=x(1-x)(f-e+g-h)y-(g-h)dydt=y(1-y)(a-c)-(a-c+d-b)x一般地,我们称其为动态复制系统3演化平衡策略的渐近稳定性分析显然,对任意的初始点(x(0),y(0)0,10,1,有(x(t),y(t)0,10,1,因此,动态复制系统的解曲线上任意一点(x,y)均对应着演化博弈的一个混合策略偶(1-x)?x,y?(1-y)定义1称动态复制系统平衡点所对应的策略组合为演化博弈的一个均衡,简称为演化均衡显然,该动态复制系统有平
13、衡点E1(0,0),E2(1,0),E3(0,1),E4(1,1),又,当0a-ca-c+d-b,g-hf-e+g-hc,bd,ef,gh时,复制系统有四个平衡点E1E4,其中,E3为稳定的结点,E1为不稳定的结点,E2与E4为鞍点2)当ac,bd,eh时,系统有四个平衡点E1E4,其中,E1为稳定的结点,E3为不稳定的结点,E2与E4为鞍点类似地,我们有:3)当ad,ef,gc,bf,gh时,复制系统有四个平衡点E1E4,其中,E3为稳定的结点,E4为不稳定的结点,E1与E2为鞍点5)当ac,bf,gc,bd,eh时,复制系统有四个平衡点E1E4,其中,E4为稳定的结点,E2为不稳定的结点,
14、E1与E3为鞍点7)当ad,ef,gh时,复制系统有四个平衡点E1E4,其中,E1为稳定的结点,E2为不稳定的结点,E3与E4为鞍点8)当ac,bd,ef,gc,bd,ef,gh时,复制系统有四个平衡点E1E4,其中,E4为稳定的结点,E1为不稳定的结点,E2与E3为鞍点10)当ac,bf,gh时,复制系统有四个平衡点E1E4,其中,E1为稳定的结点,E4为不稳定的结点,E2与E3为鞍点类似地,我们有:(11)当ac,bd,ef,gc,bd,ef,gh时,复制系统有四个平衡点E1E4,其中E3为稳定的结点,E2为不稳定的结点,E1与E4为鞍点定理313)当ac,bf,gh时,复制系统有五个平衡
15、点E1E5,其中,E2和E3为稳定的结点,E1和E4为不稳定的结点,E5为鞍点14)当ad,eh时,复制系统有五个平衡点E1E5,其中,E1和E4为稳定的结点,E2为E3为不稳定的结点,E5为鞍点根据a,b,c,d,e,f,g,h的相对大小,对复制系统在平衡点附近进行线性稳定性分析,容易证明定理1、定理2和定理3(参见9)定理415)当ad,ef,gc,bd,eh时,复制系统有五个平衡点E1E5,其中,E1E4为鞍点,E5为中心为证明定理4,我们先给出如下引理:31第7期不完全信息条件下演化博弈均衡的稳定性分析 1995-2005 Tsinghua Tongfang Optical Disc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不完全 信息 条件下 演化 博弈 均衡 稳定性 分析
限制150内