演化博弈论谢识予ppt课件.ppt
有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。第五章 有限理性和进化博弈 本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心,以进化稳定策略为基本均衡概念的进化博弈分析,包括基本方法、概念和各种经典模型等。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。本章分四节5.1有限理性博弈及其分析框架5.2最优反应动态5.3复制动态和进化稳定性: 两人对称博弈5.4复制动态和进化稳定性: 两人非对称博弈有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.1 有限理性博弈及其分析框架5.1.1 有限理性及其对博弈的影响5.1.2 有限理性博弈分析框架有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.1.1 有限理性及其对博弈的影响n有限理性博弈方:不满足完全理性假设的博弈方n有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略n有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离n有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.1.2 有限理性博弈分析框架n最优反应动态最优反应动态:有快速学习能力的小群体成员的反复博弈n复制动态复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈n进化稳定策略进化稳定策略(ESS)有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.2 最优反应动态5.2.1 协调博弈的有限博弈方 快速学习模型5.2.2 古诺调整过程有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.2.1 协调博弈的有限博弈方快速学习模型模型:50,500,4960,6049,0A博弈方博弈方2BAB博博弈弈方方1协调博弈12345有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。反应、策略调整规则推导BtxAtxtxtxBtxtxAiiiiii时,采用;当时,采用当的得益:采用的得益:采用61/22)(61/22)(60)(20)(49)(250)(有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。最优反应动态模拟:初次博弈1个AABABABABBBAAAAABAAAABAABB有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。初次博弈相邻2个AAAAAAAABAABBBAA有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。初次博弈相连3个ABAABAAAAAA有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.2.2 古诺调整过程古诺模型反应函数23231221qqqq 1 2 3 4博弈方1 2.5 1.5 2.125 1.875博弈方2 3 1.75 2.25 1.93751|1221dqdrdqdr问题:两寡头始终假设对方产量不变最优反应动态模拟收敛条件有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.3 复制动态和进化稳定性: 两人对称博弈5.3.1 签协议博弈的复制动态和进化稳定策略5.3.2一般两人对称博弈复制动态和进化稳定策略5.3.3 协调博弈的复制动态和进化稳定博弈5.3.4 鹰鸽博弈的复制动态和进化稳定策略5.3.5 蛙鸣博弈的复制动态和进化稳定策略有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.3.1 签协议博弈的复制动态和进化稳定策略签协议博弈:1,10,00,00,0同意博弈方博弈方2不同意同意不同意博博弈弈方方12)1 (00)1 (00)1 (1xuxuxuxxuxxxunyny假设群体中采用“同意”比例x则不同策略期望得益和平均得益为:有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。n博弈方策略类型比例动态变化是有限理性博弈分析的核心,其关键是动态变化的速度n以采用“同意”策略类型博弈方的比例为例,其动态变化速度可用下列微分方程反映:3222)1 ()()(xxxxxxxuuxdtdxy有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。动态微分方程的相位图dx/dtx010.5n稳定状态、不动点:x*=0, x*=1有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。进化稳定策略的检验2)1 ()1 (000)1 (101)1 (nynyuuuuu2)1 (000)1 (10)1 (ynnyuuuuu策略选择了“不同意”意”比例的博弈方偏离“同策略选择了“同意”同意”比例的博弈方偏离“不ESSxuy是进化稳定策略101不是进化稳定策略00 xuuny有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.3.2一般两人对称博弈复制动态 和进化稳定策略一般模型a, ac, bd, db, c策略1博弈方博弈方2策略2策略1策略2博博弈弈方方1一般2X2对称博弈n进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。n基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。n其中abcd可以是任何得益,根据问题设定。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。复制动态分析2121)1()1()1(uxuxudxcxubxaxu)(1 ()()1 ()(1 (dbxcaxxxuuxxdx/dtx1x)1 ()(2111uxxuuxuuxdtdx复制动态的进化规则是生物学中生物特征进化规则设设x为采用策略为采用策略1的的比例比例复制动态相位图有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.3.3 协调博弈的复制动态 和进化稳定博弈50,500,4960,6049,0策略1博弈方博弈方2策略2策略1策略2博博弈弈方方1一般2*2对称博弈dx/dtx111/16复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。)(1 ()()1 ()(dbxcaxxxxFdtdx)1161)(1 (xxx有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.3.4 鹰鸽博弈的复制动态 和进化稳定策略, 0, v, v, 0鹰博弈方博弈方2鸽鹰鸽博博弈弈方方1鹰鸽博弈2cv 2cv 2v2v有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。复制动态方程和相位图2)1 (2)()1 ()(vxcvxxxxFdtdx)61)(1 (xxxdx/dtx11/6有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.3.5 蛙鸣博弈的复制动态 和进化稳定策略n动物进化竞争是生物多样性、复杂性的基本机制蛙鸣博弈:P-z, P-z1-m, m-z0, 0m-z, 1-m鸣叫雄蛙雄蛙2不鸣鸣叫不鸣雄雄蛙蛙1有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。蛙鸣博弈不同均衡的条件ZM11鸣叫混合策略不鸣叫m=1-P+zm=z有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。蛙鸣博弈复制动态方程和不动点x鸣叫雄蛙比例)(1 ()1()1 (zmxmzPxxxdtdx可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)复制动态方程有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。蛙鸣博弈复制动态相位图xdx/dt1(m-z)/(1-P)0dx/dtx1(m-z)/(1-P)0(m-z)/(1-P)1有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.4 复制动态和进化稳定性: 两人非对称博弈5.4.1 市场阻入博弈的复制动态 和进化稳定策略5.4.2 非对称鹰鸽博弈的进化分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。5.4.1 市场阻入博弈的复制动态和进化稳定策略)1 ()1 (2)1 (11)1 (1)1 ( 22)1 (011111xyxuxuxuyyuyyyunene12进入不进打击不打(0,0)(2,2)(1,5)xxyuyuyuxxxuxxxunsns325)1 (355)1 (2555)1 (022222有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。博弈方1位置博弈群体复制动态相位图xdx/dt1y1/2xdx/dt1y5/6xdx/dt1y1/6ydy/dt1x1/6ydy/dt1x=1/6)61)(1 (22xyyuuydtdye有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。两群体复制动态关系和稳定性xY111/65/6BDCA