第三章-第五节-演化博弈模型ppt课件.ppt
《第三章-第五节-演化博弈模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章-第五节-演化博弈模型ppt课件.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五节第五节 演化博弈模型演化博弈模型“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。o传统博弈理论的两个苛刻假设:传统博弈理论的两个苛刻假设: (1 1)完全理性()完全理性(2 2)完全信息)完全信息o与传统博弈理论不同,演化博弈理论并不要求参与与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。人是完全理性的,也不要求完全信息的条件。o演化博弈论(演化博弈论(Evolutionary Game TheoryEvolutionary Game
2、 Theory)把博弈)把博弈理论分析和动态演化过程分析结合起来的一种理论。理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论。化博弈理论源于生物进化论。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。o为什么将演化思想引入到博弈论中?为什么将演化思想引入到博弈论中?(1 1)博弈论对
3、生物学的影响。博弈论的策略对应生)博弈论对生物学的影响。博弈论的策略对应生物学中的基因物学中的基因 ,博弈论的收益对应生物学中的,博弈论的收益对应生物学中的适应度。在生物学中应用的博弈论与经济学中的适应度。在生物学中应用的博弈论与经济学中的传统博弈论最大区别就是非完全理性的选择。传统博弈论最大区别就是非完全理性的选择。(2 2)演化化思想对社会科学的影响。例如,在市场)演化化思想对社会科学的影响。例如,在市场竞争中,我们不必要去理性的想那个策略才是最竞争中,我们不必要去理性的想那个策略才是最优的,最后能够在市场存活下来的企业,一定是优的,最后能够在市场存活下来的企业,一定是适应能力最强的公司。
4、适应能力最强的公司。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 在演化博弈理论中,演化稳定策略在演化博弈理论中,演化稳定策略 (Evolutionary Stable (Evolutionary Stable Strategy, ESS)Strategy, ESS)和复制动态和复制动态(Replication Dynamics)(Replication Dynamics)是两个核是两个核心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有心概念。演化稳定策略是指在博弈的
5、过程中,博弈双方由于有限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。于是,博弈方在博弈的过程中需要不断进行学习,有过策略失于是,博弈方在博弈的过程中需要不断进行学习,有过策略失误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个稳定的策略。稳定的策略。 复制动态实际上是描述某一特定策略在一个种群中被采用复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动
6、态微分方程,可以用下式表示:的频数或频度的动态微分方程,可以用下式表示:(, )( , )iixistdxuxu x xd“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。o当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演化博弈稳定性问题这就是演化博弈稳定性问题, ,一个稳定状态必须对微小扰一个稳定状态必须对微小扰动具有稳健性才能称为演化稳定策略。也就是说,如果我动具有稳健性才能称为演化稳定策略。也就是说,如果我们假
7、定为演化稳定策略的稳定点,则该点除了本身必须是们假定为演化稳定策略的稳定点,则该点除了本身必须是均衡状态以外,还必须具有这样的性质:如果某些博弈方均衡状态以外,还必须具有这样的性质:如果某些博弈方由于偶然的错误偏离了它们,复制动态仍然会使由于偶然的错误偏离了它们,复制动态仍然会使x x回复到回复到x x* *。在数学上,这相当于要求:当干扰使。在数学上,这相当于要求:当干扰使x x低于时低于时x x* * ,dx/dtdx/dt必须大于必须大于0 0;当干扰使得;当干扰使得x x出现高于时出现高于时x x* *, dx/dtdx/dt必必须小于须小于0 0,这就要求这些稳定状态处于的导数必须小
8、于,这就要求这些稳定状态处于的导数必须小于0 0。o演化稳定策略的影响因素分析演化稳定策略的影响因素分析 演化博弈关注的问题演化博弈关注的问题“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。(一)签协议博弈(一)签协议博弈假设:群体中假设:群体中“Y”的比例为的比例为x,“N”的比例为的比例为1-x,对于对于甲甲0 , 00, 00 ,01 , 1,0,0,甲甲乙乙YNYNY Y:同意:同意N N:不同意:不同意110YUxxx 0100NUxx 21YNUx Ux Ux设:群
9、体比例的动态变化速度为设:群体比例的动态变化速度为Ydxx UUdt23dxxxdt当当x=0时,稳定;时,稳定;当当x0时,最终稳定于时,最终稳定于x*=1则:则:复制动态方程复制动态方程“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。dx/dtx01图图1 1 签协议博弈的复制动态相位图签协议博弈的复制动态相位图x*=0,x*=1为稳定状态,此时,为稳定状态,此时,dx/dt=0但但x*=1为为ESS,即最终所有人都将选择,即最终所有人都将选择“Y”0 , 00, 00 ,
10、01 , 1,0,0,甲甲乙乙YNYN23dxxxdt“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。(二)一般两人对称博弈(二)一般两人对称博弈群体中采用群体中采用S1的比例为的比例为x,S2的比例为的比例为1-x,对于甲,对于甲11Ux axb 21Ux cxd 121Ux Ux U 1dxF xx UUdt 11xxx acxbd当当F(x) =0时,时,复制动态稳定状态为:复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)则复制动态方程则复制动
11、态方程F(x):d , dc, bb ,ca , a,甲甲乙乙S1S2S1S2“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。稳定性定理稳定性定理若若x0;若若xx*,为使,为使xx*,应满足,应满足F(x)0.F(x)=dx/dt,t,则,则xF(x)=dx/dt,t,则,则xx*F(x)x0这意味着:这意味着:当当F(x*)0,x*为为ESS“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用
12、为重点的“群众性治安防控工程”。(三)协调博弈的复制动态和(三)协调博弈的复制动态和ESSESS 1116111dxF xxxx acxbddtxxx当当F(x) =0时,时,x*=0,x*=1,x*=11/61为稳定状态为稳定状态复制动态方程复制动态方程F(x):60,600,4949,050,5060,600,4949,050,50甲甲乙乙ABAB图图2 2 协调博弈的协调博弈的复制动态相位图复制动态相位图11/61dx/dtx01可知,当可知,当F (0) 0, F(1)0,则,则 x*=0和和x*=1为为ESS这意味着:这意味着:当初始当初始x11/61时,时,ESS 为为x*=1.“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 五节 演化 博弈 模型 ppt 课件
限制150内