博弈论-第二章.课件电子教案.ppt
第二章第二章 完全信息静态博弈完全信息静态博弈本章要点 什么是博弈的基本式。 如何将一个博弈用基本式加以概括。 什么是纳什均衡。 纯策略和混合策略 纳什均衡的证明。一、博弈的基本式首先我们需要明确什么是完全信息和静态博弈,完全信息是指每个参与者的收益函数都是公共信息,而静态博弈则指每个参与者都同时行动,随后博弈结束。理解同时行动的关键在于每一个参与者在行动时并不了解其他参与者的行动。完全信息静态博弈是最简单的博弈。通常描述它只需要一些基本的要素就可以了。定义2.1 博弈表达的基本式(或策略式)由博弈的参与者N,策略空间S和收益函数u三个要素组成,即G = N, S, u。这里需要注意的是,完全信息静态博弈在多数情况下,策略就等同于行动,所以G= A,u。但严格来讲,策略并不是行动。我们可以通过一个例子来加以说明。例1 进攻与防守双方争夺一个据点,有两条进攻路线X和Y,攻方有两个军,而防守方也有两个军,只有当守方的兵力不少于攻方时,才能击退进攻,否则据点将会失守。首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策略,策略是行动方案。守 方(0,2)(1,1)(2,0)攻 方(0,2)失败,成功成功,失败成功,失败(1,1)成功,失败失败,成功成功,失败(2,0)成功,失败成功,失败失败,成功二、纳什均衡 有些策略式博弈性态非常好,不需要所谓的均衡概念就能找到博弈的均衡解,例如利用博弈参与者的理性这一假设就可以找出甚至是唯一的均衡。这里介绍几个重要的概念:严格优策略,严格劣策略,优策略,劣策略,其基本的方法就是重复剔除严格劣策略,这种思路又被称为博弈的可理性化。 但是,对于更一般的博弈,利用可理性化导致的结果可能是所有博弈组合都无法剔除,从而导致所有组合都可能是均衡这样的状态。严格优策略通俗地说就是在任何情况下,该策略带给参与者的收益都要严格大于其它任意策略。理解严格优策略的关键在于两个任意:给定对手任意的策略和自己任意的策略。如果严格优策略存在,那么它必然是唯一的。这体现在命题2.1中。相应地,我们可以定义严格劣策略。严格劣策略是指存在某个策略无论在任何情况下,该策略带个参与者的收益都要严格大于另一个策略。由此,可以看出严格优策略和严格劣策略的差异。严格优策略是全局性的,而严格劣策略只是相对于另一个策略而言。因而严格劣策略的要求要比严格优策略要松,运用重复剔出严格劣策略(如果存在的话)通常都能够确定博弈的均衡。如果放宽要求,可以相应地定义优策略和劣策略。优策略的缺点是均衡不唯一,而劣策略却有可能将均衡剔出,因而重复剔出只能运用到严格劣策略。通常,并不是所有博弈都存在劣策略,那么在这种情况下,博弈还存在均衡吗?纳什均衡:纳什均衡:纳什均衡通俗地说就是一个策略组合,其具有这样一个特性,即没有任何一个参与者有动机单方面改变策略单边背离。纳什均衡与严格优策略、严格劣策略的关系,体现在命题2.2和命题2.3上。纳什均衡同样存在不合理的地方,例如当参与者的人数2时,一个纳什均衡(策略组合)虽然不存在单边背离,但有可能存在多边背离。所谓多边背离就是2人或2人以上的参与者同时背离纳什均衡。为了克服这个缺点,理论界进行了一系列的努力,但都未能动摇纳什均衡的地位。我们现在就举例说明。例 双边背离与纳什均衡1,1,2_ ,0, _0, _, _2, 2,1_, _, 1. 2 2 左 右 左 右上下1 3 高 低为了加深理解,我们来看一些经典例子。见书43页50页。通过这些例子,要求:1、掌握如果概括博弈的方法基本式,2、如何找纳什均衡。三、最优反应函数最优反应函数是更为一般的寻找纳什均衡的通用方法。最优反应函数通俗讲就是描述了当给定对手的某个策略时,我最优的策略是什么?数学一点的话讲,就是一个函数(对应),其自变量为其它对手的策略,而应变量则为自己的策略。最优反应函数不仅适用于离散策略,而且特别适用于连续策略。如果找到了所有参与者的最优反应函数,如果我们把所有参与者的最优反应函数看作是一个大的“函数”,那么它的不动点,就是纳什均衡。对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对称博弈的原因。对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。四、混合策略博弈论里面最根本的问题是什么?就是均衡的存在性。如果均衡不存在,所有的工作都成了无用功,之所以引入混合策略,意义就在这里,因为如果仅仅限制在纯策略的范围内讨论博弈的话,均衡有可能是不存在的。混合策略通俗地说就是随机选择纯策略。在混合策略条件下,偏好实质上变成了v-N-M偏好,除了满足非对称性和负传递性外,还需满足替代公理和阿基米德公理。伯努利收益函数满足线性变换。我们知道,一个严格劣策略肯定是一个从来都不会选择的策略,在混合策略下,从来都不选择的策略同样是严格劣策略。但限制在纯策略下,这个逆命题却不成立。一个纯策略组合如果它是一个纳什均衡,那么在任何情况下,它仍是一个纳什均衡,这由命题2.6保证。注意命题2.7和命题2.8,它们可以大大简化我们的分析。五、纳什定理及其证明 纳什定理1 如果策略式博弈G是有限的,那么一定存在纳什均衡。 纳什定理2 如果策略式博弈G中参与者的策略空间是凸紧集,收益函数是连续拟凹函数,那么一定存在一个纯策略纳什均衡。 纳什定理3 如果策略式博弈G中参与者的策略空间是紧集,收益函数是连续的,那么一定存在(可能是混合的)纳什均衡。纳什定理得证明关键是弄清楚几个关键概念:上半连续、凸集、紧集、不动点角谷不动点定理