《博弈论教学课件(全).ppt》由会员分享,可在线阅读,更多相关《博弈论教学课件(全).ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博博 弈弈 论论序 言在序言中,我们主要是对整个教材做一个总体上的介绍,并且提出有关的注意事项。一、该教材的组织安排和结构。二、该教材所具有的特点。三、学习博弈论所需要的几个条件。下面我们就分别加以介绍。第一章 导论第二章 静态博弈第三章 纳什均衡解第四章 动态博弈第五章 重复博弈第六章 贝叶斯博弈第七章 非完全信息动态博弈第八章 若干扩展博弈论的组织安排和结构教材的特点在保证理论教全面的情况下,强调运用。边学边做,习题都被放在文章的正文中,成为正文的一个有机组成部分,通过做题来理解理论要比单纯的学习要有有效的多,而且也与课程追求运用的目的相吻合。对数学的要求都很基础,相信即使对数学了解不多的
2、读者也能很好的理解本书内容。深入浅出也是本书的一大特点。给读者的几点建议尽管在书中尽量不用数学和尽量用简单的数学,但仍要求读者对求导数较为熟悉,同时具备基本的概率论知识。学习是一个痛并快乐的事,有时可能面对一个问题百思不得其解,但一旦破解将会豁然开朗,喜悦之情悠然而生,该书的目的就是希望每位读者都能够体会到这种乐趣,但最终还是取决于读者自身。好记性不如烂笔头,多写多记,甚至进一步查阅文献都是学好博弈论的有效方法,也是深造的最有效途径。第一章 导言第一节 什么是博弈论第二节 博弈论的经济学渊源第三节 博弈论革命第四节 博弈论要点 第一节 什么是博弈论我们首先看几个例子。例1.1 石头、剪刀、布猪
3、 八 戒 石 头 剪 刀 布孙悟空石头未定,未定休息,找水找水,休息剪刀找水,休息未定,未定休息,找水布休息,找水找水,休息未定,未定例1.2 诺曼底登陆德 军加来设防诺曼底设防盟 军加来登陆失败,成功成功,失败诺曼底登陆成功,失败失败,成功例1.3 鸽派和鹰派美 国鸽派政策鹰派政策苏联鸽派政策0,01,+1鹰派政策+1,1,从上面的三个例子中,我们可以概括出一个博弈所具有的共同特征:利益相冲突的参与者、参与者总是根据对手可能采取的策略来采取相应的行动-相互依存的策略和行动、参与者总是追求自身利益最大化。根据这些共同特征我们就能给出一个博弈的定义,只要符合这个定义,就可以将其纳入到博弈论的研究
4、范畴之中。定义定义1.1 博弈是指利益存在冲突的决策主体(个人,企业,集团,政党,国家等等)在相互对抗(或合作)中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。在定义1.1中,我们最需要注意的就是策略的相互依存性。对于策略的相互依存性,传统的经济学不是不想研究,而是缺乏有效的工具。从这个意义上而言,博弈论正是为了解决这一问题而产生的。也是从这个意义上讲,我们有了博弈论的定义。定义定义1.2 博弈论是专门研究博弈如何出现均衡的规律的学科。正是由于博弈论将博弈如何出现均衡列为核心,因而博弈论对于各门社会科学而言,就具有了方法论意义,成为各门学科的有力分析工具。第二节 博弈论的经济学渊源
5、 博弈论与经济学存在着不解之缘,主要是由于下面几个方面:(1)博弈论的核心问题是经济学最早提出并加以系统研究的。(2)博弈论理论发展主要是经济学的需要推动的,也主要是由经济学家加以发展。(3)博弈论中的主要问题基本上都涉及到经济利益冲突问题。一、模型 所谓模型通俗地说就是一个对某种现象进行说明与解释、甚或推演的逻辑体系。模型的形式多种多样,并不一定必须是数学建立起来的才能称为模型。一个模型通常有三个最基本的部分组成:理论假设 逻辑推理 理论假说评判一个模型是好是坏关键取决于实践检验,但由于模型总是简化的,因而检验并不像我们想象的那么简单。实际上,当我们观察到一个现象,将其抽象为一个模型的过程实
6、际上就是一个简化的过程,简化不同可能得出完全矛盾的结论,真理与谬误相差只不过是毫厘之间,所谓既科学也是艺术就是这个道理。二、博弈论的经济学渊源 经济学的一些思想为博弈论提供了基础,其中最重要的就是所谓的“理性人”。描述理性人的工具就是所谓的理性偏好。为了方便,我们又用效用函数(在博弈论中称为收益函数)来表示偏好。构成博弈论基础的一个重要的经济定理就是所谓的理性选择原理:如果决策主体的偏好是理性的,那么(有限)选择集中就一定存在最优选择,这个选择可能是唯一的,也可能是多个。需要注意的几个问题:(1)表达同一个偏好的收益函数不唯一,但在单调变换下却是唯一的。(2)理性并不等同于自私自利。(3)理性
7、选择理论是有局限性的。三、博弈论革命 所谓革命是指博弈论对经济学(其他社会科学)研究产生了深远的影响。传统经济学失灵的五个领域正好体现着博弈论的价值和意义:(1)非完全竞争;(2)外在性;(3)公共产品;(4)逆向选择;(5)道德风险。在其他社会科学中,博弈论同样可以用来解释各种现象,比如政党,利益集团,甚或人类的基本制度。比如奥尔森集体行动的逻辑,罗尔斯正义论。在自然科学中,博弈论被运用在人工智能,物种演化等方面。所以称博弈论革命并不为过。第四节 博弈论要点一、博弈的四个要素:(1)参与者,博弈中的决策主体。(2)博弈规则,对博弈如何进行做出的规定。(3)结果,博弈最后出现的情形。(4)收益
8、,就是参与者对结果的偏好。二、博弈的基本式 如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来(科学)描述一个博弈,就称为博弈表达的基本式。三、博弈的扩展式 博弈的扩展式就是非常详细地描绘出一个博弈的参与者、策略、行动顺序以及行动时拥有的信息、可能的结果和收益等细节就称为博弈的扩展式。四、信息和顺序 完全信息和非完全信息,完全和非完全判断的标准就是如果有些信息只有一部分参与者知道,并不是所有的信息都是公共信息,那么博弈就是非完全信息博弈。静态博弈和动态博弈,静态和动态的区别并不在于时间上是否同时,而是在信息上的一种同时行动。公共知识与一般信息的区别。第二章第
9、二章 完全信息静态博弈完全信息静态博弈本章要点什么是博弈的基本式。如何将一个博弈用基本式加以概括。什么是纳什均衡。纯策略和混合策略纳什均衡的证明。一、博弈的基本式首先我们需要明确什么是完全信息和静态博弈,完全信息是指每个参与者的收益函数都是公共信息,而静态博弈则指每个参与者都同时行动,随后博弈结束。理解同时行动的关键在于每一个参与者在行动时并不了解其他参与者的行动。完全信息静态博弈是最简单的博弈。通常描述它只需要一些基本的要素就可以了。定义2.1 博弈表达的基本式(或策略式)由博弈的参与者N,策略空间S和收益函数u三个要素组成,即G=N,S,u。这里需要注意的是,完全信息静态博弈在多数情况下,
10、策略就等同于行动,所以G=A,u。但严格来讲,策略并不是行动。我们可以通过一个例子来加以说明。例1 进攻与防守双方争夺一个据点,有两条进攻路线X和Y,攻方有两个军,而防守方也有两个军,只有当守方的兵力不少于攻方时,才能击退进攻,否则据点将会失守。首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策略,策略是行动方案。守 方(0,2)(1,1)(2,0)攻 方(0,2)失败,成功成功,失败成功,失败(1,1)成功,失败失败,成功成功,失败(2,0)成功,失败成功,失败
11、失败,成功二、纳什均衡 有些策略式博弈性态非常好,不需要所谓的均衡概念就能找到博弈的均衡解,例如利用博弈参与者的理性这一假设就可以找出甚至是唯一的均衡。这里介绍几个重要的概念:严格优策略,严格劣策略,优策略,劣策略,其基本的方法就是重复剔除严格劣策略,这种思路又被称为博弈的可理性化。但是,对于更一般的博弈,利用可理性化导致的结果可能是所有博弈组合都无法剔除,从而导致所有组合都可能是均衡这样的状态。严格优策略通俗地说就是在任何情况下,该策略带给参与者的收益都要严格大于其它任意策略。理解严格优策略的关键在于两个任意:给定对手任意的策略和自己任意的策略。如果严格优策略存在,那么它必然是唯一的。这体现
12、在命题2.1中。相应地,我们可以定义严格劣策略。严格劣策略是指存在某个策略无论在任何情况下,该策略带个参与者的收益都要严格大于另一个策略。由此,可以看出严格优策略和严格劣策略的差异。严格优策略是全局性的,而严格劣策略只是相对于另一个策略而言。因而严格劣策略的要求要比严格优策略要松,运用重复剔出严格劣策略(如果存在的话)通常都能够确定博弈的均衡。如果放宽要求,可以相应地定义优策略和劣策略。优策略的缺点是均衡不唯一,而劣策略却有可能将均衡剔出,因而重复剔出只能运用到严格劣策略。通常,并不是所有博弈都存在劣策略,那么在这种情况下,博弈还存在均衡吗?纳什均衡:纳什均衡:纳什均衡通俗地说就是一个策略组合
13、,其具有这样一个特性,即没有任何一个参与者有动机单方面改变策略单边背离。纳什均衡与严格优策略、严格劣策略的关系,体现在命题2.2和命题2.3上。纳什均衡同样存在不合理的地方,例如当参与者的人数2时,一个纳什均衡(策略组合)虽然不存在单边背离,但有可能存在多边背离。所谓多边背离就是2人或2人以上的参与者同时背离纳什均衡。为了克服这个缺点,理论界进行了一系列的努力,但都未能动摇纳什均衡的地位。我们现在就举例说明。例 双边背离与纳什均衡1,1,2_,0,_0,_,_2,2,1_,_,1.2 2 左 右 左 右上下1 3 高 低为了加深理解,我们来看一些经典例子。见书43页50页。通过这些例子,要求:
14、1、掌握如果概括博弈的方法基本式,2、如何找纳什均衡。三、最优反应函数最优反应函数是更为一般的寻找纳什均衡的通用方法。最优反应函数通俗讲就是描述了当给定对手的某个策略时,我最优的策略是什么?数学一点的话讲,就是一个函数(对应),其自变量为其它对手的策略,而应变量则为自己的策略。最优反应函数不仅适用于离散策略,而且特别适用于连续策略。如果找到了所有参与者的最优反应函数,如果我们把所有参与者的最优反应函数看作是一个大的“函数”,那么它的不动点,就是纳什均衡。对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对称博弈的原因。对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而
15、没有关系。四、混合策略博弈论里面最根本的问题是什么?就是均衡的存在性。如果均衡不存在,所有的工作都成了无用功,之所以引入混合策略,意义就在这里,因为如果仅仅限制在纯策略的范围内讨论博弈的话,均衡有可能是不存在的。混合策略通俗地说就是随机选择纯策略。在混合策略条件下,偏好实质上变成了v-N-M偏好,除了满足非对称性和负传递性外,还需满足替代公理和阿基米德公理。伯努利收益函数满足线性变换。我们知道,一个严格劣策略肯定是一个从来都不会选择的策略,在混合策略下,从来都不选择的策略同样是严格劣策略。但限制在纯策略下,这个逆命题却不成立。一个纯策略组合如果它是一个纳什均衡,那么在任何情况下,它仍是一个纳什均衡,这由命题2.6保证。注意命题2.7和命题2.8,它们可以大大简化我们的分析。五、纳什定理及其证明纳什定理1 如果策略式博弈G是有限的,那么一定存在纳什均衡。纳什定理2 如果策略式博弈G中参与者的策略空间是凸紧集,收益函数是连续拟凹函数,那么一定存在一个纯策略纳什均衡。纳什定理3 如果策略式博弈G中参与者的策略空间是紧集,收益函数是连续的,那么一定存在(可能是混合的)纳什均衡。纳什定理得证明关键是弄清楚几个关键概念:上半连续、凸集、紧集、不动点角谷不动点定理
限制150内