博弈论课件前言优秀PPT.ppt
博弈论课件前言第1页,本讲稿共145页 参与人:两人及两人以上;参与人:两人及两人以上;行为:做出决策;行为:做出决策;行为目标:收益最大化行为目标:收益最大化 环境条件:目标的实现不仅取决于自己环境条件:目标的实现不仅取决于自己 的行为,同时还取决于其他的行为,同时还取决于其他 人的行为,个人的最优选择人的行为,个人的最优选择 是其他人选择的函数是其他人选择的函数 策略性的行为策略性的行为分钱游戏与运输路线选择分钱游戏与运输路线选择第2页,本讲稿共145页博弈(博弈(Game):):博弈博弈是指代表不同利益主体的决策者,在一是指代表不同利益主体的决策者,在一 定的环境条件和规则下,同时或先后、一次定的环境条件和规则下,同时或先后、一次 或多次从各自允许选择的行动方案中加以选或多次从各自允许选择的行动方案中加以选 择并实施,从而取得各自相应结果的活动。择并实施,从而取得各自相应结果的活动。美美Roger B.Myerson一个博弈指的是涉及到一个博弈指的是涉及到 两个或更多个参与人的某个社会局势。两个或更多个参与人的某个社会局势。英英Adam Smith博弈是个体参与人从各自的博弈是个体参与人从各自的 动机出发生相互作用的一种状态。动机出发生相互作用的一种状态。第3页,本讲稿共145页博弈论(博弈论(Game Theory,对策论):,对策论):美美Roger B.Myerson博弈论可以被定义博弈论可以被定义 为是智能的理性决策者之间冲突与合作的为是智能的理性决策者之间冲突与合作的 数学模型的研究。数学模型的研究。美美Robert Gibbonsis the study of multi-person decision problems.第4页,本讲稿共145页张维迎张维迎是研究决策主体的行为发生直接是研究决策主体的行为发生直接 相互作用相互作用 时候的决策以及这种决时候的决策以及这种决 策的均衡问题的,也就是说,当策的均衡问题的,也就是说,当 一个主体,好比说一个人或一个主体,好比说一个人或 一个一个 企业的选择受到其他人、其他企企业的选择受到其他人、其他企 业选择的影响,而且反过来影响业选择的影响,而且反过来影响 到其他人、其他企业选择时的决到其他人、其他企业选择时的决 策问题和均衡问题。策问题和均衡问题。张守一张守一是研究聪明而又理智的决策者在是研究聪明而又理智的决策者在 冲突或合作中的策略选择理论。冲突或合作中的策略选择理论。第5页,本讲稿共145页教材教材P5 博弈论就是系统研究各种各博弈论就是系统研究各种各 样博弈中参与人的合理选择及其样博弈中参与人的合理选择及其 均衡的理论。均衡的理论。第6页,本讲稿共145页关于关于“经济博弈论经济博弈论”:博弈论是研究人们在利益相互影响的格局博弈论是研究人们在利益相互影响的格局中的策略选择问题、是研究多人决策问题的理中的策略选择问题、是研究多人决策问题的理论。而策略选择是人们经济行为的核心内容,论。而策略选择是人们经济行为的核心内容,此外,经济学和博弈论的研究模式是一样的:此外,经济学和博弈论的研究模式是一样的:即强调个人理性,也就是在给定的约束条件下即强调个人理性,也就是在给定的约束条件下追求效用最大化。可见,经济学和博弈论具追求效用最大化。可见,经济学和博弈论具有内在的联系。在经济学和博弈论具有的这有内在的联系。在经济学和博弈论具有的这种天然联系的基础上产生了经济博弈论。种天然联系的基础上产生了经济博弈论。第7页,本讲稿共145页 将博弈的思想明确地应用于经济领域,始于将博弈的思想明确地应用于经济领域,始于古诺(古诺(Cournot,1838)、伯特兰德()、伯特兰德(Bertrand,1883)和艾奇沃斯()和艾奇沃斯(Edgeworth,1925)等人关于两寡)等人关于两寡头的产量和价格垄断、产品交易行为的研究,他头的产量和价格垄断、产品交易行为的研究,他们通过对不同的经济行为方式和案例建立了相应们通过对不同的经济行为方式和案例建立了相应的博弈论模型,为经济博弈论的发展提供了思想的博弈论模型,为经济博弈论的发展提供了思想雏形和有益尝试。近半个多世纪以来,博弈论引雏形和有益尝试。近半个多世纪以来,博弈论引起了众多经济学家的极大兴趣,使得博弈论在经起了众多经济学家的极大兴趣,使得博弈论在经济学中的应用模型越来越多。大约从济学中的应用模型越来越多。大约从20世纪世纪80年年代开始,博弈论逐渐成为主流经济学的一部分,甚代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础(张维迎,至可以说成为微观经济学的基础(张维迎,P8)。)。第8页,本讲稿共145页 博弈论究竟是一门什么样的学科呢?有人博弈论究竟是一门什么样的学科呢?有人认为是经济学的一个分支,有人认为是数学的一认为是经济学的一个分支,有人认为是数学的一个分支。我们把它看作是一种方法论,即它提供个分支。我们把它看作是一种方法论,即它提供了一个观察问题的新视角、分析问题的新方法和了一个观察问题的新视角、分析问题的新方法和解决问题的新思路;它的应用范围不仅包括经济解决问题的新思路;它的应用范围不仅包括经济学,像政治学、军事、外交、国际关系、公共选学,像政治学、军事、外交、国际关系、公共选择、犯罪心理分析等都涉及博弈论。只不过从应择、犯罪心理分析等都涉及博弈论。只不过从应用的成果来看,博弈论在经济学领域的应用最广用的成果来看,博弈论在经济学领域的应用最广泛、最成功,经济学家对博弈论的贡献也特别大,泛、最成功,经济学家对博弈论的贡献也特别大,使得博弈论在经济学领域的应用无处不在:微观使得博弈论在经济学领域的应用无处不在:微观研究领域有交易机制的模型(如讨价还价模型和研究领域有交易机制的模型(如讨价还价模型和拍卖模型);拍卖模型);第9页,本讲稿共145页在中观经济研究中,劳动力经济学和金融理在中观经济研究中,劳动力经济学和金融理论都有关于企业要素投入品市场的博弈模型,即论都有关于企业要素投入品市场的博弈模型,即使在一个企业内部也存在博弈问题:工人之间会使在一个企业内部也存在博弈问题:工人之间会为同一个升迁机会勾心斗角,不同部门之间为争为同一个升迁机会勾心斗角,不同部门之间为争取公司的资金投入相互竞争;从宏观角度看,国取公司的资金投入相互竞争;从宏观角度看,国际经济学中有关于国家间的相互竞争或相互串谋、际经济学中有关于国家间的相互竞争或相互串谋、选择关税或其他贸易政策的模型;至于产业组织选择关税或其他贸易政策的模型;至于产业组织理论更是大量应用博弈论的方法(见理论更是大量应用博弈论的方法(见Jean Tirole的的产业组织理论产业组织理论)。)。第10页,本讲稿共145页二、博弈论的产生和发展二、博弈论的产生和发展 博弈思想的基本特征是参与人在追求自己博弈思想的基本特征是参与人在追求自己目标的过程中,不仅仅只是考虑自己能怎么目标的过程中,不仅仅只是考虑自己能怎么做,还必须要考虑其他参与人会怎么做;针做,还必须要考虑其他参与人会怎么做;针对其他参与人的行为,自己该实施哪个可行对其他参与人的行为,自己该实施哪个可行的行动,才能使自己的目标函数最大化,也的行动,才能使自己的目标函数最大化,也就是说,在一个博弈格局中,每个参与人所就是说,在一个博弈格局中,每个参与人所实施的行动都是策略性的行动。实施的行动都是策略性的行动。知己知彼,百战不殆知己知彼,百战不殆第11页,本讲稿共145页产生与发展产生与发展 教材教材P1-3 现代经济对策论现代经济对策论P6-7冯冯诺依曼和摩根斯坦(诺依曼和摩根斯坦(Von.neumann and morgenstern)冯冯 诺依曼是诺依曼是20世纪伟大的数学家之一,后者是德国人世纪伟大的数学家之一,后者是德国人(1902年生),美国当代杰出经济学家。年生),美国当代杰出经济学家。The theory of Games and Economic Behaviour的产的产生:二战期间,为了有效对抗法西斯,不仅是军人,连物生:二战期间,为了有效对抗法西斯,不仅是军人,连物理学家、数学家,甚至经济学家都被动员起来,组成理学家、数学家,甚至经济学家都被动员起来,组成“运运筹研究班筹研究班”,共同研究作战计划,在作战中数学的合理性,共同研究作战计划,在作战中数学的合理性得到了广泛运用,产生了种种理论。博弈论便是其中之一。得到了广泛运用,产生了种种理论。博弈论便是其中之一。二战结束后,大部分理论研究都转向其他领域。博弈论则二战结束后,大部分理论研究都转向其他领域。博弈论则在摩根斯坦的劝说下,与冯合作成就了在摩根斯坦的劝说下,与冯合作成就了The theory of Games and Economic Behaviour,即转到了经济领域。冷,即转到了经济领域。冷战期间得到了政府的大力支持,博弈论不仅在经济领域,战期间得到了政府的大力支持,博弈论不仅在经济领域,而后在社会学、外交问题军事问题上都得到了应用。而后在社会学、外交问题军事问题上都得到了应用。第12页,本讲稿共145页因对博弈论研究作出杰出贡献而获诺贝尔经济因对博弈论研究作出杰出贡献而获诺贝尔经济学奖的经济学家:学奖的经济学家:纳什纳什(Nash):Nash-Equilibrium 塞尔藤塞尔藤(Selten):Subgame-Perfect Nash E-海萨尼海萨尼(Harsanyi):Bayes-Nash Equilibrium 1994维克利、莫里斯维克利、莫里斯 1996迈克尔迈克尔斯宾斯斯宾斯(Spence):1948年生于美国的新年生于美国的新泽西,泽西,1972年获哈佛大学博士头衔,现兼任美国年获哈佛大学博士头衔,现兼任美国 哈佛和斯坦福两所大学经济学教授。哈佛和斯坦福两所大学经济学教授。乔治乔治阿克尔洛夫:阿克尔洛夫:1940年生于美国的纽黑文,年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国年获美国麻省理工学院博士头衔,现为美国加利福尼亚大学经济学教授。加利福尼亚大学经济学教授。第13页,本讲稿共145页 约瑟夫约瑟夫斯蒂格利茨,斯蒂格利茨,1948年生于美国的印第安年生于美国的印第安纳州,纳州,1967年获美国麻省理工学院博士头衔,曾任年获美国麻省理工学院博士头衔,曾任世界银行的首席经济学家,现任美国哥伦比亚大学世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授。经济学教授。2001年三人同获诺贝尔经济学奖,分享年三人同获诺贝尔经济学奖,分享1000万万瑞典克郎(瑞典克郎(94.3万美元)的奖金。瑞典皇家科学万美元)的奖金。瑞典皇家科学院之所以把这崇高的荣誉给予这三位经济学家,院之所以把这崇高的荣誉给予这三位经济学家,是因为他们在现代信息经济学研究领域作出了突是因为他们在现代信息经济学研究领域作出了突出的贡献,他们出的贡献,他们“发展并研究了市场信息不对称发展并研究了市场信息不对称的问题,揭示了当代信息经济的核心的问题,揭示了当代信息经济的核心”。教材。教材P192第14页,本讲稿共145页 阿克尔洛夫是最早发现信息不对称的学者之一。阿克尔洛夫是最早发现信息不对称的学者之一。我们上街购物,几乎处处都能碰上假货:花了上我们上街购物,几乎处处都能碰上假货:花了上千元买的千元买的“进口名牌服装进口名牌服装”,原来是国产的,只,原来是国产的,只值几十元;值几十元;“真皮真皮”皮鞋用的是人造革的料皮鞋用的是人造革的料为为什么假货愈什么假货愈 演愈烈?为什么假货在发展中国家特演愈烈?为什么假货在发展中国家特别猖獗?阿克尔洛夫回答说:别猖獗?阿克尔洛夫回答说:“一家商场,一般一家商场,一般是售货员比顾客更了解产品的质量,如果售货员是售货员比顾客更了解产品的质量,如果售货员把这种信息加以垄断,最后即使他提供越来越差把这种信息加以垄断,最后即使他提供越来越差的产品,顾客也不会知道。顾客的利益因而受到的产品,顾客也不会知道。顾客的利益因而受到损害损害”。(只有买错,没有卖错)阿克尔洛夫最。(只有买错,没有卖错)阿克尔洛夫最大的贡献是解释了在发展中国家里,信贷市场信大的贡献是解释了在发展中国家里,信贷市场信息的不对称导致了这些国家信息的不对称导致了这些国家信第15页,本讲稿共145页贷市场的过高利息。此外,阿克尔洛夫还把信贷市场的过高利息。此外,阿克尔洛夫还把信息不对称运用于解释各种社会问题,比如因为信息不对称运用于解释各种社会问题,比如因为信息不对称,医疗保险市场上,老年人、个体劳动息不对称,医疗保险市场上,老年人、个体劳动者的医疗保险利益得不到保障。者的医疗保险利益得不到保障。第16页,本讲稿共145页三、基本概念三、基本概念 1、参与人、参与人Players:一个博弈中的决策主体,他们一个博弈中的决策主体,他们各自的目的是通过选择行动(策略)以最大化自己各自的目的是通过选择行动(策略)以最大化自己的目标函数的目标函数/效用水平效用水平/支付函数。他们可以是自然支付函数。他们可以是自然人或团体或法人,如企业、国家、地区、社团、欧人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。盟、北约等。那些不作决策或虽做决策但不直接承担决策后果那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的顾问等。理。如指手划脚的看牌人、看棋人,企业的顾问等。对参与人的决策来说,最重要的是必须有对参与人的决策来说,最重要的是必须有第17页,本讲稿共145页可供选择的行动集(策略集)和一个很好定义的可供选择的行动集(策略集)和一个很好定义的支付函数。支付函数。虚拟参与人(虚拟参与人(pseudo-player):指指“自然自然”(nature)、)、“上帝上帝”God,也即决定外生的随机,也即决定外生的随机变量的概率分布的机制。变量的概率分布的机制。“某事在人、成事在天某事在人、成事在天”的的“天天”;如出远门去旅游,可能很开心,也可能;如出远门去旅游,可能很开心,也可能很尴尬(生病住医院),两者概率分布很尴尬(生病住医院),两者概率分布90%、10%或或98%与与2%或其他,由上帝决定。或其他,由上帝决定。在以后的讨论中,我们记参与人为在以后的讨论中,我们记参与人为i,参与人参与人集合记为集合记为T,即,即T=1,2,i,n,即该博弈中共有即该博弈中共有n个参与人;为了讨论的方便个参与人;为了讨论的方便,把某个参与人,把某个参与人i之外的其他参与人称为的之外的其他参与人称为的i对手对手记为记为-i;N代表自然。代表自然。第18页,本讲稿共145页 *注意:注意:博弈理论家一般对参与人做两个基本的假设博弈理论家一般对参与人做两个基本的假设参与人都是理性的和智能的参与人都是理性的和智能的理性的(理性的(rational)?1如果一个决策者在追逐其目标时能前后如果一个决策者在追逐其目标时能前后一致地做决策,就称他为一致地做决策,就称他为rational。Roger BMyerson(P2)2广义而言指的是一种行为方式,他同在给广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。具定条件或约束下最有效地实现预期目标相关。具体地讲,理性大致有以下三项体地讲,理性大致有以下三项第19页,本讲稿共145页内容:(内容:(1)存在一组可供选择的备选或替代方)存在一组可供选择的备选或替代方案;(案;(2)每一种方案均对应着某种特定的预期)每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度;(净收益或满足程度或目标实现程度;(3)人们)人们总是选择那个能够带来最大预期净收益的方案。总是选择那个能够带来最大预期净收益的方案。(西蒙,(西蒙,1964)智能的(智能的(intelligent)?当我们像博弈论专家那样分析一个博弈时,当我们像博弈论专家那样分析一个博弈时,如果参与人知道我们对此博弈所知道的一切,如果参与人知道我们对此博弈所知道的一切,并能做出我们对此博弈所能做出的一切推断,并能做出我们对此博弈所能做出的一切推断,我们就说此博弈的参与人是智能的。我们就说此博弈的参与人是智能的。RogerBMyerson(P3)第20页,本讲稿共145页 2、策略(、策略(strategies):博弈中有两种策略概博弈中有两种策略概念,一种为纯策略(念,一种为纯策略(pure strategy),简称策略,简称策略,指参与人在博弈中可以选择采用的行动(指参与人在博弈中可以选择采用的行动(ac-tions or moves)方案,是参与人在给定信息结)方案,是参与人在给定信息结构的情况下的行动规则,它规定参与人在什么构的情况下的行动规则,它规定参与人在什么时候的什么情况下采取什么行动。因而一个策时候的什么情况下采取什么行动。因而一个策略是参与人的一个略是参与人的一个“相机行动方案相机行动方案”(contingentAction plan)。如)。如“人不犯我人不犯我”、“按第一套方按第一套方案行动、实施第二套方案案行动、实施第二套方案”,记参与人,记参与人i的一个策略为的一个策略为si,参与人参与人i在一个博弈中的全部可在一个博弈中的全部可供选择的策略记为供选择的策略记为Si(策略集(策略集strategy set),即),即si Si,Si=s1,s2,si,sn,表示参与表示参与人人i 在该博弈中共有在该博弈中共有n个可行的策略。个可行的策略。第21页,本讲稿共145页如果如果n个参与人每人从自己的个参与人每人从自己的Si中选择一个策略中选择一个策略si,则向量则向量s=(s1,s2,si,sn)是一个)是一个策略组合策略组合(strategy profile),参与人参与人i之外的其他参之外的其他参与人的策略组合可记为与人的策略组合可记为s-i=(s1,s2,si-1,si+1,sn)。)。例如田忌的某个策略例如田忌的某个策略s田忌田忌=上中下,或中下上,上中下,或中下上,等等;等等;S田忌田忌=上中下,上下中,中上下,中下上上中下,上下中,中上下,中下上,下上中,下中上,下上中,下中上第22页,本讲稿共145页 另一种策略概念是在纯策略基础上形成的另一种策略概念是在纯策略基础上形成的混合策略(混合策略(mixed strategy)概念,参与人)概念,参与人i的的混合策略混合策略pi是他的纯策略空间是他的纯策略空间Si上的一种概率上的一种概率分布,表示参与人实际进行决策时根据这种分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。概率分布在纯策略中随机选择加以实施。Pi(si)表示表示Pi分配给纯策略分配给纯策略si的的概率。如出门的的概率。如出门要否带雨伞?天气预报说有时有雨。猜拳?要否带雨伞?天气预报说有时有雨。猜拳?这是一个十分玄乎的概念,让人不容易理解,这是一个十分玄乎的概念,让人不容易理解,它是一种不确定,采用这种策略的目的就是它是一种不确定,采用这种策略的目的就是让对方琢磨不透,实施时似乎由一架随机机让对方琢磨不透,实施时似乎由一架随机机器在操作。随机策略器在操作。随机策略randomized strategy 纯策略是混合策略的特例?纯策略是混合策略的特例?第23页,本讲稿共145页*注意:注意:1、策略与行动是两个不同的概念,策略是、策略与行动是两个不同的概念,策略是行动的规则而不是行动本身。回顾行动的规则而不是行动本身。回顾“犯与不犯犯与不犯”的问题。在静态博弈中,由于参与人同时行动,的问题。在静态博弈中,由于参与人同时行动,没有人能掌握他人的之前行动的信息,故没有没有人能掌握他人的之前行动的信息,故没有可针对的行动,从而策略的选择就变成了行动可针对的行动,从而策略的选择就变成了行动的选择,即策略和行动是同一的。的选择,即策略和行动是同一的。行动集行动集Ai ai 2、作为一种行动规则,策略必须是完备的,、作为一种行动规则,策略必须是完备的,就是说,策略要给出参与人在每一种可能想象就是说,策略要给出参与人在每一种可能想象到的情况下的行动选择,即使参与人并不预期到的情况下的行动选择,即使参与人并不预期这种情况会实际发生。这种情况会实际发生。“丑话说在前丑话说在前-”第24页,本讲稿共145页3、支付(、支付(payoffs):参与人从各种策略组合中):参与人从各种策略组合中获得的收益。收益往往采用效用(获得的收益。收益往往采用效用(utility)概念。)概念。它或者是一个特定策略组合下某个参与人得到的它或者是一个特定策略组合下某个参与人得到的确定效用水平,或者是期望效用水平。它是策略确定效用水平,或者是期望效用水平。它是策略组合的函数,所以也称支付函数组合的函数,所以也称支付函数(payoff function),记为),记为ui(s),ui(s)=ui(s1,s2 ,si,sn-1,sn).第25页,本讲稿共145页 1:博弈的一个基本特征是一个参与人博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择,而且取决的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组合的于所有其他参与人的策略选择;是策略组合的函数。函数。2:支付是参与人真正关心的东西,参与:支付是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以最大人在博弈中的目标就是选择自己的策略以最大化自己的支付函数。化自己的支付函数。*注意注意第26页,本讲稿共145页 一个博弈中,明确了以上三个概念,该博一个博弈中,明确了以上三个概念,该博弈的基本框架就形成了,故称为博弈的三个弈的基本框架就形成了,故称为博弈的三个基本要素。一个具体博弈界定,还须明确行动基本要素。一个具体博弈界定,还须明确行动的顺序和有关的信息。的顺序和有关的信息。4、行动的顺序(、行动的顺序(the order of play):博弈博弈中参与人实施决策活动的顺序。同时或有先有中参与人实施决策活动的顺序。同时或有先有后。其他因素不变,但顺序不同,参与人的最后。其他因素不变,但顺序不同,参与人的最优选择就不同,博弈的结果也不同。事实上,优选择就不同,博弈的结果也不同。事实上,不同的顺序安排意味着不同的博弈。静态博弈不同的顺序安排意味着不同的博弈。静态博弈和动态博弈。和动态博弈。第27页,本讲稿共145页 5、信息(、信息(information):指一个博弈中参):指一个博弈中参与人有关该博弈的知识,如关于与人有关该博弈的知识,如关于N的选择、其的选择、其他参与人的策略集、支付函数、行动时间等他参与人的策略集、支付函数、行动时间等.博弈论中关于信息的具体概念有:博弈论中关于信息的具体概念有:信息集(信息集(information set)主要出现在主要出现在动态博弈中,可理解为参与人在特定时刻上对动态博弈中,可理解为参与人在特定时刻上对有关变量的值的知识;一个参与人无法准确知有关变量的值的知识;一个参与人无法准确知道的变量的全体属于一个信息集。买古董。道的变量的全体属于一个信息集。买古董。完美信息(完美信息(perfect information):指一个参与指一个参与人对其他参与人(包括人对其他参与人(包括N)的行动选择有准确了解的)的行动选择有准确了解的情况,即一个信息集只包含一个值。动态博弈的概情况,即一个信息集只包含一个值。动态博弈的概念。念。第28页,本讲稿共145页完全信息(完全信息(complete information):指):指N不首不首先行动或先行动或N的初始行动被所有的参与人准确观察的初始行动被所有的参与人准确观察到的情况,即没有事前的不确定性。完全信息到的情况,即没有事前的不确定性。完全信息意味着各个参与人的支付函数是共同知识。意味着各个参与人的支付函数是共同知识。显然,不完全(显然,不完全(incomplete)信息意味着不)信息意味着不完美(完美(imperfect)信息。)信息。共同知识(共同知识(common knowledge)是与信息是与信息有关的一个重要概念。如听过某个老师的课,学生有关的一个重要概念。如听过某个老师的课,学生认识老师,但老师不一定就记住该学生,路上碰在认识老师,但老师不一定就记住该学生,路上碰在一块了,学生会不会叫老师呢?也许一块了,学生会不会叫老师呢?也许学生会以为老师不认识他,打招呼会把老师弄得莫名学生会以为老师不认识他,打招呼会把老师弄得莫名其妙。其妙。第29页,本讲稿共145页 解释一:共同知识指解释一:共同知识指“所有参与人知道,所所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道有参与人知道所有参与人知道”。解释二:解释二:如果每个参与人都知道某个事实,如果每个参与人都知道某个事实,每个参与人都知道每个参与人都知道它,如此等每个参与人都知道每个参与人都知道它,如此等等,从而形如等,从而形如“(每个参与人都知道(每个参与人都知道)k每个参与人每个参与人都知道它都知道它”的语句对的语句对k=0,1,2,都是正确的,都是正确的,那我们就称这个事实为参与人中间的共同知识。那我们就称这个事实为参与人中间的共同知识。解释三:解释三:这是一个这是一个“由己及人,由人及己由己及人,由人及己”的的无限推理过程,是无限推理过程,是k时的高阶知识时的高阶知识(每个人每个人)k-1)。一件事一旦在某个群体中成为)。一件事一旦在某个群体中成为第30页,本讲稿共145页共同知识,则从任何一个个体出发,他对这件事共同知识,则从任何一个个体出发,他对这件事的理解等等都已达到了完全的统一,不再有任何的理解等等都已达到了完全的统一,不再有任何层面的不确定性(奥曼,层面的不确定性(奥曼,1976)。)。在博弈论中,一般假定参与人的行动空间在博弈论中,一般假定参与人的行动空间Ai和行动顺序是共同知识。和行动顺序是共同知识。*为了说明共同知识的重要性,引用一个寓为了说明共同知识的重要性,引用一个寓言故事。言故事。第31页,本讲稿共145页 故事发生在一个村庄,村里有故事发生在一个村庄,村里有100对夫妻,对夫妻,他们都是地道的逻辑学家(智能的);村里有他们都是地道的逻辑学家(智能的);村里有一些奇特的风俗:每天晚上,村里的男人们都一些奇特的风俗:每天晚上,村里的男人们都将点起篝火,绕圈围坐举行会议,议题是谈论将点起篝火,绕圈围坐举行会议,议题是谈论自己的妻子。在会议开始时,如果一个男人有自己的妻子。在会议开始时,如果一个男人有理由相信他的妻子对他总是守贞的,那么他就理由相信他的妻子对他总是守贞的,那么他就在会议上当众赞扬她的美德。另一方面,如果在会议上当众赞扬她的美德。另一方面,如果在会议之前的任何时间,只要他发现他妻子不在会议之前的任何时间,只要他发现他妻子不贞的证据,那他就会在会议上悲鸣怯哭,并企贞的证据,那他就会在会议上悲鸣怯哭,并企第32页,本讲稿共145页求神灵严厉地惩罚她。再则,如果一个妻子曾求神灵严厉地惩罚她。再则,如果一个妻子曾有不贞,那她和她的情人会立即告知村里除她有不贞,那她和她的情人会立即告知村里除她丈夫之外所有的已婚男人(奇异的传统风俗)。所有丈夫之外所有的已婚男人(奇异的传统风俗)。所有这些传统和风俗都是村民的共同知识。这些传统和风俗都是村民的共同知识。事实上,每个妻子都已对丈夫不忠。于是事实上,每个妻子都已对丈夫不忠。于是每个丈夫都知道除自己妻子之外其他人的妻子每个丈夫都知道除自己妻子之外其他人的妻子都是不贞的女子,因而每个晚上的会议上每个都是不贞的女子,因而每个晚上的会议上每个男人都赞美自己的妻子。男人都赞美自己的妻子。这种状况持续了很多年,直到有一天来了这种状况持续了很多年,直到有一天来了一位传教士。传教士参加了篝火会议,并听到一位传教士。传教士参加了篝火会议,并听到每个男人都在赞美自己的妻子,他站起来走到围每个男人都在赞美自己的妻子,他站起来走到围坐圆圈的中心,大声地提醒说:坐圆圈的中心,大声地提醒说:“这个村子里这个村子里第33页,本讲稿共145页有一个妻子已经不贞了。有一个妻子已经不贞了。”在此后的在此后的99个晚上,个晚上,丈夫们继续赞美各自的妻子,但在第丈夫们继续赞美各自的妻子,但在第100个晚个晚上,他们全都悲鸣怯哭,并企求神灵严惩自己上,他们全都悲鸣怯哭,并企求神灵严惩自己的妻子。的妻子。*怎样理解这个故事?传教士究竟告诉了丈夫怎样理解这个故事?传教士究竟告诉了丈夫们他们所不知道的什么?们他们所不知道的什么?第34页,本讲稿共145页 首先注意到若只有一个妻子不贞,她丈夫能够首先注意到若只有一个妻子不贞,她丈夫能够立刻知道这个不贞的女人就是自己的妻子,因为他立刻知道这个不贞的女人就是自己的妻子,因为他丈夫知道没有另外的不贞女人,若有的话他是知道丈夫知道没有另外的不贞女人,若有的话他是知道的,所以在传教士访问后的第一个晚上这个丈夫就的,所以在传教士访问后的第一个晚上这个丈夫就会哭;现在他没有哭,那就意味着确实存在一个女会哭;现在他没有哭,那就意味着确实存在一个女子不贞,由此,从子不贞,由此,从“第一个晚上没有男人哭第一个晚上没有男人哭”中可中可推断出:有两个女子已经不贞。在传教士走后的第推断出:有两个女子已经不贞。在传教士走后的第二晚上,既然已推断出有两个女子不贞,而自己只二晚上,既然已推断出有两个女子不贞,而自己只知道一个,那另一个就是自己的妻子,那这个丈夫知道一个,那另一个就是自己的妻子,那这个丈夫应该在应该在“第二个晚上哭第二个晚上哭”。第二个晚上。第二个晚上“这个丈夫这个丈夫也没有哭也没有哭”,由此丈夫们推断出:已有三个女子不,由此丈夫们推断出:已有三个女子不贞。贞。第35页,本讲稿共145页由归纳法可以证明,对于由归纳法可以证明,对于1和和100之间的任意正之间的任意正整数整数k,如果恰有,如果恰有k个妻子不贞,那么在传教士个妻子不贞,那么在传教士走后的连续走后的连续k-1个晚上,所有的丈夫照样各自称个晚上,所有的丈夫照样各自称赞自己的妻子,但在第赞自己的妻子,但在第k个晚上,个晚上,k个不贞妻子个不贞妻子的丈夫会悲鸣怯哭,于是,在的丈夫会悲鸣怯哭,于是,在99个赞扬之夜过个赞扬之夜过后的第后的第100个晚上,每个丈夫都知道一定有个晚上,每个丈夫都知道一定有100个不贞的妻子。不幸的是包括自己的妻子在内!个不贞的妻子。不幸的是包括自己的妻子在内!第36页,本讲稿共145页 传教士究竟告诉了丈夫们什么?每个丈夫传教士究竟告诉了丈夫们什么?每个丈夫都知道有都知道有99个不贞的妻子,故传教士所说的已经有个不贞的妻子,故传教士所说的已经有一个女子不贞的话对任何人来说都不是什新闻。但一个女子不贞的话对任何人来说都不是什新闻。但“传教士对所有传教士对所有100个男人做了一个声明个男人做了一个声明”是是common knowledge,从而这个传教士所声明的内容,从而这个传教士所声明的内容(有一个妻子不贞)也就成了(有一个妻子不贞)也就成了100个男人之间的个男人之间的common knowledge。在传教士宣告之前,每个形如。在传教士宣告之前,每个形如“(每个丈夫知道(每个丈夫知道)k有一个妻子不贞有一个妻子不贞”的判断对于的判断对于k99都是正确的,但对于都是正确的,但对于第37页,本讲稿共145页K=100就不正确了。例如,若从就不正确了。例如,若从1到到100对丈夫对丈夫们进行编号,则们进行编号,则1已经知道已经知道2已经知道已经知道3已经知已经知道道99已经知道已经知道100的妻子是不贞的,但的妻子是不贞的,但1不知道不知道2已经知道已经知道3已经知道已经知道99已经知道已经知道100已经知道已经知道1的妻子是不贞的。因而从这个的妻子是不贞的。因而从这个寓言中引申出的含义是,从一个共同知识的寓言中引申出的含义是,从一个共同知识的事实推出的结果与从(例如)只知道每个人事实推出的结果与从(例如)只知道每个人已经知道每个人已经知道的事实推出的结果已经知道每个人已经知道的事实推出的结果可以非常不同。可以非常不同。第38页,本讲稿共145页私人信息(私人信息(private information):指任何一):指任何一个他拥有但不是该博弈中所有参与人共同知识的个他拥有但不是该博弈中所有参与人共同知识的信息。信息。由于存在私人信息,便有了信息不对称的问由于存在私人信息,便有了信息不对称的问题。题。第39页,本讲稿共145页四、博弈的分类四、博弈的分类分类是一种深化认识的方法。博弈可以根据分类是一种深化认识的方法。博弈可以根据不同的标志从不同的角度进行多种分类。通过分不同的标志从不同的角度进行多种分类。通过分类我们将对博弈有进一步的了解,同时对博弈理类我们将对博弈有进一步的了解,同时对博弈理论的结构体系有初步的认识。教才论的结构体系有初步的认识。教才14、按参与人的多少分:、按参与人的多少分:单人博弈和多人博弈单人博弈和多人博弈、按策略空间是否有限分:、按策略空间是否有限分:有限策略博弈和无限策略博弈有限策略博弈和无限策略博弈第40页,本讲稿共145页、按各策略组合下参与人支付之和情况分:、按各策略组合下参与人支付之和情况分:零和博弈、常和博弈和变和博弈零和博弈、常和博弈和变和博弈、按参与人行动的顺序分:、按参与人行动的顺序分:静态博弈和动态博弈静态博弈和动态博弈、按信息是否完全分:、按信息是否完全分:完全信息博弈和不完全信息博弈完全信息博弈和不完全信息博弈、按信息是否完美分(动态博弈):、按信息是否完美分(动态博弈):完美信息动态博弈和不完美信息动态博弈完美信息动态博弈和不完美信息动态博弈第41页,本讲稿共145页博弈理论体系的结构框架按下面博弈类型安博弈理论体系的结构框架按下面博弈类型安排:排:静态动态静态动态完全信息完全信息完全信息完全信息完全信息完全信息静态博弈动态博弈不完静态博弈动态博弈不完全信息不完全信息不完全信息全信息不完全信息不完全信息静态博弈动态博弈静态博弈动态博弈第42页,本讲稿共145页五、本课程安排的特点五、本课程安排的特点目前,博弈论的书籍较多,版本不同,内容结目前,博弈论的书籍较多,版本不同,内容结构安排各有千秋,有的详细,有的简练;有的注重构安排各有千秋,有的详细,有的简练;有的注重纯理论的数学演绎,有的则关注应用研究,等等。纯理论的数学演绎,有的则关注应用研究,等等。This class is designed to introduce game theory to those who will later construct(or at least consume)game-theoretic models in applied fields within economics.The exposition emphasizes the economic applications of the theory at least 第43页,本讲稿共145页 as mush the pure theory itself,for three reasons.First,the applications help teach the theory;formal arguments about abstract games also appear but play a lesser role.Second,the applications illustrate the process of model building the process of translating an informal description of a multi-person decision situation into a formal game-theoretic problem to be analyzed.Third,the variety of applications shows that similar issues arise