博弈论原理与方法分析ppt课件.ppt
《博弈论原理与方法分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《博弈论原理与方法分析ppt课件.ppt(117页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论原理与方法博弈论原理与方法关于均衡的分析“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论简介博弈论简介博弈论的提法可能太过于学术化,容易让人们 退避三舍。其实它有一个非常通俗的名字-游 戏理论(博弈论的英文名字叫做“Game Theory ,如果直译,就是游戏理论)。博弈论在我 国还有一个名字
2、,叫对策论。这些名字都很好 理解,博弈字面意思就是赌博、下棋,赌博和 下棋当然是游戏了,赌博和下棋的时候常常要 千方百计地应付对手,自然是要讲究对策了。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论简介博弈论简介博弈论主要研究人们的策略的相互依赖行为。博弈论认为,人是理性的,即人人都会在一定的约束条件下最大化自身的利益。非合作博弈:当事人不能达成一个有约束力的协议。合作博弈“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、
3、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论简介博弈论简介 在博弈理论中,虽然每方都要最大化自己的利益,但它与优化理论有所区别:l优化理论可看成单人决策,追求的是目标函数的优化优化。 影响结果的多个变量控制在决策者自己手中。 企业管理成本最小化问题、运输问题、车间调度l博弈理论可看成多人决策,追求的是策略组合的均衡均衡。 影响结果的变量是由多个博弈者操纵。 社会经济系统中的大量问题,竞价问题、企业竞争决策“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的
4、“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革l犹太法典(Talmud)中一个男人如何将死后的财 产发给三个妻子的难题; 在一个案例中,一个男人有三个老婆,丈夫在给她们各自的婚姻契约中规定一旦自己死亡她们分别接受100货币、200货币300货币。这部法典明确地给出了不同的建议:如果男人留下的遗产只有100货币,将其平分;如果遗产为200货币,将其按(50,75,75) 的比例划分;遗产为300货币时按(50,100,150)的比例划分。第一种情况容易理解,而如何理解后两种划分?这一问题困挠了研究犹太法典的学者达二几千年之久。直到1985年,有人提出:犹太法典的这一建议是完全
5、符合合作博弈理论的,每一方案都符合特定博弈的要旨所在。l中国古代田忌赛马;lCournot的寡头竞争模型(1838 年财富理论的数学研究)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革l博弈理论开始于1944年由冯诺依曼(Von Neumann)和摩根斯坦恩(Oskar Morgenstern)合作的博弈论和经济行为(The Theory of Games and Economic Behaviour)一书由Princeton Uni
6、versity Press出版。l20世纪50年代以来,纳什(Nash)、泽尔腾(Selten) 、海萨尼(Harsanyi)等人对非合作博弈理论的研究使博弈论最终成熟并进入实用。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革lJohn Nash: 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经
7、济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈 普遍得多。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革l泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”。l而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(19671968)。l总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后 人继续发展博弈论,
8、提供了基本思路和模型“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革l博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement) 。倘若不能,则称非合作博弈Non-cooperative game。l合作博弈强调的是集体主义,团体理性Collective Rationality,是效率、公平、公正;“雪亮工程是以区(县)、乡(镇)
9、、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革l而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪
10、论绪论-博弈论的历史沿革博弈论的历史沿革l博弈论相关诺贝尔奖 1972年John R. Hicks and Kenneth J. Arrow经济均衡原理和社会福利原理。 1990年Harry N. Markowitz, Merton M. Miller and William F. Sharpe金融经济学原理。 1994年John Harsanyi, John F. Nash and Reinhard Selten非合作博弈中均衡的研究 1996年James A. Mirrless and William Vickery不对称信息条件下激励机制问题“雪亮工程是以区(县)、乡(镇)、村(社区)三
11、级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈论的历史沿革博弈论的历史沿革l2001年Jeorge Akerlof、Michael Spence and Joseph Stiglitz非对称信息市场分析l2002年丹尼尔卡尼曼和弗农史密斯心理和实验经济学方面l2005年Thomas Schelling and Robert Aumann合作博弈方面博弈论在构成了微观经济学的基础性方法。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监
12、控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈论博弈论的定义:l博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑 和规律的数学分支。简单地说,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈论 从博弈特性角度定义l“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理
13、论与方法”。也就是说,当一个主体,好比说 一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在 这个意义上说,博弃论又称为“对策论”.(张维迎)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈论 从博弈过程角度定义:l博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的约束条件下,依靠所掌握的信息,同时或先后、一次或多次、从各自可能的行为或策略集合中进行选择并实施,各自
14、从中取得相应结果或收益的过程。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈论What is a game?lA Game has the following four things: The players: Who is involved? Defining society/system. The rules: What can they do? Defining interactions possible in the society.
15、The outcomes: What is the result of the interaction? The payoffs: What is the payoff/profit of each possible outcomes?“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈论l示例: 猜硬币游戏 The players: 2 players, 1; 2. The rules: Both players toss their respec
16、tive coins simultaneously. Outcome: Coins match (both heads up or tails up) or dont match. Payoff: If coins match, player 1 pays $1 to player 2 and if they dont match then player 2 pays $1 to player 1.“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈
17、论lThere are at least two players. A player may be an individual, a company, a nation, a biological species, nature, etc.lEach player has a number of possible strategies, that is courses of action they can follow.lThe strategies the players follow determine the outcome of the game.lAssociated with ea
18、ch outcome is a payoff (支付)to each player i. e. the value of the outcome to each player.“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。l示例:囚徒困境(Prisoners Dilemma)l 如果都不坦白,每人判1年l 如果都坦白,每人判8年l 如果一人坦白,一人不坦白,则坦白的人释放、不坦白的人判9年。绪论绪论-什么是博弈论什么是博弈论“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治
19、中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是博弈论什么是博弈论l一场博弈包括 参与人( players) (例如囚犯A和B); 每个参与人的一组策略 (例如“坦白”和”不坦白”); 支付(payoffs):参与人在所选策略(策略组合, the strategy profile)上的效用 例如如果A坦白,而B不坦白,A得0,B得-9“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-什么是
20、博弈论什么是博弈论l得益矩阵得益矩阵 坦白坦白 不坦白不坦白坦白坦白 不坦白不坦白行参与者列参与者每位参与者得策略行参与者支付列参与者支付针对每位参与者、每个可能结果的支付“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-几个典型模型几个典型模型l囚徒困境 描述如前,分析: 对囚徒1来说,假设囚徒2选择不坦白,则对囚徒1来说,不坦白的得益为-1,坦白的得益为0,他应选择坦白;假设囚徒2选择坦白,则对囚徒1来说,不坦白的得益为-9,坦白的得益为-8,他还是应选择坦白。坦白
21、是囚徒1的一个占优的“上策”(Dominant Strategy)。同样,囚徒2的“上策”也应是坦白。最终结果两方坦白。 但对两个囚徒来说,最佳结果应该均为不坦白,既没有实现两人总体的最大利益,也没有真正实现自身个体的最大利益。坦白不坦白 坦白 不坦白“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-几个典型模型几个典型模型l寡头竞价模型 高价 低价高价低价分析:假设寡头2采用高价策略,那么寡头1采用高价策略得益80,采用低价策略得益130,显然它应采用低价策略,假设寡
22、头2采用低价策略,那么寡头1采用高价策略得益20,采用低价策略得益60,它也应采用低价策略。用同样方法可得寡头2也应采用低价策略。低价-低价对双方不是理想的结果,但因为双方均无法信任,所以均坚持采用低价策略。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-几个典型模型几个典型模型l猜硬币游戏正面反面 正面 反面猜方盖方分析:在本博弈中,双方的利益是严格对立的,取胜的关键是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。在一次博弈中结果取决于机会,在多次重
23、复中,如果双方决策都正确,则我们可求得平均的双方收益。彼此得益相同。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈基本要素博弈基本要素l参与人players 又称“局中人”或”博弈方”,是指博弈中独立决策、独立承担后果、以自身利益最大化来选择行动的决策主体(可以是个人、也可以是团队,如厂商、政府、国家)。 每个参与人必须有可供选择的行动和一个很好定义的偏好函数。不做决策的被动主体只能被当作环境参数。博弈主体的完全理性(Perfect Rationality)和有
24、限理性,个体理性和集体理性。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈基本要素博弈基本要素l虚拟参与人pseudo-player 为了分析方便,自然nature被当作虚拟参与人。 自然代表决定外生随机变量的概率分布的机制。比如房地产开发中市场需求的大小。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈基本要素博弈基本要素l战略s
25、trategies参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。战略与行动:战略是行动的规则而不是行动本身。在静态博弈中,战略和行动是相同的。战略必须是完备的,要给出参与人在每一种可想象得到的情况下的行动选择。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。绪论绪论-博弈基本要素博弈基本要素l行动Action or Moves 指参与人所有可能的策略或行动的集合,如消费效用最大化决策中的各种商品的购买量。根据该集合是有限的还是无限的,可分为有限博弈和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 原理 方法 分析 ppt 课件
限制150内