决策理论-第七章-竞争型决策分析--博弈论ppt课件.ppt
《决策理论-第七章-竞争型决策分析--博弈论ppt课件.ppt》由会员分享,可在线阅读,更多相关《决策理论-第七章-竞争型决策分析--博弈论ppt课件.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 竞争型决策分析竞争型决策分析第一节第一节 竞争型决策分析与博弈论竞争型决策分析与博弈论1 12 2第二节第二节 完全信息静态博弈完全信息静态博弈3 3第三节第三节 完全信息动态博弈完全信息动态博弈博弈论的思想溯源竞争型决策考虑竞争对手信息下所做的最优决策n市场竞争n政党竞争 美藉匈牙利数学家冯诺依曼(John Von Neuman)和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于普林斯顿大学,他们于1944年出版了经典著作博弈论与经济行为,为现代博弈论的发展奠定了基础。 美国的数学家、经济学家纳什纳什(John Nash),美籍匈牙利经济学家海萨尼海萨尼(John C
2、. Harsanyi)和德国经济学家泽尔泽尔滕滕(R.Selten)因对博弈论的卓越贡献而获得1994年度的诺贝尔经济学家。海萨尼 纳什 值得一提的是纳什,他发表奠定其在博弈论中重要地位的学术论文时,年仅22岁,被人称为“一个天才”。1959年,纳什被精神病医生诊断为“妄想性精神分裂”,饱受精神病折磨40余年。泽尔滕 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解” 保罗萨缪尔森什么是博弈论?博弈论是研究理性的决策者之间的冲突与合作冲突与合作的理论,具体讲就是研究当决策主体的行为在发生直接的相互作用相互作用时,人们如何进行决策以及这种决策的均衡均衡问题。什么是博弈?博弈是指代表
3、不同利益主体的决策者,在一定的环境条件和规则下,根据所掌握的信息,同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施,从而取得各自相应结果的过程。如下棋,最后的结果就是由下棋双方你来我往轮流如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结做出决策,决策又相互影响、相互作用而得出的结果。果。(一) 囚徒困境 两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑5年;若两人都 不招则未获证据但因私入民宅 各拘留1年。 甲
4、和乙是参与博弈的人,称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。 局中人所选择的战略构成的组合(招,招)被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。表1 囚徒困境博弈 乙 招 不招 招 甲 不招(问题1:甲、乙如何选择?) -5,-50,-10-10,0-1,-1 对甲来说 ,尽管他不 知道乙是选择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,甲会选择“招”。 同 样 , 根 据 对 称
5、性 , 乙 也 会 选 择“招”,结果是甲乙两人都“招”。表1 囚徒困境博弈 乙 招 不招 招 甲 不招-5,-50,-10-10,0-1,-1 甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。 总结n囚徒困境反映了一个深刻的问题,这就是个人追求最大自身利益的行为,常常并不能导致实现社会的最大利益,也常常不能真正实现个人自身利益的最大化。n我们可以利用这个道理来分析日常生活中的许多不合作现象。对经典经济学的冲击“纳什均衡纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发
6、,而最终全社会达到利他的效果。国富论:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。 2. 生活中的“囚徒困境”例子例子例子1:1:商家价格战商家价格战 出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身
7、崩溃,价格就会掉下来。n 譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。n 但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨
8、而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。 n例子例子2: 2: 为什么要加入为什么要加入WTOWTO? WTO是一个自愿性申请加入的自由贸易联盟,即WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税,另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。田忌赛马田忌赛马n 古代齐威王与大将田忌
9、赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。n 比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1千金给赢方。双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。实际上,田忌的上马、中马要优于齐威王的中马、下马。n 比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。n 这个案例生动地告诉我们,巧妙地运用策略是多么的重要。n 但是,事情并没有结束,齐威王也很聪明,他利用各种手段,很快明白了自己输掉比赛的原因而及时地调整了自己的对策。这样,齐威王与田忌的赛马也就成了一个具有策略依存特征的决策较量,构成了一个典型的
10、博弈问题n 如果把赢一千金记成收益1,输一千金记成收益为1,则齐威王和田忌在各种策略组合下的收益如下表所示:田忌赛马续篇田忌赛马续篇上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3齐齐威威王王田忌田忌田忌赛马续篇田忌赛马续篇 在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1
11、-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1千金,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故.田忌赛马续篇田忌赛马续篇博弈的要素1 1、参与人、参与人是指博弈中独立决策、独立承担结果的决策主体。是指博弈中独立决策、独立承担结果的决策主体。他们可以是自然人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的顾问等。博弈的要素2、策略策略指每个博弈方在进行决策时可以选择的方法、做法等,策
12、略有纯策略纯策略和混合策略混合策略之分。纯策略指参与人在博弈中可以选择采用的行动方案,混合策略是在纯策略空间上的一种概率分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。博弈的要素3、支付支付每个博弈方从各种策略组合中获得的收益或效用,它是策略组合的函数,所以也称支付函数记为12( )( ,)iinu Su s ss博弈的要素4、博弈方的信息博弈方的信息 信息是博弈参与方有关其他博弈方的策略、收益等知识。5 5、博弈的次序、博弈的次序 规定一个博弈就必须规定其次序,不同的次序是不同的博弈。6 6、结果和均衡、结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情形。博弈
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策 理论 第七 竞争 分析 博弈论 ppt 课件
限制150内