经济博弈论 谢识予1完全信息静态博弈.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《经济博弈论 谢识予1完全信息静态博弈.ppt》由会员分享,可在线阅读,更多相关《经济博弈论 谢识予1完全信息静态博弈.ppt(121页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 博弈论与信息经济学博弈论与信息经济学 (GameTheoryandInformationEconomics)第2章:完全信息静态博弈Chapter2:StaticGameofCompleteInformation完全信息静态博弈n 静态博弈(同时行动博弈)如,罚点球时,守门员和对方射手必须同时决策完全信息静态博弈 信息信息40,50-10,00,3000,30030,80-10,1000,4000,400斗争进入者进入不进入默许在位者u 在位者低成本进入者决定是否进入一个新的产业,在位者选择斗争或默许,但不知道在位企业的成本函数是高还是低,也不知道各种战略组合下的利润水平。u 在位者高成本斗
2、争进入者进入不进入默许在位者1 完全信息静态博弈n囚徒困境与占优均衡囚徒困境与占优均衡n智猪博弈与重复剔除的占优均衡智猪博弈与重复剔除的占优均衡n纳什均衡纳什均衡n多重均衡与协调多重均衡与协调n纳什均衡应用举例纳什均衡应用举例n混合战略纳什均衡混合战略纳什均衡n纳什均衡的存在性纳什均衡的存在性1囚徒困境与占优战略均衡n两个小偷行窃未果被抓,隔离审讯。n“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。n坦白否?1囚徒困境与占优战略均衡-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒Bu
3、基于收益矩阵的模型描述:参与人参与人囚徒囚徒 B B的支付的支付囚徒囚徒B B的可的可选策略选策略囚徒囚徒 A A的支付的支付1囚徒困境与占优战略均衡u 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价u 博弈中参与人只拥有有限个离散型的纯战略有限个离散型的纯战略供其选择。如篮球比赛中的运球、过人和投篮1囚徒困境与占优战略均衡占优战略占优战略/优势策略优势策略/上策上策(dominant strategy)n 从一方的角度看,选择“坦白”比选择“抵赖”好,无论他关 于对方的选择持有何等信念。n 我们就说,对于囚徒而言,“坦白”的策略是一个占优策占优策略
4、略,或者说“抵赖”的策略是一个劣策略。1囚徒困境与占优战略均衡n参与人是理性的参与人是理性的n囚徒A应选择坦白,同样的逻辑适用于囚徒B的选择他也应选择坦白。n因而,(坦白,坦白)就是该博弈可预测的结果,也是一个均衡(甚至是唯一的)。占优均衡占优均衡1囚徒困境与占优战略均衡n 博弈双方都遵循常规智慧选择占优策略,但是这种均衡结果所产生的支付比两人合作、都选择自己的劣战略时要低。n 两个囚徒双双选择坦白是博弈的最坏结果n 反之,彼此达成合作是最好的“利己策略”,但合作必须符合黄金定律:“己所不欲,勿施于人”(前提是“人所不欲,勿施于我”)。n 囚犯两人都从利己目的出发,最终导致结果损人不利己,合作
5、没有产生。1囚徒困境与占优战略均衡n 现实生活中诸多的问题和现象,都是囚徒困境问 题的翻版。n 实际上,“囚徒困境”是现实生活中许多现象的一个 抽象概括,有着广泛而深刻的意义。当我们面临需要加以解析的经济现象时,首先要做的事就是看该现象的发生机制是否可归于某种已知的博弈模型。如可以,就可立即知道现象的本质和发生机制,并预测结果。如不能,则很可能为博弈论经济学做出创造性贡献。NE:(不提供,不提供)提供不提供提供不提供1,1-1,33,-10,0BA1囚徒困境与占优战略均衡公共品的理解?n 集体行动的障碍:个人最优选择从社会整体的角度看并不是最优的。社会最优结果是(提供,提供)“大家的事情反而无
6、人管”(英国历史学家麦考莱)1囚徒困境与占优战略均衡0,0-100,8080,-100-50,-50不降价降价不降价降价BAn 市场中常见现象,如旅游、机票、家电。n 中国的几个生产彩电的寡头厂商于2000年合谋成立“彩电厂家自律联盟”以求将彩电价格维持高位。n 彩电价格能维持高位吗?双方合作制定较高的价格,那么都可获得较高利润。但是这些联盟处于利益驱动的“囚徒困境”中,双赢成为泡影。企业之间五花八门的价格联盟总是非常短命,道理也就在于此1囚徒困境与占优战略均衡u假设团队中10名员工,每人选择“努力”都要承担成本1元,同时为团队的预期产出增加2元;每人偷懒则无须付出成本,也不会增加团队预期产出
7、。u如果其他人努力,自己偷懒可以获得好处;若别人偷懒,则自己更应该偷懒,因为自己努力付出成本1元,但为团队增加的2元产出中自己得到1/10元。所以,无论其他人是否努力地工作,我自己的最优选择都是偷懒。偷懒是每个人的占优战略 1囚徒困境与占优战略均衡u“减负”之后,家长们恐怕孩子学业荒废,纷纷请家教。给定其他孩子“减负”好耍,我家孩子在家苦读,将来考上个北大清华什么的,那些“减负”好耍的孩子只能垫底了!给定其他孩子也在家苦读,我家孩子则更需要加倍苦学了,否则不就会在将来的高考中为别人垫底了吗!u于是,当每个家长都如此盘算时,孩子们却倒了霉。n 政府“减负”政策:减少小学生的某些课时内容和家庭 作
8、业。但“减负”后学生反而更累了!1囚徒困境与占优战略均衡u曾经威胁世界整个甚至人类的军备竞赛u公共资源过度开采/公共品供给短缺u大学扩招、研究生扩招、大学贷款基建u年年都有的评优评先活动u各种资格考试广泛盛行u备受批评却日益严重的应试教育n 现实生活中其他囚徒困境的例子1囚徒困境与占优战略均衡n 如何走出囚徒困境如何走出囚徒困境?若两囚徒是意大利黑手党成员,结果会如何?人质方案的例子:秦始皇的父亲子楚“如果每个人都相信对方不会坦白,且每个人都相信对方相信自己不会坦白,每个人都相信每个人都相信对方相信自己不会坦白”,则合作抵赖的结果会出现。合作的关键是相互的信任,以及相互信任的信任如何克服信任问
9、题?1 囚徒困境与占优战略均衡电视剧亮剑委托委托-代理关系中被设计的囚徒困境代理关系中被设计的囚徒困境1囚徒困境与占优战略均衡 委托委托-代理关系:代理关系:通常指委托人请代理人代理某件事情。其中的关键问题是二者利益不一致,并且委托人与代理人之间存在信息不对称。为此,需要设计一种制度(system)或机制(mechanism),使代理人追求自己利益的同时也最大化委托人的利益,如何设计这样的制度就是信息经济学信息经济学研究的问题。u经理与审计师之间可能合谋,隐瞒不良信息u股东解决这一问题的一种做法是双头审计,请两位审计师进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题的审计师以更多的报酬。
10、5,5-1,66,-10,0审计师A隐瞒实报隐瞒实报审计师B 如果都谎报,得奖金0,但分享贿金1万 如果都诚实,则得到0 如一个诚实一个谎报,则诚实者奖励0.6万,对谎报者罚款1.1万,但谎报者得到1万贿金1囚徒困境与占优战略均衡1囚徒困境与占优战略均衡u假设:两供应商成本都为6元/件,报价都为10元/件。u策略:如果二者报价都为10元/件或8.5元/件,则从每家订购50件;若一家报价10元/件而另一家报价8.5元/件,则从价低者订购100件。125,125250,00,250200,200供应商A8.5108.510供应商B2智猪博弈与重复剔除劣战略均衡n一头大猪和一只小猪生活在同一猪圈里,
11、共用一食槽。n食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下8个包子,而跑去按开关的猪会耗费2个包子的能量。u如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪吃掉7个包子,小猪只能吃到1个;u若大猪按,按完后跑过来,大、小猪各吃掉4个包子;u若同时按,则大猪吃5个,小猪吃3个。u如果都不去按开关,就会一起饿死。2智猪博弈与重复剔除劣战略均衡3,12,47,-10,0按等小猪n“按”是小猪的劣战略,理性的小猪是不会选择按。n大猪知道小猪是理性的,意即知道小猪不会选择“按”n 小猪有占优战略“等”n 但大猪无占优战略因为大猪战略将随小猪战略改变而改变。按小猪大猪大猪按
12、按等等等按小猪3,12,47,-10,0大猪大猪按按等等等按小猪2智猪博弈与重复剔除劣战略均衡2,40,03,12,40,07,-1按等按等小猪大猪小猪按等等大猪排除劣策略减少了博弈的规模,得到的“新”博弈有可能又有了其他的(对自己或对手的)劣势策略,又可以被排除。按为小猪劣战略等为大猪劣战略2智猪博弈与重复剔除劣战略均衡重复剔除严格劣战略重复剔除严格劣战略2智猪博弈与重复剔除劣战略均衡“重复剔除严格劣战略重复剔除严格劣战略”的思路的思路2,00,10,30,11,21,0LRMUDBA知道B是理性的AU0,30,11,21,0LMD BA1,21,0LMU BAB知道A是理性的,且B知道A知
13、道B是理性的2智猪博弈与重复剔除劣战略均衡剩下唯一的策略组合(U,M)重复剔除的占优均衡2智猪博弈与重复剔除劣战略均衡0,01,11,11,11UDLM2对1而言,U不是D的严格劣战略对2而言,L不是M的严格劣战略警告:逐次剔除弱劣势策略可能去掉了某些纳什均衡。2智猪博弈与重复剔除劣战略均衡n 占优战略均衡与重复剔除的占优均衡中的区别占优战略均衡与重复剔除的占优均衡中的区别:1,01,30,10,40,22,0左中右上下参与人2参与人12智猪博弈与重复剔除劣战略均衡智猪博弈背后的哲理智猪博弈背后的哲理2智猪博弈与重复剔除劣战略均衡2智猪博弈与重复剔除劣战略均衡2智猪博弈与重复剔除劣战略均衡如何
14、解决搭便车问题?如何解决搭便车问题?如,解决企业员工偷懒,必须明确每个员工责任和任务,而且对照责任和任务进行考核、奖惩2智猪博弈与重复剔除劣战略均衡大猪大猪按按等等等等按按小猪小猪5,34,47,10,0莫勒尔说:尽管大家同乘一条船,可一些是划船,另一些人只是坐船。3,12,310,24,53,06,42,25,65,44,512,39,7C2R1R2C1C3R3参与人2参与人13纳什均衡R4u给定1选择R3,2能否通过选择不是C2来提高支付呢?不能。C2称作是2对于1选择R3的最优反应。u当参与人2选择C2时,1选择R3最优,因此1选R3是对2选择C2的最优反应。口诀:横看横看右,竖看左右,
15、竖看左逐个验证各单元格逐个验证各单元格所对应的策略组合是否符合NE的定义可找出NE3纳什均衡纳什均衡纳什均衡3纳什均衡0,02,11,20,0吉姆卖表不卖剪发不剪麦琪u 妻子麦琪有一头长发,却没有梳子。u 丈夫有一只怀表,却没有表链。u 麦琪生日那天,麦琪卖掉了长发为丈夫买了一条表链,吉姆卖掉怀表为妻子买了一把梳子。3纳什均衡0,02,11,20,0吉姆卖表不卖剪发不剪麦琪麦琪选择“不剪”是对吉姆卖表的最优反应,吉姆卖表是对麦琪“不剪”的最优反应 如何找如何找NE?3纳什均衡设有两个人一起玩游戏,每个人都有不同的策略,谁都希望设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出自己出“高
16、招高招”使自己获胜使自己获胜(即寻求效用的最大化即寻求效用的最大化),但获胜,但获胜并不完全依赖于自己的行为,还依赖于对手怎么做。并不完全依赖于自己的行为,还依赖于对手怎么做。3纳什均衡网络名句:我尊重你是因为你尊重我,你尊重我是因为我尊重你;我喜欢你是因为你喜欢我,你喜欢我是因为我喜欢你;我爱你是因为你爱我,你爱我是因为我爱你。我尊重你、我喜欢你、我爱你是我对你的行为选择的最优反应,而你尊重我、你喜欢我、你爱我是你对我的行动的最优反应。n在一个纳什均衡中,每个参与人选择她对于其他人选择的“最优反应”。n但是,一个人如何对尚未发生的、或者即使已经发生但并不知晓的事情作出反应?n尽管如此,参与人
17、可以通过各种方法对别人的正在采取的行动形成一种认识。3纳什均衡纳什均衡:一个关于信念和选择的体系纳什均衡:一个关于信念和选择的体系3纳什均衡3纳什均衡R1R2R3C1C2C3100,1000,050,10150,01,160,00,3000,0200,200n 例:3纳什均衡纳什均衡与占优战略均衡及重复剔除占优均衡之间的关系4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3参与人2参与人1练习:用划线法求解下列博弈的纳什均衡3纳什均衡纳什介绍1994年Nobel经济学奖得主u传记电影美丽心灵获得4项OSCAR大奖u纳什传奇色彩的一生:1950年在22岁获得数学哲学博
18、士学位,29岁结婚,第二年回到麻省理工学院,得到了终身学位;u不到30岁就已经闻名遐迩,曾被美国著名的财富杂志推举为同时活跃在纯数学和应用数学两个领域的天才数学家中最杰出的人物、美国最耀眼的科学新星。u30岁精神分裂,被称为“数学幽灵”,慢慢从学术界消失u在20世纪80年代,病情有了好转,后来竟奇迹般地康复了。n 纳什介绍1994年Nobel经济学奖得主u差不多就在这个时候,纳什成为1985年经济学诺贝尔奖候选人,但是最终没能获奖。u接近1994年,博弈论获奖的形势更有利,是瓜熟蒂落的时候。但纳什还是什么头衔也没有。此时出于同一师门的纳什的同学、普林斯顿著名的数理经济学家库恩发挥了作用:向no
19、bel委员会申明,若因为身体状况剥夺纳什当之无愧的nobel奖,那“实在需要过分的勇气”。u纳什终于在1994年走上了诺贝尔经济学奖的领奖台。Nash(1950,1951)两篇关于非合作博弈的重要文章,定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石4多重均衡与协调4多重均衡与协调1,10,00,01,1哈哈里里星巴克本地咖啡馆莎莉莎莉星巴克本地咖啡馆n 两大学生哈里和莎莉,在图书馆相遇,相聊甚欢。当意犹未尽之时,他们得马上赶回上课,约好4:00喝咖啡。n 两人忘记约喝咖啡地点,两地方可选,星巴克和本地咖啡馆,两地方在校园相反方向。两人未换手机号,无法联系。
20、n 他们该怎么办?4多重均衡与协调如星巴克是大家众所周知的活动场所,哈里知道,所以哈里应去星巴克,但仅哈里知道不够,他还得确定莎莉知道,而且莎莉知道哈里知道,以此类推。4多重均衡与协调2,10,00,01,2两个NE:存在共同利益参与人,但各自偏爱一个均衡。究竟哪个均衡会出现?哈里星巴克本地咖啡馆莎莉星巴克本地咖啡馆4多重均衡与协调0,05,22,51,1上上司司强硬屈从强硬屈从下属下属n 有些组织上级对下级非常强硬,被称为铁腕上司n 有些组织里下级对上级毫不买账,被称为鹰派下属两个NE 若上司强硬,则下属屈从 若下属强硬,则上司屈从4多重均衡与协调n两个不服对方的人拼赌,面对面高速驾车驾车行
21、驶,如果谁先把方向盘转向而避免相撞,谁就输并被称作“懦夫”(Chicken),而向前的人将被称作“勇士”n如果两人都向前,车毁人亡。1,1-2,22,-2-4,-4 每人都希望成勇士,对方成懦夫,同时也最不希望发生车祸 双方都当懦夫比只有自己当懦夫好司机1向前(勇士)转向(懦夫)司机2 向前(勇士)转向(懦夫)4多重均衡与协调1,1-2,22,-2-4,-4司机1向前(勇士)转向(懦夫)司机2 向前(勇士)转向(懦夫)懦夫博弈特征:懦夫博弈特征:n美国于1961年策动对古巴猎湾的入侵遭到可耻的失败,一直耿耿于怀,总想伺机对古巴进行干涉。同时,古巴同苏联的关系越来越密切,而美、苏之间的磨擦却日趋
22、严重n美、苏两国导弹数量的比例是171,美国优势明显,苏联政府对此担忧不已。为迫使美国从土耳其和靠近苏联的其他地区撤除导弹,赫鲁晓夫决定在古巴部署苏式导弹,并找了堂而皇之的理由:捍卫古巴革命成果。1962年加勒比海地区发生了一场震惊世界的古巴导弹危机。这场危机,差点引发一场核战争,整个世界危在旦夕。最后以双方的妥协而告终,导弹危机后被称为懦夫博弈的典型案例。4多重均衡与协调n1962年7月苏联开始向古巴运送导弹。10月美侦察机发现了古巴境内的导弹基地,肯尼迪立即向苏联提出强烈抗议,要求马上拆除古巴境内的导弹发射设施,否则将毫不犹豫消灭这些直接威胁美国安全的导弹设施。n苏联方面对此答复:导弹基地
23、纯粹是防御性质的。但美却不依不饶,咬定从该基地发射的导弹足以摧毁美国各大城市。n10月16日肯尼迪组成了国家安全委员会执行委员会,研究如何对付苏联。执委会成员们提出了众多方案,归纳起来主要有三个:一、空袭古巴导弹基地;二、对古巴实行封锁;三、诉诸联合国。n10月22日:肯尼迪发表电视演说,宣布将对古巴实行封锁。n10月23日:苏联政府发表声明,表示仍要继续使用武器“援助”古巴,“坚决拒绝”美国的拦截,对美的威胁“将进行最激烈的回击”。n10月24日:美国一支由90艘战舰组成的庞大舰队,在68个空军中队和8艘航空母舰的护卫下,在古巴领海周围设置了警戒线,拦截所有驶入封锁区的船只。在靠近古巴的美国
24、佛罗里达州及邻近各州集结了一支庞大的登陆部队。在离古巴东部海岸约300千米的岛上,设有巨大的导弹跟踪站,监视往古巴去的船只的一举一动。n10月25日:苏联作出了一个决定,以不携带武器的船只去考验封锁。n10月26日:赫鲁晓夫给肯尼迪写了封信。信中说,若美国保证不会入侵古巴、也不允许别人入侵,并且如果它撤回自己的舰队,不再搞隔离,马上撤出古巴导弹。n10月27日:第2封信:重申苏联向古巴提供武器“只是加强防御能力,因为古巴不拥有任何武器”。赫鲁晓夫建议“我们同意从古巴撤出导弹。但是美国需要声明:美国方面考虑到苏联的安全和焦虑,将从土耳其撤出自己的这种手段”;苏联保证尊重土耳其领土和主权的不可侵犯
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济博弈论 谢识予1 完全信息静态博弈 经济 博弈论 谢识予 完全 信息 静态 博弈
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内