欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    经济博弈论 谢识予1完全信息静态博弈.ppt

    • 资源ID:70679785       资源大小:1.16MB        全文页数:121页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    经济博弈论 谢识予1完全信息静态博弈.ppt

    博弈论与信息经济学博弈论与信息经济学 (GameTheoryandInformationEconomics)第2章:完全信息静态博弈Chapter2:StaticGameofCompleteInformation完全信息静态博弈n 静态博弈(同时行动博弈)如,罚点球时,守门员和对方射手必须同时决策完全信息静态博弈 信息信息40,50-10,00,3000,30030,80-10,1000,4000,400斗争进入者进入不进入默许在位者u 在位者低成本进入者决定是否进入一个新的产业,在位者选择斗争或默许,但不知道在位企业的成本函数是高还是低,也不知道各种战略组合下的利润水平。u 在位者高成本斗争进入者进入不进入默许在位者1 完全信息静态博弈n囚徒困境与占优均衡囚徒困境与占优均衡n智猪博弈与重复剔除的占优均衡智猪博弈与重复剔除的占优均衡n纳什均衡纳什均衡n多重均衡与协调多重均衡与协调n纳什均衡应用举例纳什均衡应用举例n混合战略纳什均衡混合战略纳什均衡n纳什均衡的存在性纳什均衡的存在性1囚徒困境与占优战略均衡n两个小偷行窃未果被抓,隔离审讯。n“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。n坦白否?1囚徒困境与占优战略均衡-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒Bu基于收益矩阵的模型描述:参与人参与人囚徒囚徒 B B的支付的支付囚徒囚徒B B的可的可选策略选策略囚徒囚徒 A A的支付的支付1囚徒困境与占优战略均衡u 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价u 博弈中参与人只拥有有限个离散型的纯战略有限个离散型的纯战略供其选择。如篮球比赛中的运球、过人和投篮1囚徒困境与占优战略均衡占优战略占优战略/优势策略优势策略/上策上策(dominant strategy)n 从一方的角度看,选择“坦白”比选择“抵赖”好,无论他关 于对方的选择持有何等信念。n 我们就说,对于囚徒而言,“坦白”的策略是一个占优策占优策略略,或者说“抵赖”的策略是一个劣策略。1囚徒困境与占优战略均衡n参与人是理性的参与人是理性的n囚徒A应选择坦白,同样的逻辑适用于囚徒B的选择他也应选择坦白。n因而,(坦白,坦白)就是该博弈可预测的结果,也是一个均衡(甚至是唯一的)。占优均衡占优均衡1囚徒困境与占优战略均衡n 博弈双方都遵循常规智慧选择占优策略,但是这种均衡结果所产生的支付比两人合作、都选择自己的劣战略时要低。n 两个囚徒双双选择坦白是博弈的最坏结果n 反之,彼此达成合作是最好的“利己策略”,但合作必须符合黄金定律:“己所不欲,勿施于人”(前提是“人所不欲,勿施于我”)。n 囚犯两人都从利己目的出发,最终导致结果损人不利己,合作没有产生。1囚徒困境与占优战略均衡n 现实生活中诸多的问题和现象,都是囚徒困境问 题的翻版。n 实际上,“囚徒困境”是现实生活中许多现象的一个 抽象概括,有着广泛而深刻的意义。当我们面临需要加以解析的经济现象时,首先要做的事就是看该现象的发生机制是否可归于某种已知的博弈模型。如可以,就可立即知道现象的本质和发生机制,并预测结果。如不能,则很可能为博弈论经济学做出创造性贡献。NE:(不提供,不提供)提供不提供提供不提供1,1-1,33,-10,0BA1囚徒困境与占优战略均衡公共品的理解?n 集体行动的障碍:个人最优选择从社会整体的角度看并不是最优的。社会最优结果是(提供,提供)“大家的事情反而无人管”(英国历史学家麦考莱)1囚徒困境与占优战略均衡0,0-100,8080,-100-50,-50不降价降价不降价降价BAn 市场中常见现象,如旅游、机票、家电。n 中国的几个生产彩电的寡头厂商于2000年合谋成立“彩电厂家自律联盟”以求将彩电价格维持高位。n 彩电价格能维持高位吗?双方合作制定较高的价格,那么都可获得较高利润。但是这些联盟处于利益驱动的“囚徒困境”中,双赢成为泡影。企业之间五花八门的价格联盟总是非常短命,道理也就在于此1囚徒困境与占优战略均衡u假设团队中10名员工,每人选择“努力”都要承担成本1元,同时为团队的预期产出增加2元;每人偷懒则无须付出成本,也不会增加团队预期产出。u如果其他人努力,自己偷懒可以获得好处;若别人偷懒,则自己更应该偷懒,因为自己努力付出成本1元,但为团队增加的2元产出中自己得到1/10元。所以,无论其他人是否努力地工作,我自己的最优选择都是偷懒。偷懒是每个人的占优战略 1囚徒困境与占优战略均衡u“减负”之后,家长们恐怕孩子学业荒废,纷纷请家教。给定其他孩子“减负”好耍,我家孩子在家苦读,将来考上个北大清华什么的,那些“减负”好耍的孩子只能垫底了!给定其他孩子也在家苦读,我家孩子则更需要加倍苦学了,否则不就会在将来的高考中为别人垫底了吗!u于是,当每个家长都如此盘算时,孩子们却倒了霉。n 政府“减负”政策:减少小学生的某些课时内容和家庭 作业。但“减负”后学生反而更累了!1囚徒困境与占优战略均衡u曾经威胁世界整个甚至人类的军备竞赛u公共资源过度开采/公共品供给短缺u大学扩招、研究生扩招、大学贷款基建u年年都有的评优评先活动u各种资格考试广泛盛行u备受批评却日益严重的应试教育n 现实生活中其他囚徒困境的例子1囚徒困境与占优战略均衡n 如何走出囚徒困境如何走出囚徒困境?若两囚徒是意大利黑手党成员,结果会如何?人质方案的例子:秦始皇的父亲子楚“如果每个人都相信对方不会坦白,且每个人都相信对方相信自己不会坦白,每个人都相信每个人都相信对方相信自己不会坦白”,则合作抵赖的结果会出现。合作的关键是相互的信任,以及相互信任的信任如何克服信任问题?1 囚徒困境与占优战略均衡电视剧亮剑委托委托-代理关系中被设计的囚徒困境代理关系中被设计的囚徒困境1囚徒困境与占优战略均衡 委托委托-代理关系:代理关系:通常指委托人请代理人代理某件事情。其中的关键问题是二者利益不一致,并且委托人与代理人之间存在信息不对称。为此,需要设计一种制度(system)或机制(mechanism),使代理人追求自己利益的同时也最大化委托人的利益,如何设计这样的制度就是信息经济学信息经济学研究的问题。u经理与审计师之间可能合谋,隐瞒不良信息u股东解决这一问题的一种做法是双头审计,请两位审计师进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题的审计师以更多的报酬。5,5-1,66,-10,0审计师A隐瞒实报隐瞒实报审计师B 如果都谎报,得奖金0,但分享贿金1万 如果都诚实,则得到0 如一个诚实一个谎报,则诚实者奖励0.6万,对谎报者罚款1.1万,但谎报者得到1万贿金1囚徒困境与占优战略均衡1囚徒困境与占优战略均衡u假设:两供应商成本都为6元/件,报价都为10元/件。u策略:如果二者报价都为10元/件或8.5元/件,则从每家订购50件;若一家报价10元/件而另一家报价8.5元/件,则从价低者订购100件。125,125250,00,250200,200供应商A8.5108.510供应商B2智猪博弈与重复剔除劣战略均衡n一头大猪和一只小猪生活在同一猪圈里,共用一食槽。n食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下8个包子,而跑去按开关的猪会耗费2个包子的能量。u如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪吃掉7个包子,小猪只能吃到1个;u若大猪按,按完后跑过来,大、小猪各吃掉4个包子;u若同时按,则大猪吃5个,小猪吃3个。u如果都不去按开关,就会一起饿死。2智猪博弈与重复剔除劣战略均衡3,12,47,-10,0按等小猪n“按”是小猪的劣战略,理性的小猪是不会选择按。n大猪知道小猪是理性的,意即知道小猪不会选择“按”n 小猪有占优战略“等”n 但大猪无占优战略因为大猪战略将随小猪战略改变而改变。按小猪大猪大猪按按等等等按小猪3,12,47,-10,0大猪大猪按按等等等按小猪2智猪博弈与重复剔除劣战略均衡2,40,03,12,40,07,-1按等按等小猪大猪小猪按等等大猪排除劣策略减少了博弈的规模,得到的“新”博弈有可能又有了其他的(对自己或对手的)劣势策略,又可以被排除。按为小猪劣战略等为大猪劣战略2智猪博弈与重复剔除劣战略均衡重复剔除严格劣战略重复剔除严格劣战略2智猪博弈与重复剔除劣战略均衡“重复剔除严格劣战略重复剔除严格劣战略”的思路的思路2,00,10,30,11,21,0LRMUDBA知道B是理性的AU0,30,11,21,0LMD BA1,21,0LMU BAB知道A是理性的,且B知道A知道B是理性的2智猪博弈与重复剔除劣战略均衡剩下唯一的策略组合(U,M)重复剔除的占优均衡2智猪博弈与重复剔除劣战略均衡0,01,11,11,11UDLM2对1而言,U不是D的严格劣战略对2而言,L不是M的严格劣战略警告:逐次剔除弱劣势策略可能去掉了某些纳什均衡。2智猪博弈与重复剔除劣战略均衡n 占优战略均衡与重复剔除的占优均衡中的区别占优战略均衡与重复剔除的占优均衡中的区别:1,01,30,10,40,22,0左中右上下参与人2参与人12智猪博弈与重复剔除劣战略均衡智猪博弈背后的哲理智猪博弈背后的哲理2智猪博弈与重复剔除劣战略均衡2智猪博弈与重复剔除劣战略均衡2智猪博弈与重复剔除劣战略均衡如何解决搭便车问题?如何解决搭便车问题?如,解决企业员工偷懒,必须明确每个员工责任和任务,而且对照责任和任务进行考核、奖惩2智猪博弈与重复剔除劣战略均衡大猪大猪按按等等等等按按小猪小猪5,34,47,10,0莫勒尔说:尽管大家同乘一条船,可一些是划船,另一些人只是坐船。3,12,310,24,53,06,42,25,65,44,512,39,7C2R1R2C1C3R3参与人2参与人13纳什均衡R4u给定1选择R3,2能否通过选择不是C2来提高支付呢?不能。C2称作是2对于1选择R3的最优反应。u当参与人2选择C2时,1选择R3最优,因此1选R3是对2选择C2的最优反应。口诀:横看横看右,竖看左右,竖看左逐个验证各单元格逐个验证各单元格所对应的策略组合是否符合NE的定义可找出NE3纳什均衡纳什均衡纳什均衡3纳什均衡0,02,11,20,0吉姆卖表不卖剪发不剪麦琪u 妻子麦琪有一头长发,却没有梳子。u 丈夫有一只怀表,却没有表链。u 麦琪生日那天,麦琪卖掉了长发为丈夫买了一条表链,吉姆卖掉怀表为妻子买了一把梳子。3纳什均衡0,02,11,20,0吉姆卖表不卖剪发不剪麦琪麦琪选择“不剪”是对吉姆卖表的最优反应,吉姆卖表是对麦琪“不剪”的最优反应 如何找如何找NE?3纳什均衡设有两个人一起玩游戏,每个人都有不同的策略,谁都希望设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出自己出“高招高招”使自己获胜使自己获胜(即寻求效用的最大化即寻求效用的最大化),但获胜,但获胜并不完全依赖于自己的行为,还依赖于对手怎么做。并不完全依赖于自己的行为,还依赖于对手怎么做。3纳什均衡网络名句:我尊重你是因为你尊重我,你尊重我是因为我尊重你;我喜欢你是因为你喜欢我,你喜欢我是因为我喜欢你;我爱你是因为你爱我,你爱我是因为我爱你。我尊重你、我喜欢你、我爱你是我对你的行为选择的最优反应,而你尊重我、你喜欢我、你爱我是你对我的行动的最优反应。n在一个纳什均衡中,每个参与人选择她对于其他人选择的“最优反应”。n但是,一个人如何对尚未发生的、或者即使已经发生但并不知晓的事情作出反应?n尽管如此,参与人可以通过各种方法对别人的正在采取的行动形成一种认识。3纳什均衡纳什均衡:一个关于信念和选择的体系纳什均衡:一个关于信念和选择的体系3纳什均衡3纳什均衡R1R2R3C1C2C3100,1000,050,10150,01,160,00,3000,0200,200n 例:3纳什均衡纳什均衡与占优战略均衡及重复剔除占优均衡之间的关系4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3参与人2参与人1练习:用划线法求解下列博弈的纳什均衡3纳什均衡纳什介绍1994年Nobel经济学奖得主u传记电影美丽心灵获得4项OSCAR大奖u纳什传奇色彩的一生:1950年在22岁获得数学哲学博士学位,29岁结婚,第二年回到麻省理工学院,得到了终身学位;u不到30岁就已经闻名遐迩,曾被美国著名的财富杂志推举为同时活跃在纯数学和应用数学两个领域的天才数学家中最杰出的人物、美国最耀眼的科学新星。u30岁精神分裂,被称为“数学幽灵”,慢慢从学术界消失u在20世纪80年代,病情有了好转,后来竟奇迹般地康复了。n 纳什介绍1994年Nobel经济学奖得主u差不多就在这个时候,纳什成为1985年经济学诺贝尔奖候选人,但是最终没能获奖。u接近1994年,博弈论获奖的形势更有利,是瓜熟蒂落的时候。但纳什还是什么头衔也没有。此时出于同一师门的纳什的同学、普林斯顿著名的数理经济学家库恩发挥了作用:向nobel委员会申明,若因为身体状况剥夺纳什当之无愧的nobel奖,那“实在需要过分的勇气”。u纳什终于在1994年走上了诺贝尔经济学奖的领奖台。Nash(1950,1951)两篇关于非合作博弈的重要文章,定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石4多重均衡与协调4多重均衡与协调1,10,00,01,1哈哈里里星巴克本地咖啡馆莎莉莎莉星巴克本地咖啡馆n 两大学生哈里和莎莉,在图书馆相遇,相聊甚欢。当意犹未尽之时,他们得马上赶回上课,约好4:00喝咖啡。n 两人忘记约喝咖啡地点,两地方可选,星巴克和本地咖啡馆,两地方在校园相反方向。两人未换手机号,无法联系。n 他们该怎么办?4多重均衡与协调如星巴克是大家众所周知的活动场所,哈里知道,所以哈里应去星巴克,但仅哈里知道不够,他还得确定莎莉知道,而且莎莉知道哈里知道,以此类推。4多重均衡与协调2,10,00,01,2两个NE:存在共同利益参与人,但各自偏爱一个均衡。究竟哪个均衡会出现?哈里星巴克本地咖啡馆莎莉星巴克本地咖啡馆4多重均衡与协调0,05,22,51,1上上司司强硬屈从强硬屈从下属下属n 有些组织上级对下级非常强硬,被称为铁腕上司n 有些组织里下级对上级毫不买账,被称为鹰派下属两个NE 若上司强硬,则下属屈从 若下属强硬,则上司屈从4多重均衡与协调n两个不服对方的人拼赌,面对面高速驾车驾车行驶,如果谁先把方向盘转向而避免相撞,谁就输并被称作“懦夫”(Chicken),而向前的人将被称作“勇士”n如果两人都向前,车毁人亡。1,1-2,22,-2-4,-4 每人都希望成勇士,对方成懦夫,同时也最不希望发生车祸 双方都当懦夫比只有自己当懦夫好司机1向前(勇士)转向(懦夫)司机2 向前(勇士)转向(懦夫)4多重均衡与协调1,1-2,22,-2-4,-4司机1向前(勇士)转向(懦夫)司机2 向前(勇士)转向(懦夫)懦夫博弈特征:懦夫博弈特征:n美国于1961年策动对古巴猎湾的入侵遭到可耻的失败,一直耿耿于怀,总想伺机对古巴进行干涉。同时,古巴同苏联的关系越来越密切,而美、苏之间的磨擦却日趋严重n美、苏两国导弹数量的比例是171,美国优势明显,苏联政府对此担忧不已。为迫使美国从土耳其和靠近苏联的其他地区撤除导弹,赫鲁晓夫决定在古巴部署苏式导弹,并找了堂而皇之的理由:捍卫古巴革命成果。1962年加勒比海地区发生了一场震惊世界的古巴导弹危机。这场危机,差点引发一场核战争,整个世界危在旦夕。最后以双方的妥协而告终,导弹危机后被称为懦夫博弈的典型案例。4多重均衡与协调n1962年7月苏联开始向古巴运送导弹。10月美侦察机发现了古巴境内的导弹基地,肯尼迪立即向苏联提出强烈抗议,要求马上拆除古巴境内的导弹发射设施,否则将毫不犹豫消灭这些直接威胁美国安全的导弹设施。n苏联方面对此答复:导弹基地纯粹是防御性质的。但美却不依不饶,咬定从该基地发射的导弹足以摧毁美国各大城市。n10月16日肯尼迪组成了国家安全委员会执行委员会,研究如何对付苏联。执委会成员们提出了众多方案,归纳起来主要有三个:一、空袭古巴导弹基地;二、对古巴实行封锁;三、诉诸联合国。n10月22日:肯尼迪发表电视演说,宣布将对古巴实行封锁。n10月23日:苏联政府发表声明,表示仍要继续使用武器“援助”古巴,“坚决拒绝”美国的拦截,对美的威胁“将进行最激烈的回击”。n10月24日:美国一支由90艘战舰组成的庞大舰队,在68个空军中队和8艘航空母舰的护卫下,在古巴领海周围设置了警戒线,拦截所有驶入封锁区的船只。在靠近古巴的美国佛罗里达州及邻近各州集结了一支庞大的登陆部队。在离古巴东部海岸约300千米的岛上,设有巨大的导弹跟踪站,监视往古巴去的船只的一举一动。n10月25日:苏联作出了一个决定,以不携带武器的船只去考验封锁。n10月26日:赫鲁晓夫给肯尼迪写了封信。信中说,若美国保证不会入侵古巴、也不允许别人入侵,并且如果它撤回自己的舰队,不再搞隔离,马上撤出古巴导弹。n10月27日:第2封信:重申苏联向古巴提供武器“只是加强防御能力,因为古巴不拥有任何武器”。赫鲁晓夫建议“我们同意从古巴撤出导弹。但是美国需要声明:美国方面考虑到苏联的安全和焦虑,将从土耳其撤出自己的这种手段”;苏联保证尊重土耳其领土和主权的不可侵犯性。n白宫立即发表声明,指出土耳其与古巴危机毫不相干。n这两封信既反映出苏联政府内部意见的不一致,又使美国对苏联的意图更加捉摸不定,因而使局势又复杂化了。n此时在全世界所有的美国核部队和常规部队都已经奉命准备随时行动,一支庞大的入侵部队也聚集在佛罗里达。双方剑拔弩张,战争一触即发。n美国官方普遍估计,古巴的几个发射场已处于发射状态,这种情况下对导弹发射场的任何直接空袭都可能造成美国城市上空的热核爆炸。n当国安会在激烈辩论时候,肯尼迪灵机一动:“为什么不可以不理睬赫鲁晓夫的第二封信而只回答第一封信?”他向赫鲁晓夫发出了接受他10月26日“提议”的信:提出如果苏联把部署在古巴的武器系统撤出,美国同意马上取消封锁、“提供不进攻古巴的保证”。n罗伯特肯尼迪会见苏联大使,要求苏联在48小时内从古巴撤走导弹,表示“美国不能在威胁的压力下作出撤走在土耳其的导弹的决定”,给自己在外交上和西方盟国内部造成不利影响。他告诉这位大使“肯尼迪总统早就急切地想把这些导弹撤出土耳其”。n10月28日,赫鲁晓夫公开宣布下令撤离导弹。n其实肯尼迪并不真打算发动一场战争,他只不过是想迫使赫鲁晓夫从古巴撤除导弹基地,所以他所做的一切都只是恫吓。n同样赫鲁晓夫的所谓“强烈反应”,也不过是色厉内荏的把戏,他亦不敢贸然将事态一再扩大,毕竟苏联的实力比美国差得太远。一场战争危机终于过去,这场苏、美之间的意志较量,最后以苏联失败落幕。古巴导弹危机被称为懦夫博弈的经典案例。肯尼迪可能是他的政府中最懦弱的一员,但是他明白坚持这种立场才是更勇敢的。很多时候,寻求和平比发动战争更需要勇气。肯尼迪对危机的处理一直是果断的、是不妥协的。肯尼迪勇敢的鹰派作风和冷静灵活的反应阻挠了这一计谋的实现,为美国人赢得了胜利,还羞辱了俄国人。古巴导弹危机也使克里姆林宫下决心大力发展核武器,改变劣势,洗刷当年的“懦夫的耻辱”,果真到了20世纪60年代末苏联赶上了美国,使苏联在全球竞争中慢慢由守势转为攻势。4多重均衡与协调(50,50)是一个聚点均衡,平等的社会准则已经深入人心要成为真正的聚点,要求平等的社会准则是一个共同知识,即大家都认同,而且每人都知道大家认同。如协调博弈中,星巴克是常去的活动场所是共同知识4多重均衡与协调如,完全协调博弈中,哈里向莎莉发条短信如,学生上课占座;新婚夫妻家务分担。张无忌心中一喜,内劲立长,将三僧攻过来的劲力一一化解,霎时之间便成了个相持不下的局面。渡厄等虽于外界事物不闻不见,但于双方内劲的消长却辨析入微,陡然察觉到对方内劲大张,却又不反守为攻,正是消除双方危难的最佳时机,三僧心意相通,立时内劲微收。张无忌跟着收了一分劲力,三僧亦收一分。如此你收一分,我收一分,顷刻间双方的劲力收尽。四人同时哈哈一笑,一齐站起。张无忌长揖到地,渡厄、渡劫、渡难三僧合十还礼。四人齐声说道:佩服,佩服!4 多重均衡与协调4多重均衡与协调-1,-12,00,20,0行驶停车穿越等待行人行人司机司机两个NE,如果缺乏协调,可能出现非均衡结果。双方根据观察红绿灯来协调行动。5纯策略意义下无均衡1,-1-1,1-1,11,-1B正面反面正面反面A总结n在静态(同时)博弈中,参与者在不知道其他参与者选择的情况下制定自己的策略选择。n这样的博弈可以用支付矩阵表示。n纳什均衡是完全信息静态博弈中使用的解概念。n它由一组策略构成(每个参与人对应其中之一),以使每个参与人选择了对其他人选择的最优反应。n纳什均衡也可以被理解为这样一组策略,它使得每个参与人对于其他参与人的策略具有正确的信念,并且基于这种信念选择最优策略。n寻找纳什均衡的办法有 寻找占优策略 重复剔除劣策略 逐个单元格检查 最优反应分析补充:纳什均衡的数理描述n博弈(game)u参与人u局中人 的第 项战略表示为 ,构成其战略空间u局中人 的收益表示为 ,为各局中人所选择战略的函数u博弈表示为n纳什均衡(NE,NashEquilibrium)u如果对任意 ,均有 那么称战略组合 为博弈G的一个纳什均衡。u也就是说,给定其他人的战略选择,任意局中人都实现了最大收益,或者不能通过改变自己的战略提高收益。u即,在纳什均衡中,每一个局中人都不能单方面改变自己的战略来提高收益,从而每一个人都不会再改变战略,是一个相对静止的状态因此称为均衡。补充:纳什均衡的数理描述n诺贝尔经济学奖获得者萨缪尔森有一句话:你可以将一只鹦鹉训练成一个经济学家,因为它只需要学习两个词:供给和需求。n博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,就是“纳什均衡”。5纳什均衡:连续性策略的情形制造商选择产品价格慈善家选择慈善捐款的数量建筑承包商选择工程的投标价格n 在一个离散策略的博弈中,每个参与人只有少数几个 定义明确的招术(离散的行动集合)。n 这样的博弈可以用支付表来分析,至少在参与者人数 及其行为的个数不多时是如此。n 在一个连续策略的博弈中,参与人从一个大的可能性范 围,也即本质上无限的集合中做出选择。5纳什均衡:连续性策略的情形uqi 为第i个企业的产量,通过选择产量来追求最大利润(i=1,2)u价格是两企业产量的函数(逆需求函数)P=P(Q=q1+q2)=8-q1-q2u生产无固定成本,边际成本为c1=c2=2u第1个企业的利润函数为222126qqqq-=u第2个企业的利润函数为5纳什均衡:连续性策略的情形5纳什均衡:连续性策略的情形两个反应函数如图所示:q2(3,0)(0,6)(0,3)(2,2)q1(6,0)5纳什均衡:连续性策略的情形u 每个企业的最优产量为2u 均衡利润为:设想:其中一个企业增加1个单位的产量,另一家的最优反应是降低0.5个单位。一家企业增加产量会导致另一家企业减少产量,从而降低其利润与合作垄断比较:以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5u石油输出国组织成员国共同磋商制定产量限额以维持油价。u但一旦规定各国的生产限额,且按照这个限额生产时,每个成员国都会发现,如果其他国家都遵守限额,只有自己超产,则自己将获得更多的利润,并且因为只有一国超产油价不会下跌太多,从而其他各国只是普遍受少量损失,因此各成员国在本位利益的驱使下,都会希望其他国家遵守限额而自己偷偷超产,独享更多的利益。u最终的结果是各国普遍突破限额,限产计划破产,油价严重下跌,各国都只能得到不是最满意的纳什均衡的利润。这基本上就是石油输出国组织成员国面临的实际情况。5纳什均衡:连续性策略的情形5纳什均衡:连续性策略的情形u小镇上两餐馆(1和2),分别按菜单收费并分别设置菜单上的价格。u餐馆在菜单定价的时候对对方价格一无所知。u假设餐馆定价分别为P1和P2,为每个顾客提供服务的成本是8元,根据市场调查,若餐馆1的定价为P1,餐馆2的定价为P2,则它们各自顾客的数量Q1和Q2(百人每月)分别为 Q1=44-2 P1+P2 Q2=44-2 P2+P1u餐馆1和2的利润函数分别为B1=(P1-8)Q1=(P1-8)(44-2P1+P2)B2=(P2-8)Q2=(P2-8)(44-2P2+P1)P2=15+0.25P1P1=15+0.25P25纳什均衡:连续性策略的情形5纳什均衡:连续性策略的情形两个反应函数如图所示:101030202030NEP1P2餐馆1的反应函数餐馆2的反应函数共同最优最优价格P1=P2=20,每月服务的顾客人数都是2400人,每个顾客身上赚取利润12元,利润总额28800元5纳什均衡:连续性策略的情形101030202030NEP1P2餐馆1的反应函数餐馆2的反应函数共同最优6混合策略和混合策略纳什均衡1,-1-1,1-1,11,-1B正面反面正面反面A6混合策略和混合策略纳什均衡u 纯策略:肯定会被选择以100%的概率被选择的策略u 纯战略纳什均衡:各个局中人都选择纯战略的纳什均衡什么是混合策略?什么是混合策略?在猜硬币博弈中,两个参与人都在最初给定的两个纯策略之间进行选择。将两个纯策略的一种随机混合称为混合策略正面被选择的概率为p,则反面被选择的概率为(1-p)6混合策略和混合策略纳什均衡Q:某个特定的混合策略组合下,参与人的支付如何计算?B正面反面正面反面A1,-1-1,1-1,11,-1针对A盖住正面,B选择混合策略(0.75正面,0.25反面)的支付为(-1)*0.75+(1)*0.25=-0.5B选择某个特定混合策略的期望支付6混合策略和混合策略纳什均衡B正面反面正面反面A1,-1-1,1-1,11,-1如何求解均衡?如何求解均衡?p1-pq1-q两人的期望支付分别为:A:(-1)*pq+1*p(1-q)+1*(1-p)q+(-1)*(1-p)(1-q)=2p+2q-4pq-1B:1*pq+(-1)*p(1-q)+(-1)*(1-p)q+1*(1-p)(1-q)=2p+2q-4pq-16混合策略和混合策略纳什均衡猜硬币博弈中,A选择p作为她针对B所选的混合策略的最优反应;B选择q作为针对A的混合策略的最优反应6混合策略和混合策略纳什均衡 A的期望支付为:2p+2q-4pq-1=(2-4q)p+2q-1表示A对B的给定的混合策略的最优反应A的最优反应曲线6混合策略和混合策略纳什均衡 B的期望支付为:2p+2q-4pq-1=(2-4p)q+2p-1表示B对A的给定的混合策略的最优反应B的最优反应曲线0.56混合策略和混合策略纳什均衡 NE6混合策略和混合策略纳什均衡 NEu 只有当B选择q=1/2时,A的最优反应为混合策略6混合策略和混合策略纳什均衡 NE6混合策略和混合策略纳什均衡n 利用利用“对手无差异性质对手无差异性质”求解混合策略纳什均求解混合策略纳什均衡衡B正面反面正面反面A1,-1-1,1-1,11,-1p1-pq1-q练习:击球手预料到曲线球预料到快球曲线球快球投手2,-2-1,1-1,14,-4u 投手与击球手之间的目标相互冲突u 投手希望球能够穿过击球手,但击球手希望能够打到球u 击球手击到快球的积分比击到曲线球的积分多1)考察该博弈是否存在纯策略NE,并找出混合NE2)画出两个参与人的最优反应曲线p1-pq1-q6混合策略和混合策略纳什均衡假设你在地面逃亡,而你的敌人正在空中打击你,你可选择躲到坚固掩体下,也可以选择躲到一间民房。首先想躲坚固掩体(坚固的地方更安全)。但是,你可能马上意识到,你的敌人很可能猜到你躲在最坚固地方,便集中火力攻击你最安全地方成最危险的地方;于是你决定躲民房,但你的敌人他也会想到这一层而进攻民房 u20世纪40年代马来西亚,英国军队食品卡车,以免遭受游击队袭击。u游击队能够采取一次大规模进攻或者采取制造一次小事故来恐吓卡车司机以使他们不能继续服役。u英军也能采取集中力量护卫或者是分散护卫,集中力量护卫有利于反击一次大规模的进攻,分散护卫有利于反击小事故。u对于游击队而言,如果敌人分散护卫,一次大规模进攻更有效;如果敌人采取集中力量护卫,小事故更有效。u该博弈只有一个混合策略均衡u并不懂博弈论的英军指挥官是这样决策的:每天早晨,当护卫开始时,他抓一片草藏在一只手中,将两只手藏在身后让士兵猜哪只手有草,然后根据士兵是否猜对来决定护卫的形式。6混合策略和混合策略纳什均衡n采用混合策略的静态博弈:非零和博弈采用混合策略的静态博弈:非零和博弈6混合策略和混合策略纳什均衡哈哈里里星巴克本地咖啡馆莎莉莎莉星巴克本地咖啡馆1,10,00,02,26混合策略和混合策略纳什均衡哈哈里里星巴克本地咖啡馆莎莉莎莉星巴克本地咖啡馆1,10,00,02,2u 假设p表示莎莉心目中哈里选择星巴克的概率以此表达莎莉主观的不确定性:她认为哈利将采用混合策略,分别以p和1-p的概率选择两个纯策略将这个混合策略称作哈利的混合策略,尽管目前仅仅是莎莉心目中的一个想法。p1-pu 莎莉的最优行动是什么?如果我选择星巴克,期望支付为 1*p+0*(1-p)=p 如果我选择本地咖啡店,期望支付 为0*p+2*(1-p)=2-2p6混合策略和混合策略纳什均衡112p星巴克本地咖啡店2/3莎莉的支付2-2ppq莎莉的最优反应选择纯策略本地咖啡店2/3p01选择纯策略星巴克莎莉的支付莎莉选择星巴克的概率最优反应为任意的q(两纯策略任意组合)0混合策略和混合策略纳什均衡q2/3p002/3p=1,q=1p=0,q=0p=q=2/3,6混合策略和混合策略纳什均衡哈哈里里星巴克本地咖啡馆莎莉莎莉星巴克本地咖啡馆1,10,00,02,22/31/32/31/36混合策略和混合策略纳什均衡1,1-2,22,-2-4,-4司机1向前(勇士)转向(懦夫)司机2 向前(勇士)转向(懦夫)p1-pq1-q6混合策略和混合策略纳什均衡q1/2p001/2p=1,q=0p=0,q=1p=q=1/26混合策略和混合策略纳什均衡对手无差异和防止被利用对手无差异和防止被利用6混合策略和混合策略纳什均衡混合策略纳什均衡的求解混合策略纳什均衡的求解练习:1,-1-1,2-2,32,2老板监督不监督偷懒不偷懒工人6混合策略和混合策略纳什均衡1964年纽约市,一个名叫吉诺维斯的妇女被歹徒杀害,残忍的袭击持续了半个小时,她一直在尖叫,很多人也听到了她的尖叫声,超过30个人在命案现场,但没有人帮助她,也无人报警。混合策略的低效率混合策略的低效率6混合策略和混合策略纳什均衡p博弈的均衡:(报警,旁观)、(旁观,报警)、(0.3,0.7),(0.3,0.7)0.3概率选择旁观,0.7概率选择报警p两个人都报警的概率为:0.49p两个人中有一个人报警的概率为0.42。警方最终得到报告的概率为0.49+0.42=0.91若大家都旁观,支付为0;若大家都报警,则大家都获得收益10,但报警需成本3;若只一个人报警,则报警值支付为70,010,77,107,7张三旁观报警旁观报警李四u 博弈论解释6混合策略和混合策略纳什均衡p如果博弈的参与人多个,情况如何?假设N个参与人,若张三选择旁观,则无人报警时张三支付为0,有人报警时张三支付为10;若张三选择报警,则无论其他人是否报警张三支付均为7。假设张三认为其他人旁观的概率为q。则张三选择旁观的支付为0*qN-1+10(1-qN-1)=10-10qN-1张三选择报警的支付为7*qN-1+7(1-qN-1)=7p均衡情况下张三的最优混合战略应使得10-10qN-1=7q*=0.31/(N-1)6混合策略和混合策略纳什均衡每个人袖手旁观的概率1人数Nu 当N=38时,每个人将以0.97的概率选择旁观,无一人报警的概率为0.29人数N概率概率无一人报警的概率0.37纳什均衡的存在性n占优均衡重复剔除的占优均衡纯战略NE混合战略NE占优均衡重复剔除占优均衡纯战略纳什均衡混合战略纳什均衡纳什均衡的存在性n纳什均衡存在性定理(Nash,1950)n奇数定理(Wilson,1951)任何博弈都至少存在一个纳什均衡,只不过可能是混合战略纳什均衡几乎所有的博弈都有奇数个纳什均衡重复剔除严格劣战略化简博弈求纯战略纳什均衡求混合战略纳什均衡如何求解完全信息静态博弈的均衡如何求解完全信息静态博弈的均衡习题1:背景:1943年二战中的日本,在太平洋战区已经处于劣势。为扭转局势,日本的舰队司令得到命令护卫舰队穿过俾斯麦海,开往新几内亚,支援困守在那里的日军。但是他必须选择是沿一条多雨的北部航线还是沿一条阳光灿烂的南部航线转移,通过时间均为3天。n当美军获悉此情报后,命令太平洋战区空军司令组织空中打击。n日本舰队司令心里明白:在日本舰队穿过俾斯麦海的三天航行中,不可能躲开美军的空中打击,他要策划的是尽可能减少损失。n美军也不知道日军的航线选择,派侦察机侦查,但一次只能去一条航线。n日军和美军都是在不知道对方计划的情况下决定各自的行动。n如果日军的舰队刚好在美军侦查的航线上,马上就轰炸它;如果不是这样,则美军将延误一天轰炸的时间。n北部航线的天气不利于轰炸,如果美军正好在北部航线上发现日军,它可以得到两天时间;如果美军在北部航线上侦查而日军舰队却沿着南部航线航行,美军仍然可以得到2天轰炸时间。此外,如果美军开始到南部航线侦查,正好发现日军则得到3天轰炸时间,而没有发现则只能得到1天时间轰炸。用支付表描述这个博弈。找出该博弈的均衡。习题2:n甲乙两人被隔离在互不沟通的2个地方,同时他们被告知一个博弈规则,每个人从G、K、L、Q、R、W这六个字母中选择一个字母,如果他们选择一致,则可以得到以下奖赏(元),选择不一致则什么也得不到。字母GKLQRW甲的奖赏326345乙的奖赏654321n整个规则都告诉了两人,且双方都被告知对方也知道此规则。画出博弈支付表,纯策略均衡有哪些?均衡中有没有一个聚点,哪个是?为什么01xu 里约热内卢的海滩,两推车买椰奶,相隔1公里,分别 位于0公里和1公里处u 两辆推车卖椰奶的价格为p0和p1,消费者均匀地分布在 0,1区间里。u 消费者买椰奶除了价格,还得支付运输费用0.5d2(d为游 客与推车之间的距离u 这样一来,推车0的顾客是处于0-x之间的顾客,而推车1 的顾客则和x-1之间的游客。x是去两个推车买椰奶无差 异的游客所在位置。习题3:x满足以下表达式:1、写出光顾每辆车的顾客人数的表达式2、写出两辆推车的利润函数,而且找出它们各自定价的最优反应规则3、画出最优反应曲线,然后计算纳什均衡时海滩椰奶的价格u 两辆推车将设定销售椰奶的价格,以最大化利润B。利润为收益和成本共同决定(每个椰奶的成本为0.25元)习题4:n一个老妇人寻求过马路。只需要一个人就可以帮助她,更多的人也可以但结果并不比一个人好。n你和我是在附近都能够提供帮助的两个人,我们分别同时选择是否这样做。我们中的每人都会从老妇人成功过马路中获得愉悦,价值为3(不管谁帮助了她)。但是帮助她的人将会付出成本1提供帮助时花费的时间价值。要求你将此构造成一个博弈并写出支付。求解该博弈的NE。习题5:n给你两个师的兵力,有你来当司令。任务是攻克敌人占据的一座城市。通往城市的道路只有甲乙两条,而敌人的守备力量是三个师。规定:双方的兵力只能整师调动。当你发起攻击的时候,你的兵力超过敌人的守备力量,你就获胜;你的兵力比敌人少或相等你就失败。n请给出该博弈的战略式表述,并分析如何制定攻城方案?

    注意事项

    本文(经济博弈论 谢识予1完全信息静态博弈.ppt)为本站会员(hyn****60)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开