博弈论第二章.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《博弈论第二章.ppt》由会员分享,可在线阅读,更多相关《博弈论第二章.ppt(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 完全信息静态博弈(一)完全信息静态博弈(一)单纯战略纳什均衡单纯战略纳什均衡博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述占优战略均衡占优战略均衡重复剔除的占优战略均衡重复剔除的占优战略均衡纳什均衡与相对优势策略划线法纳什均衡与相对优势策略划线法纳什均衡应用举例纳什均衡应用举例第一节第一节 博弈论的基本概念博弈论的基本概念 与战略式表述与战略式表述博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论博弈论(game theorygame theory)是研究决策主体的行为是研究决策主体的行为 发生直接相互作用时候的决策以及这种决策的发生直接相互作用时候的决策以
2、及这种决策的均衡问题。均衡问题。博弈的战略式表述:博弈的战略式表述:G=G=N,(SN,(Si i)i i N N,(U,(Ui i)i i N N 有三个基本要素有三个基本要素:(1 1)参与人(参与人(playersplayers)i i N N=1,2,=1,2,n,n;(2 2)战略(战略(strategiesstrategies),s,si i S Si i(战略空间战略空间);(3 3)支付()支付(payoffspayoffs),u,ui i=u ui i(s(si i,s,s-i-i)。囚徒困境是塔克(Tucker)1950年提出的。该博弈是博弈论最经典、著名的博弈。该博弈是博
3、弈论最经典、著名的博弈。该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。案例案例1 1:囚徒困境:囚徒困境囚徒困境囚徒困境 两两个个小小偷偷甲甲和和乙乙联联手手作作案案,被被警警方方逮逮住住,但但证证据据不不足足。警警方方将将两两人人分分别别审审讯讯,政政策策是是坦坦白白从从宽宽,抗抗拒拒从从严严。若若一一人人坦坦白白但但另另一一人人不不坦坦白白,则则坦坦白白者者被被判判1 1年年,未未坦坦白白者者判判入入狱狱7 7年年;若若二二人人都都坦坦白白则则两两人人各各判判刑刑5 5年年;若若两两人人都都不不坦坦白则未获证据,但因
4、私入民宅各判白则未获证据,但因私入民宅各判2 2年。年。囚徒困境囚徒困境(prisoners dilemma)-5,-5 -1,-7 -7,-1 -2,-2囚徒乙囚徒乙坦白坦白不坦白不坦白囚囚徒徒甲甲坦白坦白不坦白不坦白均衡策略与均衡支付均衡策略与均衡支付均衡策略(坦白,坦白)均衡支付(-5,-5)第二节第二节 占优策略均衡占优策略均衡第二节第二节 占优战略均衡占优战略均衡第二节第二节 占优战略均衡占优战略均衡第二节第二节 占优战略均衡占优战略均衡第二节第二节 占优战略均衡占优战略均衡 完全信息静态博弈即各局中人同时决策,且所有局中人对各方得益都了解的博弈。囚徒困境、齐威王田忌赛马、猜硬币、石
5、囚徒困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本完全信息静态博弈属于非合作博弈最基本的类型。的类型。占优策略均衡占优策略均衡完全信息静态博弈的几点特性完全信息静态博弈的几点特性同时出招,出招一次;知道博弈结构与游戏规则(共同知识);不管是否沟通过,无法做出有约束力的 承诺(非合作)占优策略占优策略占优策略:不管对手策略为何,该参与人可占优策略:不管对手策略为何,该参与人可找到一最佳策略。或不管其它局中人选择什找到一最佳策略。或不管其它局中人选择什么策略,一局中人的某个策略给他带来的支么策略,一局
6、中人的某个策略给他带来的支付始终高于其它的策略。付始终高于其它的策略。囚徒困境中的囚徒困境中的“坦白坦白”。占优策略均衡占优策略均衡在博弈在博弈G=G=N,(SN,(Si i)i i N N,(U,(Ui i)i i N N 中,如果对所有的中,如果对所有的参与人参与人i,si,si i*是它的占优策略,那么所有参与人选是它的占优策略,那么所有参与人选择的策略组合(择的策略组合(s s1 1*,*,s sn n*)成为该对策的占优策成为该对策的占优策略均衡。略均衡。或一个博弈的某个战略组合中的所有战略都是各或一个博弈的某个战略组合中的所有战略都是各个局中人各自的占优策略,必然是该博弈比较稳个局
7、中人各自的占优策略,必然是该博弈比较稳定的结果。定的结果。博博弈弈均均衡衡是是指指博博弈弈中中的的所所有有参参与与者者都都不不想想改改变变自自己己的的策策略略的的这这样样一一种种相相对对静静止止的的状状态态。如如果果所所有有参参与与者者选选择择的的都都是是自自己己的的占占优优策策略略,该该博博弈弈均均衡衡又被称为又被称为占优策略均衡。占优策略均衡。即即:由由博博弈弈中中的的所所有有参参与与者者的的占占优优策策略略组组合合所所构构成成的的均均衡衡就就是是占占优优策策略略均均衡。衡。占优策略均衡反映了所有局中人的绝对偏占优策略均衡反映了所有局中人的绝对偏 好,因此非常稳定,根据占优策略均衡可好,因
8、此非常稳定,根据占优策略均衡可以对博弈结果作出最肯定的预测。以对博弈结果作出最肯定的预测。占优策略均衡不是普遍存在的占优策略均衡不是普遍存在的.一个博弈中所有参与者存在严格优策略,一个博弈中所有参与者存在严格优策略,那么严格优策略组合一定是该博弈的唯一那么严格优策略组合一定是该博弈的唯一均衡解。均衡解。(P34)抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A“囚徒困境囚徒困境”的扩展的扩展两个寡头企业选择产量两个寡头企业选择产量(随后介绍随后介绍)公共产品的供给公共产品的供给(P47)(P47)军备竞赛军备竞赛经济改革经济改革 举例:价格大战和双赢对局举例:价格大战和
9、双赢对局 可口可乐公司和百事可乐公司几乎垄断了美国可口可乐公司和百事可乐公司几乎垄断了美国的碳酸饮料市场,他们之间的争斗如下:的碳酸饮料市场,他们之间的争斗如下:假定两家企业都采取比较低的价格,可以各得利假定两家企业都采取比较低的价格,可以各得利润润30亿美元;都采取比较高的价格,各得亿美元;都采取比较高的价格,各得50亿美元亿美元利润;而如果一家采取较高的价格而另一家采取较低利润;而如果一家采取较高的价格而另一家采取较低的价格,那么价格高的企业的利润为的价格,那么价格高的企业的利润为10亿美元,价亿美元,价格低的企业因为多销,利润将上升到格低的企业因为多销,利润将上升到60亿美元。亿美元。3
10、0 30 60 10 10 60 50 50 百事可乐公司百事可乐公司 高价高价可可口口可可乐乐公公司司 低低价价 高高价价低价低价案例案例2:智猪博弈:智猪博弈 猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。按等待按5,14,4等待9,-10,0支付小猪大猪智猪博弈的扩展智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股
11、份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动改革中不同利益分配对改革的推动第三节第三节 重复剔除的占重复剔除的占优策略均衡优策略均衡绝对劣势策略:绝对劣势策略:s si i是一绝对劣势策略,当且仅当存是一绝对劣势策略,当且仅当存在另一策略在另一策略s si i S Si i,使得使得u ui i(s(si i,s,s-i-i)u ui i(s(si i,s,s-i-i)对所有对所有
12、s s-i-i S S-i-i均成立。(均成立。(s si i 未必是优势策略)未必是优势策略)或不管其它局中人的策略如何变化,给一个局中人或不管其它局中人的策略如何变化,给一个局中人带来的收益总是比另一种策略给他带来的收益小的带来的收益总是比另一种策略给他带来的收益小的策略。策略。重复剔除的占优策略均衡:重复剔除的占优策略均衡:逐次删去绝对劣势策略逐次删去绝对劣势策略得到唯一的占优策略。得到唯一的占优策略。一般来说,在分析一个局中人的决策行为时,可以一般来说,在分析一个局中人的决策行为时,可以首先把一个严格劣势策略从该局中人的策略集中去首先把一个严格劣势策略从该局中人的策略集中去掉,然后在剩
13、下的策略范围内,试图再找出这个局掉,然后在剩下的策略范围内,试图再找出这个局中人或者别的局中人的一个严格劣势策略,并将它中人或者别的局中人的一个严格劣势策略,并将它去掉。不断重复这一过程,直到对每一个局中人而去掉。不断重复这一过程,直到对每一个局中人而言,再也找不出严格劣势策略为止。这种分析方法言,再也找不出严格劣势策略为止。这种分析方法在博弈论中称为在博弈论中称为严格劣势策略逐次消去法,也叫重严格劣势策略逐次消去法,也叫重复剔除占优策略法。复剔除占优策略法。例:重复剔除的占优策略均衡2,30,23,41,12,74,5 参与人参与人2 L M R参参与与人人1UD4,35,16,22,18,
14、43,63,09,62,8 参与人参与人2L M R参参与与人人1UDM1,01,33,00,20,13,00,22,45,3 参与人参与人2L M R参参与与人人1UDM注意:注意:如果每次剔除的是严格劣战略,均衡结如果每次剔除的是严格劣战略,均衡结果与剔除的顺序无关;如果剔除的是弱劣果与剔除的顺序无关;如果剔除的是弱劣势战略,均衡结果可能与剔除顺序有关。势战略,均衡结果可能与剔除顺序有关。l存在严格优势策略必然存在严格劣势策略,存在严格优势策略必然存在严格劣势策略,反之不然。反之不然。甲和乙分别会选择什么策略?甲和乙分别会选择什么策略?乙 L M R U 甲 D 1,14,21,32,31
15、,22,1 当甲选“U”时,乙会选“R”;而当乙选“R”时,甲应该选“D”而不是“U”;但当甲选“D”时,乙会选“L”;给定乙选“L”,甲选“D”是最好的选择,他不会改变选择“D”;给定甲不改变选“D”,乙也不会改变其选择“L”。所以,可以预期(D,L)是甲乙最终完成的稳定的选择。前面的博弈分析中,只要每一个游戏者都具前面的博弈分析中,只要每一个游戏者都具有占优策略,那么该博弈就一定存在占优策有占优策略,那么该博弈就一定存在占优策略均衡。但是需要指出的是在有的博弈中,略均衡。但是需要指出的是在有的博弈中,并不存在占优策略,仍可以达到博弈均衡。并不存在占优策略,仍可以达到博弈均衡。例子:情侣博弈
16、(性别之战)例子:情侣博弈(性别之战)一对情侣对如何度周末有不同的想法:女一对情侣对如何度周末有不同的想法:女方想看电影,而男方想看球赛。两人都希方想看电影,而男方想看球赛。两人都希望和对方一同度过周末而不愿分头行动。望和对方一同度过周末而不愿分头行动。因此女方希望男方和自己一同看电影,而因此女方希望男方和自己一同看电影,而男方希望女方和自己一起看球赛。男方希望女方和自己一起看球赛。1 2 0 0 0 0 2 1 男男电影电影 球赛球赛 电电影影 球球赛赛 女女在这样的博弈中,双方都没有上策。在这样的博弈中,双方都没有上策。该博弈中有两个均衡状态(电影,电影)、该博弈中有两个均衡状态(电影,电
17、影)、(球赛,球赛)。(球赛,球赛)。在在一一个个均均衡衡里里,如如果果其其他他参参与与者者不不改改变变策策略略,任任何何一一个个参参与与者者都都不不会会改改变变自自己己的的策策略略,则则为纳什均衡。为纳什均衡。实际上,他们的最优策略均依赖对方的选择,实际上,他们的最优策略均依赖对方的选择,一旦对方选择了某一项活动,另一个人选择一旦对方选择了某一项活动,另一个人选择同样的活动就是最好的策略。同样的活动就是最好的策略。第四节第四节 纳什均衡 约翰约翰福布斯福布斯纳什简介纳什简介约翰约翰福布斯福布斯纳什纳什(John Forbes Nash Jr.,1928年6月13日),又译约翰纳许,美国数学家
18、,前麻省理工学院助教,主要研究博弈论和微分几何学。1994年,他和其他两位博弈论学家约翰C海萨尼(John Harsanyi)和莱因哈德泽尔腾共同获得了诺贝尔经济学奖。1950年,纳什获得美国普林斯顿高等研究院的博士学位,他在那篇仅仅27页的博士论文中提出了一个重要概念,也就是后来被称为“纳什均衡”的博弈理论。孤独的天才孤独的天才约翰纳什1928年出生在美国西弗吉尼亚州工业城布鲁菲尔德的一个富裕家庭。他的父亲是受过良好教育的电子工程师,母亲则是拉丁语教师。纳什从小就很孤僻,他宁愿钻在书堆里,也不愿出去和同龄的孩子玩耍。但是那个时候,纳什的数学成绩并不好,小学老师常常向他的家长抱怨纳什的数学有问
19、题,因为他常常使用一些奇特的解题方法。而到了中学,这种情况就更加频繁了,老师在黑板上演算了整个黑板的习题,纳什只用简单的几步就能解出答案。中学毕业后,约翰纳什进入了匹兹堡的卡耐基技术学院化学工程系。1948年,大学三年级的纳什同时被哈佛大学、普林斯顿大学、芝加哥大学和密执安大学录取,而普林斯顿大学则表现得更加热情,当普林斯顿大学的数学系主任莱夫谢茨感到纳什的犹豫时,就立即写信敦促他选择普林斯顿,这促使纳什接受了一份1150美元的奖学金。当时的普林斯顿已经成了全世界的数学中心,爱因斯坦等世界级大师均云集于此。在普林斯顿自由的学术空气里,纳什如鱼得水,他21岁博士毕业,不到30岁已经闻名遐迩。19
20、58年,纳什因其在数学领域的优异工作被美国财富杂志评为新一代天才数学家中最杰出的人物。约翰纳什最重要的理论就是现在广泛出现在经济学教科书上的“纳什均衡”。而“纳什均衡”最著名的一个例子就是“囚徒困境”。“纳什均衡”是他21岁博士毕业的论文,也奠定了数十年后他获得诺贝尔经济学奖的基础。那时的纳什“就像天神一样英俊”,1.85米的个子,体重接近77公斤,手指修长、优雅,双手柔软、漂亮,还有一张英国贵族的容貌。他的才华和个人魅力吸引了一个漂亮的女生艾里西亚,她是当时麻省理工学院物理系仅有的两名女生之一。1957年,他们结婚了。之后漫长的岁月证明,这也许正是纳什一生中比获得诺贝尔奖更重要的事。就在事业
21、爱情双双得意的时候,纳什也因为喜欢独来独往,喜欢解决折磨人的数学问题而被人们称为“孤独的天才”。他不是一个善于为人处世并受大多数人欢迎的人,他有着天才们常有的骄傲、自我中心的毛病。他的同辈人基本认为他不可理喻,他们说他“孤僻,傲慢,无情,幽灵一般,古怪,沉醉于自己的隐秘世界,根本不能理解别人操心的世俗事务。”普林斯顿的幽灵普林斯顿的幽灵1958年的秋天,正当艾里西亚半惊半喜地发现自己怀孕时,纳什却为自己的未来满怀心事,越来越不安。系主任马丁已答应在那年冬天给他永久教职,但是纳什却出现了各种稀奇古怪的行为:他担心被征兵入伍而毁了自己的数学创造力,他梦想成立一个世界政府,他认为纽约时报上每一个字母
22、都隐含着神秘的意义,而只有他才能读懂其中的寓意。他认为世界上的一切都可以用一个数学公式表达。他给联合国写信,跑到华盛顿给每个国家的大使馆投递信件,要求各国使馆支持他成立世界政府的想法。他迷上了法语,甚至要用法语写数学论文,他认为语言与数学有神秘的关联终于,在孩子出生以前,纳什被送进了精神病医院。几年后,因为艾里西亚无法忍受在纳什的阴影下生活,他们离婚了,但是她并没有放弃纳什。离婚以后,艾里西亚再也没有结婚,她依靠自己作为电脑程序员的微薄收入和亲友的接济,继续照料前夫和他们惟一的儿子。她坚持纳什应该留在普林斯顿,因为如果一个人行为古怪,在别的地方会被当作疯子,而在普林斯顿这个广纳天才的地方,人们
23、会充满爱心地想,他可能是一个天才。于是,在上世纪70和80年代,普林斯顿大学的学生和学者们总能在校园里看见一个非常奇特、消瘦而沉默的男人在徘徊,他穿着紫色的拖鞋,偶尔在黑板上写下数字命理学的论题。他们称他为“幽灵”,他们知道这个“幽灵”是一个数学天才,只是突然发疯了。如果有人敢抱怨纳什在附近徘徊使人不自在的话,他会立即受到警告:“你这辈子都不可能成为像他那样杰出的数学家!”正当纳什本人处于梦境一般的精神状态时,他的名字开始出现在70年代和80年代的经济学课本、进化生物学论文、政治学专著和数学期刊的各领域中。他的名字已经成为经济学或数学的一个名词,如“纳什均衡”、“纳什谈判解”、“纳什程序”、“
24、德乔治纳什结果”、“纳什嵌入”和“纳什破裂”等。纳什的博弈理论越来越有影响力,但他本人却默默无闻。大部分曾经运用过他的理论的年轻数学家和经济学家都根据他的论文发表日期,想当然地以为他已经去世。即使一些人知道纳什还活着,但由于他特殊的病症和状态,他们也把纳什当成了一个行将就木的废人。传奇仍在继续传奇仍在继续有人说,站在金字塔尖上的科学家都有一个异常孤独的大脑,纳什发疯是因为他太孤独了。但是,纳什在发疯之后却并不孤独,他的妻子、朋友和同事们没有抛弃他,而是不遗余力地帮助他,挽救他,试图把他拉出疾病的深渊。尽管纳什决心辞去麻省理工学院教授的职位,但他的同事和上司们还是设法为他保全了保险。他的同事听说
25、他被关进了精神病医院后,给当时美国著名的精神病学专家打电话说:“为了国家利益,必须竭尽所能将纳什教授复原为那个富有创造精神的人。”越来越多的人聚集到纳什的身边,他们设立了一个资助纳什治疗的基金,并在美国数学会发起一个募捐活动。基金的设立人写到:“如果在帮助纳什返回数学领域方面有什么事情可以做,哪怕是在一个很小的范围,不仅对他,而且对数学都很有好处。”对于普林斯顿大学为他做的一切,纳什在清醒后表示,“我在这里得到庇护,因此没有变得无家可归。”守得云开见月明,妻子和朋友的关爱终于得到了回报。80年代末的一个清晨,当普里斯顿高等研究院的戴森教授像平常一样向纳什道早安时,纳什回答说:“我看见你的女儿今
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 第二
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内