博弈论的几个经典模型课件.ppt
关于博弈论的几个经典模型现在学习的是第1页,共31页博弈论的几个经典模型博弈论的几个经典模型引 言 博博博博弈弈弈弈论论论论又又又又被被被被称称称称为为为为对对对对策策策策论论论论(Game Game Theory)Theory),及及及及研研研研究互动决策的理论。究互动决策的理论。究互动决策的理论。究互动决策的理论。互互互互动动动动决决决决策策策策:即即即即各各各各行行行行动动动动方方方方(即即即即局局局局内内内内人人人人playerplayerplayerplayer)的的的的决决决决策策策策是是是是相相相相互互互互影影影影响响响响的的的的,每每每每个个个个人人人人在在在在决决决决策策策策的的的的时时时时候候候候必必必必须须须须将将将将他他他他人人人人的的的的决决决决策策策策纳纳纳纳入入入入自自自自己己己己的的的的决决决决策策策策考考考考虑虑虑虑之之之之中中中中,当当当当然然然然也也也也需需需需要要要要把把把把别别别别人人人人对对对对于于于于自自自自己己己己的的的的考考考考虑虑虑虑也也也也要要要要纳纳纳纳入入入入考考考考虑虑虑虑之之之之中中中中在在在在如如如如此此此此迭迭迭迭代代代代考考考考虑虑虑虑情形进行决策,选择最有利于自己的战略情形进行决策,选择最有利于自己的战略情形进行决策,选择最有利于自己的战略情形进行决策,选择最有利于自己的战略(strategy)(strategy)(strategy)(strategy)。现在学习的是第2页,共31页博弈论的几个经典模型博弈论的几个经典模型 博博弈弈:gamegamegamegame,即即即即是是是是人人人人们们们们遵遵遵遵循循循循一一一一定定定定规规规规则则则则下下下下的的的的活活活活 动动动动,参参参参与与与与人人人人的的的的目目目目的的的的是是是是“赢赢赢赢”。进进进进行行行行gamegamegamegame的的的的人人人人是是是是很很很很认认认认真真真真的,不同于汉语中游戏的概念。的,不同于汉语中游戏的概念。的,不同于汉语中游戏的概念。的,不同于汉语中游戏的概念。博弈论博弈论博弈论博弈论/对策论:对策论:对策论:对策论:game theorygame theorygame theorygame theory 奥林匹克运动会:奥林匹克运动会:奥林匹克运动会:奥林匹克运动会:Olympic GamesOlympic GamesOlympic GamesOlympic Games。引 言现在学习的是第3页,共31页博弈论的几个经典模型博弈论的几个经典模型 博博博博弈弈弈弈论论论论研研研研究究究究的的的的对对对对象象象象:是是是是理理理理性性性性人人人人或或或或参参参参与与与与者者者者如如如如何何何何选选选选择择择择策略或如何作出行动的决定。策略或如何作出行动的决定。策略或如何作出行动的决定。策略或如何作出行动的决定。理性不一定道德。理性不一定道德。基本术语基本术语现在学习的是第4页,共31页博弈论的几个经典模型博弈论的几个经典模型 猪圈里有两只猪,一只比较大,一只比较小。猪圈里有两只猪,一只比较大,一只比较小。猪圈里有两只猪,一只比较大,一只比较小。猪圈里有两只猪,一只比较大,一只比较小。猪圈狭长,猪食槽在一头,猪食按钮在另一头,按猪圈狭长,猪食槽在一头,猪食按钮在另一头,按猪圈狭长,猪食槽在一头,猪食按钮在另一头,按猪圈狭长,猪食槽在一头,猪食按钮在另一头,按一下会有一下会有一下会有一下会有10101010个单位的猪食落进槽里。由于按钮和食个单位的猪食落进槽里。由于按钮和食个单位的猪食落进槽里。由于按钮和食个单位的猪食落进槽里。由于按钮和食槽距离较远,按按钮的体力耗费相当于槽距离较远,按按钮的体力耗费相当于槽距离较远,按按钮的体力耗费相当于槽距离较远,按按钮的体力耗费相当于2 2 2 2个单位的食个单位的食个单位的食个单位的食物。若大猪先到槽边,大小猪吃到食物的收益比物。若大猪先到槽边,大小猪吃到食物的收益比物。若大猪先到槽边,大小猪吃到食物的收益比物。若大猪先到槽边,大小猪吃到食物的收益比是是是是9 9 9 9:1 1 1 1;同时到槽边,收益比是;同时到槽边,收益比是;同时到槽边,收益比是;同时到槽边,收益比是7 7 7 7:3 3 3 3;小猪先到;小猪先到槽边,收益比是槽边,收益比是6 6:4 4 4 4。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈 小猪小猪大猪大猪按按不按不按(等待等待)按按(5(5,1)1)(4(4,4)4)不按不按(等待等待)(9(9,-1)-1)(0(0,0)0)现在学习的是第5页,共31页博弈论的几个经典模型博弈论的几个经典模型选择等待是小猪的占优策略。选择等待是小猪的占优策略。大大猪猪的的最最佳佳选选择择取取决决于于小小猪猪的的行行动动,如如果果小小猪猪去去按按,大大猪猪最最好好选选择择等等待待;如如果果小小猪猪不不去去按按,则则最最佳选择是大猪亲自去按。佳选择是大猪亲自去按。也也就就是是说说,在在智智猪猪博博弈弈中中,大大猪猪没没有有占占优优策策略略,而而小小猪猪有有占占优优策策略略,它它的的最最佳佳选选择择就就是是耐耐心心等等待待大大猪去按钮,才能获得最佳结果。猪去按钮,才能获得最佳结果。“小小猪猪躺躺着着大大猪猪跑跑”的的现现象象是是由由于于故故事事中中的的游游戏戏规规则则所所导导致致的的。规规则则的的核核心心指指标标是是:每每次次落落下下的的事事物物数数量量和踏板与投食口之间的距离。和踏板与投食口之间的距离。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈现在学习的是第6页,共31页博弈论的几个经典模型博弈论的几个经典模型如如果果改改变变一一下下核核心心指指标标,猪猪圈圈里里还还会会出出现现同同样样的的“小小猪躺着大猪跑猪躺着大猪跑”的景象吗?试试看。的景象吗?试试看。改变方案一:减量方案。改变方案一:减量方案。改变方案二:增量方案。改变方案二:增量方案。改变方案三:减量加移位方案。改变方案三:减量加移位方案。投投食食仅仅原原来来的的一一半半分分量量,但但同同时时将将投投食食口口移移到到踏踏板板附附近近。结结果果呢呢,小小猪猪和和大大猪猪都都在在拼拼命命地地抢抢着着踩踩踏踏板板。等等待待者者不不得得食食,而而多多劳劳者者多多得得。每每次次的的收收获获刚刚好好消费完。消费完。对对于于游游戏戏设设计计者者,这这是是一一个个最最好好的的方方案案。成成本不高,但收获最大。本不高,但收获最大。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈现在学习的是第7页,共31页博弈论的几个经典模型博弈论的几个经典模型 有有两两个个小小偷偷A A和和B B联联合合犯犯事事、私私入入民民宅宅被被警警察察抓抓住住。警警方方将将两两人人分分别别置置于于不不同同的的两两个个房房间间内内进进行行审审讯讯,对对每每一一个个犯犯罪罪嫌嫌疑疑人人,警警方方给给出出的的政政策策是是:如如果果一一个个犯犯罪罪嫌嫌疑疑人人坦坦白白了了罪罪行行,交交出出了了赃赃物物,于于是是证证据据确确凿凿,两两人人都都被被判判有有罪罪。如如果果另另一一个个犯犯罪罪嫌嫌疑疑人人也也作作了了坦坦白白,则则两两人人各各被被判判刑刑8 8年年;如如果果另另一一个个犯犯罪罪嫌嫌人人没没有有坦坦白白而而是是抵抵赖赖,则则以以妨妨碍碍公公务务罪罪(因因已已有有证证据据表表明明其其有有罪罪)再再加加刑刑2 2年年,而而坦坦白白者者有有功功被被减减刑刑8 8年年,立立即即释释放放。如如果果两两人人都都抵抵赖赖,则则警警方方因因证证据据不不足足不不能能判判两两人人的的偷偷窃窃罪罪,但但可可以以私私入入民民宅宅的罪名将两人各判入狱的罪名将两人各判入狱1 1年。年。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第8页,共31页博弈论的几个经典模型博弈论的几个经典模型 不不难难看看出出,“坦坦白白”是是任任一一犯犯罪罪嫌嫌疑疑人人的的占占优优战战略,而(坦白,坦白)是一个占优战略均衡。略,而(坦白,坦白)是一个占优战略均衡。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈 乙乙 甲甲坦白坦白抵赖抵赖坦白坦白(-8(-8,-8)-8)(0(0,-10)-10)抵赖抵赖(-10(-10,0)0)(-1(-1,-1)-1)现在学习的是第9页,共31页博弈论的几个经典模型博弈论的几个经典模型该博弈刻划了两大难题:该博弈刻划了两大难题:冲冲突突情情形形下下,参参与与人人的的目目标标是是什什么么?是是采采用用(作作为为个个人人)他他自自己己的的最最好好策策略略,还还是是采采用用(作作为为集集体体的的一一员员)他他们们共共同同的的最最好好策策略略?前前者者导导致致均均衡衡策策略略(坦坦白白,坦坦白白),支支付付为为(-8(-8,-8)-8);后后者者的的最最好好策策略略是是(抵抵赖赖,抵抵赖赖),支支付付为为(-1(-1,-1)-1)。这这里里反反映映了了个个体体理理性性行行为为与与集集体理性行为之间的矛盾、冲突。体理性行为之间的矛盾、冲突。此此博博弈弈只只进进行行一一次次还还是是重重复复进进行行?如如果果博博弈弈只只进进行行一一次次,参参与与人人似似乎乎只只有有坦坦白白才才是是最最好好的的策策略略,因因为为没没有有理理由由相相信信对对手手会会对对你你有有信信心心,他他总总认认为为你你自自己己会会坦坦白白;因因此此,双双方方都都采采取取坦坦白白策策略略。然然而,若博弈进行多次,则结论将会发生变化。而,若博弈进行多次,则结论将会发生变化。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第10页,共31页博弈论的几个经典模型博弈论的几个经典模型什么是海萨尼转换?什么是海萨尼转换?海海萨萨尼尼提提出出了了一一种种处处理理不不完完全全信信息息博博弈弈的的方方法法,即即引引入入一一个个虚虚拟拟的的局局中中人人“自自然然”。自自然然首首先先行行动动,它它决决定定每每个个局局中中人人的的特特征征。每每个个局局中中人人知知道道自自己己的的特特征征,但但不不知知道道别别的的局局中中人人特特征征。这这种种方方法法将将不不完完全全信信息息静静态态博博弈弈变变成成一一个个两两阶阶段段动动态态博博弈弈,第第一一个个阶阶段段是是自自然然N N的的行行动动选选择择,第第二二阶阶段段是是除除N N外外的的局局中中人人的的静静态态博博弈弈。这这种种转转换换被被称称为为“海海萨萨尼尼转转换换”,这这个个转转换换把把“不不完完全全信信息息”转转变变成成为为完完全全但但不不完完美美信信息息,从从而而可可以以用用分分析析完完全全信信息息博博弈的方法进行分析。弈的方法进行分析。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第11页,共31页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换的具体方法海萨尼转换的具体方法一一个个虚虚拟拟的的参参与与人人“自自然然”,自自然然首首先先决决定定参参与与人人的的类类 型型,赋赋 予予 各各 参参 与与 人人 的的 类类 型型 向向 量量 ,其其 中中 ;自自然然告告知知参参与与者者自自己己的的类类型型,却却不不告告诉诉其其他他参参与者的类型;与者的类型;参参与与者者同同时时选选择择行行动动,每每一一参参与与者者 从从可可行行集集 中中选选择择行行动方案动方案 ;各方得到收益各方得到收益 。借借助助于于第第一一步步和和第第二二步步中中虚虚构构的的参参与与者者“自自然然”的的行行动动,我我们们可可以以把把一一个个不不完完全全信信息息的的博博弈弈表表述述为为一一个不完美信息的博弈。个不完美信息的博弈。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第12页,共31页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换分析海萨尼转换分析 海海萨萨尼尼转转换换是是处处理理不不完完全全信信息息博博弈弈的的标标准准方方法法。一一般般地地,“,“自自然然”在在博博弈弈开开始始的的时时候候选选择择参参与与人人的的类类型型,参参与与人人的的某某个个类类型型包包括括表表征征类类型型的的各各个个特特征征如如策策略略空空间间、信信息息集集、得得益益函函数数等等,这这些又称为该类型参与人所拥有的个人信息。些又称为该类型参与人所拥有的个人信息。不不完完全全信信息息意意味味着着博博弈弈各各方方中中至至少少有有一一个个参参与与人人有有多个类型。多个类型。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第13页,共31页博弈论的几个经典模型博弈论的几个经典模型 通通过过海海萨萨尼尼转转换换,博博弈弈开开始始时时,所所有有参参与与人人有有关关“自自然然”的的行行动动有有一一致致的的信信念念,即即都都知知道道所所有有参参与人类型的概率分布函数,此即与人类型的概率分布函数,此即“海萨尼公理海萨尼公理”。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第14页,共31页博弈论的几个经典模型博弈论的几个经典模型 某某一一市市场场原原来来被被A A企企业业所所垄垄断断。现现在在B B企企业业考考虑虑是是否否进进入入。B B企企业业知知道道,A A企企业业是是否否允允许许它它进进入入,取取决决于于A A企企业业阻阻挠挠B B企企业业进进入入所所花花费费的的成成本本。如如果果阻阻挠挠的的成成本本低低,那那么么,正正如如下下表表后后两两列列所所表表示示的的,A A企企业业的的占占优优战战略略是是阻阻挠挠,博博弈弈有有重重复复剔剔除除的的占占优优战战略略均均衡衡AA阻阻挠挠,B B不不进进入入。如如果果阻阻挠挠的的成成本本高高,那那么么,正正如如下下表表前前两两列列所所表表示示的的,A A企企业业的的占占优优战战略略是是默默许许B B进进入入,博博弈弈有有重重复复剔剔除除的的占占优优战战略略均均衡衡A A默默许许,B B进进入入。B B企企业业所所不不知知道道的的,是是A A企企业业的的阻阻挠挠成成本本是是高高是是低低。这这里里,某某一一参参与与人人本本人人知知道道、其其他他参参与与人人则则不不知知道道的的信信息息称称为为私私人人信信息息。某某一一参参与与人人所所拥拥有有的的全全部部私私人人信信息息称称为为他他的的类类型型。在在本本例例中中,阻阻挠挠成成本本就就是是 A A的的私私人人信信息。高阻挠成本和低阻挠成本则是两种不同的类型。息。高阻挠成本和低阻挠成本则是两种不同的类型。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第15页,共31页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换后的市场进入博弈:海萨尼转换后的市场进入博弈:模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈 A A B B高成本高成本低成本低成本默许默许阻挠阻挠默许默许阻挠阻挠进入进入(40,50)(40,50)(-10,0)(-10,0)(30,100)(30,100)(-10,140)(-10,140)不进入不进入(0,300)(0,300)(0,300)(0,300)(0,400)(0,400)(0,400)(0,400)显显然然,在在这这里里,B B所所遇遇到到的的,是是不不确确定定性性条条件件下下的的选选择择问问题题。因因为为B B不不仅仅不不知知道道A A的的类类型型 (是是高高还还是低),而且不知道不同类型的分布概率。是低),而且不知道不同类型的分布概率。现在学习的是第16页,共31页博弈论的几个经典模型博弈论的几个经典模型 按按照照海海萨萨尼尼的的方方法法,所所有有参参与与人人的的真真实实类类型型都都是是给给定定的的。其其他他参参与与人人虽虽然然不不清清楚楚某某一一参参与与人人的的真真实实类类型型,但但知知道道这这些些可可能能出出现现的的类类型型的的分分布布概概率率,而而且且这这种种概概率率是是公公共共知知识识。用用本本例例来来说说,公公共共知知识识不不仅仅意意味味着着B B企企业业知知道道A A企企业业高高阻阻挠挠成成本本与与低低阻阻挠挠成成本本的的分分布布概概率率,而而且且意意味味着着A A也也清清楚楚B B知知道道这这一一概概率。率。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第17页,共31页博弈论的几个经典模型博弈论的几个经典模型模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈N N低成本低成本高成本高成本A AB BB B(50,40)(50,40)(300,0)(300,0)(0,-10)(0,-10)(300,0)(300,0)(100,30)(100,30)(400,0)(400,0)(140,-10)(140,-10)(400,0)(400,0)A AB BB B默许默许默许默许阻挠阻挠阻挠阻挠进入进入不进入不进入进入进入进入进入进入进入不进入不进入不进入不进入不进入不进入*贝叶斯纳什均衡贝叶斯纳什均衡 现在学习的是第18页,共31页博弈论的几个经典模型博弈论的几个经典模型斗斗鸡鸡博博弈弈(Chicken(Chicken Game)Game)其其实实是是一一种种误误译译。ChickenChicken在在美美国国口口语语中中是是“懦懦夫夫”之之意意,Chicken Chicken GameGame本本应应译译成成懦夫博弈。懦夫博弈。两两只只公公鸡鸡狭狭路路相相逢逢。结结果果有有四四种种可可能能:两两只只公公鸡鸡对对峙峙,谁谁也也不不让让谁谁。或或者者两两者者相相斗斗。结结局局都都一一样样两两败败俱俱伤伤,这这是是谁谁也也不不愿愿意意的的。另另两两种种可可能能是是一一退退一一进进。但但退退者者有有损损失失、丢丢面面子子。双双方方都都不不愿愿退退,也也知知道道对对方方不不愿愿退退。在在这这样样的的博博弈弈中中,要要想想取取胜胜,就就要要在在气气势势上上压压倒倒对对方方,至至少少要要显显示示出出破破釜釜沉沉舟舟、背背水水一一战战的的决决心心来来,以以迫迫使使对对方方退退却却。但到最后的关键时刻,必有一方要退下来。但到最后的关键时刻,必有一方要退下来。模型四、斗鸡博弈模型四、斗鸡博弈(chicken game)现在学习的是第19页,共31页博弈论的几个经典模型博弈论的几个经典模型甲甲/乙乙 前进前进 后退后退前进前进(-2(-2,-2)-2)(1(1,-1)-1)后退后退(-1(-1,1)1)(-1(-1,-1)-1)上上表表中中的的数数字字的的意意思思是是:两两者者如如果果均均选选择择“前前进进”,结结果果是是两两败败俱俱伤伤,两两者者均均获获得得-2-2的的支支付付;如如果果一一方方“前前进进”,另另外外一一方方“后后退退”,前前进进者者获获得得1 1的的支支付付,赢赢得得了了面面子子,而而后后退退者者获获得得-1-1的的支支付付,输输掉掉了了面面子子,但但没没有有两两者者均均“前前进进”受受到到的的损损失失大大;两两者者均均“后后退退”,两两者者均均输输掉掉了了面面子子,获获得得-1-1的的支支付付。当当然表中的数字只是相对的值。然表中的数字只是相对的值。模型四、斗鸡博弈模型四、斗鸡博弈(chicken game)现在学习的是第20页,共31页博弈论的几个经典模型博弈论的几个经典模型斗斗鸡鸡博博弈弈强强调调的的是是,如如何何在在博博弈弈中中采采用用妥妥协协的的方方式式取取得得利利益益。如如果果双双方方都都换换位位思思考考,它它们们可可以以就就补补偿偿进进行行谈谈判,最后造成以补偿换退让的协议,问题就解决了。判,最后造成以补偿换退让的协议,问题就解决了。模型四、斗鸡博弈模型四、斗鸡博弈(chicken game)现在学习的是第21页,共31页博弈论的几个经典模型博弈论的几个经典模型光天化日之下的违法行为为什么总能成功?光天化日之下的违法行为为什么总能成功?人人类类有有许许多多关关于于猴猴子子的的故故事事,比比如如朝朝三三暮暮四四,杀杀鸡鸡给给猴猴看看。其其实实猴猴子子是是没没有有思思维维的的,它它们们有有一一定定的的群群体体意意识识,但但没没有有社社会会意意识识,人人们们关关于于它它们们的的故故事事其其实实是是说说人人自自己己的的。我我们们这这里里也也讲讲一一个个猴猴子子的的故故事事。在在现现实实社社会会中中,窃窃贼贼在在公公共共场场所所比比如如公公共共汽汽车车上上偷偷东东西西时时,车车上上的的乘乘客客看看到到了了,但但不不敢敢吭吭声声。没没有有被被偷偷的的人人想想,反反正正被被偷偷的的待待宰宰猴猴群群的的结结局局人人不不是是我我,我我反反抗抗了了,我我得得不不到到任任何何好好处处,反反而而遭遭到到伤伤害害;而而不不反反抗抗虽虽不不得得益益,但但也也不不受受损损,我我何何必必要要反反抗抗呢呢?这这就就是是光光天天化化日日之之下下的的偷偷窃窃行行为为为为什什么么总总能能成成功功的的原因。原因。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈现在学习的是第22页,共31页博弈论的几个经典模型博弈论的几个经典模型 窃窃贼贼在在偷偷东东西西时时发发出出这这样样的的信信号号:如如果果谁谁反反抗抗,将将殴殴打打谁谁。乘乘客客想想,窃窃贼贼的的威威胁胁是是可可信信的的:因因为为如如果果个个别别乘乘客客反反抗抗,而而窃窃贼贼不不殴殴打打该该乘乘客客的的话话,就就会会有有更更多多的的乘乘客客抓抓窃窃贼贼,窃窃贼贼将将有有可可能能被被抓抓,因因此此窃窃贼贼必必然然欧欧打打反反抗抗的的乘乘客客。乘乘客客的的策策略略及及可可能能的的支支付付为为:反反抗抗,有有可可能能被被殴殴打打甚甚至至受受伤伤;不反抗,无所得也无所失。不反抗,无所得也无所失。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈现在学习的是第23页,共31页博弈论的几个经典模型博弈论的几个经典模型乘客乘客反抗反抗不反抗不反抗偷东西偷东西窃贼窃贼窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤窃贼:可能被抓,窃贼:可能被抓,可能逃脱可能逃脱乘客:无所得,乘客:无所得,无所失无所失窃贼:被抓窃贼:被抓窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤窃贼:得到赃物窃贼:得到赃物乘客:无所得,乘客:无所得,无所失无所失窃贼:得到赃物窃贼:得到赃物现在学习的是第24页,共31页博弈论的几个经典模型博弈论的几个经典模型 对对于于乘乘客客来来说说,窃窃贼贼的的威威胁胁是是可可信信的的,因因而而乘乘客客的的最最优优策策略略是是“不不反反抗抗”;而而对对于于窃窃贼贼来来说说,乘客乘客“不反抗不反抗”下的下的“不殴打不殴打”策略为最忧。策略为最忧。这这一一博博弈弈的的结结果果是是,窃窃贼贼偷偷东东西西时时“乘乘客客不不反反抗抗,窃贼不敢打窃贼不敢打”,这是一,这是一“子精炼纳什均衡子精炼纳什均衡”。这这样样一一种种群群体体不不反反抗抗的的结结果果将将使使社社会会风风气气恶恶化化,偷偷窃窃之之风风盛盛行行。对对个个体体来来说说,虽虽然然这这一一次次被被偷偷的的不不是是你你,但但下下次次你你被被偷偷的的几几率率增增加加了了。这这使使得得我我们们都都如如同同待待宰宰的的猴猴子子,我我们们不不知知道道什什么么时时候候轮轮到到我我们们自自己。这样,我们每个人的处境比以前更差。己。这样,我们每个人的处境比以前更差。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈现在学习的是第25页,共31页博弈论的几个经典模型博弈论的几个经典模型如何从这种困境中摆脱出来?如何从这种困境中摆脱出来?我我们们看看到到,使使乘乘客客采采取取“反反抗抗”策策略略,而而非非“不不反反抗抗”策策略略在在于于加加大大采采取取“反反抗抗”策策略略的的获获益益,而而减减少少不不反反抗抗的的获获益益。当当“反反抗抗”策策略略下下的的获获益益大大于于“不不反反抗抗”策策略略下下的的获获益益时时,乘乘客客就就会会采采取取“反抗反抗”的策略。的策略。加加大大道道德德宣宣传传,培培养养人人的的道道德德感感可可以以解解决决这这个个囚囚徒困境。徒困境。模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈现在学习的是第26页,共31页博弈论的几个经典模型博弈论的几个经典模型乘客乘客反抗反抗不反抗不反抗偷东西偷东西窃贼窃贼窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤,但没有但没有 道德满足感道德满足感窃贼:可能被抓,窃贼:可能被抓,可能逃脱可能逃脱乘客:没有受伤乘客:没有受伤 并有道德并有道德 满足感满足感窃贼:被抓窃贼:被抓窃贼窃贼殴打殴打不殴打不殴打乘客:受伤乘客:受伤,并有并有 道德耻辱感道德耻辱感窃贼:得到赃物窃贼:得到赃物乘客:道德耻乘客:道德耻 辱感辱感窃贼:得到赃物窃贼:得到赃物上述博弈过程为:上述博弈过程为:现在学习的是第27页,共31页博弈论的几个经典模型博弈论的几个经典模型 这这样样,当当小小偷偷偷偷东东西西时时,尽尽管管乘乘客客认认为为窃窃贼贼的的威威胁胁是是可可信信的的,但但是是如如果果乘乘客客是是道道德德感感强强的的人人,那那么么博博弈弈结结果果是是“乘乘客客反反抗抗,小小偷偷殴殴打打”,从从而而小小偷有可能被抓住,这也是一偷有可能被抓住,这也是一“子精炼纳什均衡子精炼纳什均衡”。博博弈弈论论对对不不合合作作的的博博弈弈结结果果的的预预测测是是令令人人悲悲哀哀的的。但但是是,从从这这个个例例子子我我们们看看到到,道道德德就就是是由由群群体体实实施施的的对对所所谓谓“非非道道德德”的的行行为为进进行行非非强强制制性性的的惩惩罚罚机机制制,而而法法律律及及实实施施法法律律的的国国家家的的形形成成与与改改进进就就是是建建立立一一个个对所谓对所谓“违法行为违法行为”实施的中心惩罚机制。实施的中心惩罚机制。*精炼贝叶斯纳什均衡;混同均衡;分离均衡精炼贝叶斯纳什均衡;混同均衡;分离均衡模型五、信号博弈模型五、信号博弈/不完全信息动态博弈不完全信息动态博弈现在学习的是第28页,共31页博弈论的几个经典模型博弈论的几个经典模型有有两两个个打打猎猎人人,他他们们可可以以合合作作去去猎猎鹿鹿也也可可以以单单独独去去猎猎兔兔。如如果果合合作作猎猎鹿鹿(猎猎鹿鹿需需要要两两个个人人合合作作可可以以成成功功),一一头头鹿鹿可可供供两两人人吃吃十十天天;如如果果两两个个人人都都去去猎猎兔兔(猎猎兔兔只需一个人),一只兔子可供一人吃四天只需一个人),一只兔子可供一人吃四天模型六、猎鹿博弈模型六、猎鹿博弈猎鹿猎鹿猎兔猎兔 猎鹿猎鹿1010,10100 0,4 4猎兔猎兔4 4,0 04 4,4 4 现在学习的是第29页,共31页博弈论的几个经典模型博弈论的几个经典模型 明明显显的的事事实实是是:两两人人一一起起去去猎猎鹿鹿的的好好处处比比各各自自打打兔兔的的好好处处要要大大得得多多。用用一一个个经经济济学学术术语语来来说说,两两人人起起去去人人头头猎猎鹿鹿比比各各自自去去打打兔兔更更符符合合帕帕累累托托最最优优原原则。则。模型六、猎鹿博弈模型六、猎鹿博弈现在学习的是第30页,共31页博弈论的几个经典模型博弈论的几个经典模型感谢大家观看现在学习的是第31页,共31页