博弈论的几个经典模型课件.ppt
《博弈论的几个经典模型课件.ppt》由会员分享,可在线阅读,更多相关《博弈论的几个经典模型课件.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于博弈论的几个经典模型现在学习的是第1页,共31页博弈论的几个经典模型博弈论的几个经典模型引 言 博博博博弈弈弈弈论论论论又又又又被被被被称称称称为为为为对对对对策策策策论论论论(Game Game Theory)Theory),及及及及研研研研究互动决策的理论。究互动决策的理论。究互动决策的理论。究互动决策的理论。互互互互动动动动决决决决策策策策:即即即即各各各各行行行行动动动动方方方方(即即即即局局局局内内内内人人人人playerplayerplayerplayer)的的的的决决决决策策策策是是是是相相相相互互互互影影影影响响响响的的的的,每每每每个个个个人人人人在在在在决决决决策策策策
2、的的的的时时时时候候候候必必必必须须须须将将将将他他他他人人人人的的的的决决决决策策策策纳纳纳纳入入入入自自自自己己己己的的的的决决决决策策策策考考考考虑虑虑虑之之之之中中中中,当当当当然然然然也也也也需需需需要要要要把把把把别别别别人人人人对对对对于于于于自自自自己己己己的的的的考考考考虑虑虑虑也也也也要要要要纳纳纳纳入入入入考考考考虑虑虑虑之之之之中中中中在在在在如如如如此此此此迭迭迭迭代代代代考考考考虑虑虑虑情形进行决策,选择最有利于自己的战略情形进行决策,选择最有利于自己的战略情形进行决策,选择最有利于自己的战略情形进行决策,选择最有利于自己的战略(strategy)(strategy
3、)(strategy)(strategy)。现在学习的是第2页,共31页博弈论的几个经典模型博弈论的几个经典模型 博博弈弈:gamegamegamegame,即即即即是是是是人人人人们们们们遵遵遵遵循循循循一一一一定定定定规规规规则则则则下下下下的的的的活活活活 动动动动,参参参参与与与与人人人人的的的的目目目目的的的的是是是是“赢赢赢赢”。进进进进行行行行gamegamegamegame的的的的人人人人是是是是很很很很认认认认真真真真的,不同于汉语中游戏的概念。的,不同于汉语中游戏的概念。的,不同于汉语中游戏的概念。的,不同于汉语中游戏的概念。博弈论博弈论博弈论博弈论/对策论:对策论:对策论
4、:对策论:game theorygame theorygame theorygame theory 奥林匹克运动会:奥林匹克运动会:奥林匹克运动会:奥林匹克运动会:Olympic GamesOlympic GamesOlympic GamesOlympic Games。引 言现在学习的是第3页,共31页博弈论的几个经典模型博弈论的几个经典模型 博博博博弈弈弈弈论论论论研研研研究究究究的的的的对对对对象象象象:是是是是理理理理性性性性人人人人或或或或参参参参与与与与者者者者如如如如何何何何选选选选择择择择策略或如何作出行动的决定。策略或如何作出行动的决定。策略或如何作出行动的决定。策略或如何作出
5、行动的决定。理性不一定道德。理性不一定道德。基本术语基本术语现在学习的是第4页,共31页博弈论的几个经典模型博弈论的几个经典模型 猪圈里有两只猪,一只比较大,一只比较小。猪圈里有两只猪,一只比较大,一只比较小。猪圈里有两只猪,一只比较大,一只比较小。猪圈里有两只猪,一只比较大,一只比较小。猪圈狭长,猪食槽在一头,猪食按钮在另一头,按猪圈狭长,猪食槽在一头,猪食按钮在另一头,按猪圈狭长,猪食槽在一头,猪食按钮在另一头,按猪圈狭长,猪食槽在一头,猪食按钮在另一头,按一下会有一下会有一下会有一下会有10101010个单位的猪食落进槽里。由于按钮和食个单位的猪食落进槽里。由于按钮和食个单位的猪食落进槽
6、里。由于按钮和食个单位的猪食落进槽里。由于按钮和食槽距离较远,按按钮的体力耗费相当于槽距离较远,按按钮的体力耗费相当于槽距离较远,按按钮的体力耗费相当于槽距离较远,按按钮的体力耗费相当于2 2 2 2个单位的食个单位的食个单位的食个单位的食物。若大猪先到槽边,大小猪吃到食物的收益比物。若大猪先到槽边,大小猪吃到食物的收益比物。若大猪先到槽边,大小猪吃到食物的收益比物。若大猪先到槽边,大小猪吃到食物的收益比是是是是9 9 9 9:1 1 1 1;同时到槽边,收益比是;同时到槽边,收益比是;同时到槽边,收益比是;同时到槽边,收益比是7 7 7 7:3 3 3 3;小猪先到;小猪先到槽边,收益比是槽
7、边,收益比是6 6:4 4 4 4。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈 小猪小猪大猪大猪按按不按不按(等待等待)按按(5(5,1)1)(4(4,4)4)不按不按(等待等待)(9(9,-1)-1)(0(0,0)0)现在学习的是第5页,共31页博弈论的几个经典模型博弈论的几个经典模型选择等待是小猪的占优策略。选择等待是小猪的占优策略。大大猪猪的的最最佳佳选选择择取取决决于于小小猪猪的的行行动动,如如果果小小猪猪去去按按,大大猪猪最最好好选选择择等等待待;如如果果小小猪猪不不去去按按,则则最最佳选择是大猪亲自去按。佳选择是大猪亲自去按。也也就就是是说说,在在智智猪猪博
8、博弈弈中中,大大猪猪没没有有占占优优策策略略,而而小小猪猪有有占占优优策策略略,它它的的最最佳佳选选择择就就是是耐耐心心等等待待大大猪去按钮,才能获得最佳结果。猪去按钮,才能获得最佳结果。“小小猪猪躺躺着着大大猪猪跑跑”的的现现象象是是由由于于故故事事中中的的游游戏戏规规则则所所导导致致的的。规规则则的的核核心心指指标标是是:每每次次落落下下的的事事物物数数量量和踏板与投食口之间的距离。和踏板与投食口之间的距离。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈现在学习的是第6页,共31页博弈论的几个经典模型博弈论的几个经典模型如如果果改改变变一一下下核核心心指指标标,猪猪圈圈
9、里里还还会会出出现现同同样样的的“小小猪躺着大猪跑猪躺着大猪跑”的景象吗?试试看。的景象吗?试试看。改变方案一:减量方案。改变方案一:减量方案。改变方案二:增量方案。改变方案二:增量方案。改变方案三:减量加移位方案。改变方案三:减量加移位方案。投投食食仅仅原原来来的的一一半半分分量量,但但同同时时将将投投食食口口移移到到踏踏板板附附近近。结结果果呢呢,小小猪猪和和大大猪猪都都在在拼拼命命地地抢抢着着踩踩踏踏板板。等等待待者者不不得得食食,而而多多劳劳者者多多得得。每每次次的的收收获获刚刚好好消费完。消费完。对对于于游游戏戏设设计计者者,这这是是一一个个最最好好的的方方案案。成成本不高,但收获最
10、大。本不高,但收获最大。模型一、智猪博弈模型一、智猪博弈/完全信息静态博弈完全信息静态博弈现在学习的是第7页,共31页博弈论的几个经典模型博弈论的几个经典模型 有有两两个个小小偷偷A A和和B B联联合合犯犯事事、私私入入民民宅宅被被警警察察抓抓住住。警警方方将将两两人人分分别别置置于于不不同同的的两两个个房房间间内内进进行行审审讯讯,对对每每一一个个犯犯罪罪嫌嫌疑疑人人,警警方方给给出出的的政政策策是是:如如果果一一个个犯犯罪罪嫌嫌疑疑人人坦坦白白了了罪罪行行,交交出出了了赃赃物物,于于是是证证据据确确凿凿,两两人人都都被被判判有有罪罪。如如果果另另一一个个犯犯罪罪嫌嫌疑疑人人也也作作了了坦
11、坦白白,则则两两人人各各被被判判刑刑8 8年年;如如果果另另一一个个犯犯罪罪嫌嫌人人没没有有坦坦白白而而是是抵抵赖赖,则则以以妨妨碍碍公公务务罪罪(因因已已有有证证据据表表明明其其有有罪罪)再再加加刑刑2 2年年,而而坦坦白白者者有有功功被被减减刑刑8 8年年,立立即即释释放放。如如果果两两人人都都抵抵赖赖,则则警警方方因因证证据据不不足足不不能能判判两两人人的的偷偷窃窃罪罪,但但可可以以私私入入民民宅宅的罪名将两人各判入狱的罪名将两人各判入狱1 1年。年。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第8页,共31页博弈论的几个经典模型博弈论的几个经典模型 不不难难看看出
12、出,“坦坦白白”是是任任一一犯犯罪罪嫌嫌疑疑人人的的占占优优战战略,而(坦白,坦白)是一个占优战略均衡。略,而(坦白,坦白)是一个占优战略均衡。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈 乙乙 甲甲坦白坦白抵赖抵赖坦白坦白(-8(-8,-8)-8)(0(0,-10)-10)抵赖抵赖(-10(-10,0)0)(-1(-1,-1)-1)现在学习的是第9页,共31页博弈论的几个经典模型博弈论的几个经典模型该博弈刻划了两大难题:该博弈刻划了两大难题:冲冲突突情情形形下下,参参与与人人的的目目标标是是什什么么?是是采采用用(作作为为个个人人)他他自自己己的的最最好好策策略略,还还是是采采用用
13、(作作为为集集体体的的一一员员)他他们们共共同同的的最最好好策策略略?前前者者导导致致均均衡衡策策略略(坦坦白白,坦坦白白),支支付付为为(-8(-8,-8)-8);后后者者的的最最好好策策略略是是(抵抵赖赖,抵抵赖赖),支支付付为为(-1(-1,-1)-1)。这这里里反反映映了了个个体体理理性性行行为为与与集集体理性行为之间的矛盾、冲突。体理性行为之间的矛盾、冲突。此此博博弈弈只只进进行行一一次次还还是是重重复复进进行行?如如果果博博弈弈只只进进行行一一次次,参参与与人人似似乎乎只只有有坦坦白白才才是是最最好好的的策策略略,因因为为没没有有理理由由相相信信对对手手会会对对你你有有信信心心,他
14、他总总认认为为你你自自己己会会坦坦白白;因因此此,双双方方都都采采取取坦坦白白策策略略。然然而,若博弈进行多次,则结论将会发生变化。而,若博弈进行多次,则结论将会发生变化。模型二、囚徒困境模型二、囚徒困境/非合作博弈非合作博弈现在学习的是第10页,共31页博弈论的几个经典模型博弈论的几个经典模型什么是海萨尼转换?什么是海萨尼转换?海海萨萨尼尼提提出出了了一一种种处处理理不不完完全全信信息息博博弈弈的的方方法法,即即引引入入一一个个虚虚拟拟的的局局中中人人“自自然然”。自自然然首首先先行行动动,它它决决定定每每个个局局中中人人的的特特征征。每每个个局局中中人人知知道道自自己己的的特特征征,但但不
15、不知知道道别别的的局局中中人人特特征征。这这种种方方法法将将不不完完全全信信息息静静态态博博弈弈变变成成一一个个两两阶阶段段动动态态博博弈弈,第第一一个个阶阶段段是是自自然然N N的的行行动动选选择择,第第二二阶阶段段是是除除N N外外的的局局中中人人的的静静态态博博弈弈。这这种种转转换换被被称称为为“海海萨萨尼尼转转换换”,这这个个转转换换把把“不不完完全全信信息息”转转变变成成为为完完全全但但不不完完美美信信息息,从从而而可可以以用用分分析析完完全全信信息息博博弈的方法进行分析。弈的方法进行分析。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不
16、完全信息静态博弈现在学习的是第11页,共31页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换的具体方法海萨尼转换的具体方法一一个个虚虚拟拟的的参参与与人人“自自然然”,自自然然首首先先决决定定参参与与人人的的类类 型型,赋赋 予予 各各 参参 与与 人人 的的 类类 型型 向向 量量 ,其其 中中 ;自自然然告告知知参参与与者者自自己己的的类类型型,却却不不告告诉诉其其他他参参与者的类型;与者的类型;参参与与者者同同时时选选择择行行动动,每每一一参参与与者者 从从可可行行集集 中中选选择择行行动方案动方案 ;各方得到收益各方得到收益 。借借助助于于第第一一步步和和第第二二步步中中虚虚构构的
17、的参参与与者者“自自然然”的的行行动动,我我们们可可以以把把一一个个不不完完全全信信息息的的博博弈弈表表述述为为一一个不完美信息的博弈。个不完美信息的博弈。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第12页,共31页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换分析海萨尼转换分析 海海萨萨尼尼转转换换是是处处理理不不完完全全信信息息博博弈弈的的标标准准方方法法。一一般般地地,“,“自自然然”在在博博弈弈开开始始的的时时候候选选择择参参与与人人的的类类型型,参参与与人人的的某某个个类类型型包包括括表表征征类类型型
18、的的各各个个特特征征如如策策略略空空间间、信信息息集集、得得益益函函数数等等,这这些又称为该类型参与人所拥有的个人信息。些又称为该类型参与人所拥有的个人信息。不不完完全全信信息息意意味味着着博博弈弈各各方方中中至至少少有有一一个个参参与与人人有有多个类型。多个类型。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第13页,共31页博弈论的几个经典模型博弈论的几个经典模型 通通过过海海萨萨尼尼转转换换,博博弈弈开开始始时时,所所有有参参与与人人有有关关“自自然然”的的行行动动有有一一致致的的信信念念,即即都都知知道道所所有
19、有参参与人类型的概率分布函数,此即与人类型的概率分布函数,此即“海萨尼公理海萨尼公理”。模型三、独立私人价值下的一级密封模型三、独立私人价值下的一级密封拍卖拍卖/不完全信息静态博弈不完全信息静态博弈现在学习的是第14页,共31页博弈论的几个经典模型博弈论的几个经典模型 某某一一市市场场原原来来被被A A企企业业所所垄垄断断。现现在在B B企企业业考考虑虑是是否否进进入入。B B企企业业知知道道,A A企企业业是是否否允允许许它它进进入入,取取决决于于A A企企业业阻阻挠挠B B企企业业进进入入所所花花费费的的成成本本。如如果果阻阻挠挠的的成成本本低低,那那么么,正正如如下下表表后后两两列列所所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 几个 经典 模型 课件
限制150内