博弈论的几个经典模型 (2).ppt
《博弈论的几个经典模型 (2).ppt》由会员分享,可在线阅读,更多相关《博弈论的几个经典模型 (2).ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于博弈论的几个经典模型 (2)现在学习的是第1页,共81页博弈论的几个经典模型博弈论的几个经典模型 现在学习的是第2页,共81页博弈论的几个经典模型博弈论的几个经典模型引 言现在学习的是第3页,共81页博弈论的几个经典模型博弈论的几个经典模型引 言现在学习的是第4页,共81页博弈论的几个经典模型博弈论的几个经典模型失火了,你往哪个门跑失火了,你往哪个门跑这就是博弈论这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,无
2、法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将那么你将逃生。这里我们不考虑道德因素,你将如何选择?如何选择? 现在学习的是第5页,共81页博弈论的几个经典模型博弈论的几个经典模型 引 言现在学习的是第6页,共81页博弈论
3、的几个经典模型博弈论的几个经典模型 引 言现在学习的是第7页,共81页博弈论的几个经典模型博弈论的几个经典模型引 言现在学习的是第8页,共81页博弈论的几个经典模型博弈论的几个经典模型海萨尼(海萨尼(John John C.HarsanyiC.Harsanyi)引 言现在学习的是第9页,共81页博弈论的几个经典模型博弈论的几个经典模型现在学习的是第10页,共81页博弈论的几个经典模型博弈论的几个经典模型基本术语基本术语现在学习的是第11页,共81页博弈论的几个经典模型博弈论的几个经典模型 参与者在不同策略组合下会得到一定的支付(参与者在不同策略组合下会得到一定的支付(payoffpayoff)
4、。)。 对于博弈参与者来说,存在着一博弈结果。对于博弈参与者来说,存在着一博弈结果。 博弈涉及均衡。博弈涉及均衡。重要的均衡重要的均衡纳什均衡。纳什均衡。 基本术语基本术语现在学习的是第12页,共81页博弈论的几个经典模型博弈论的几个经典模型 非合作性博弈非合作性博弈:是指参与者在行动选择时无法达成:是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动就是合约束性的协议。人们分工与交换的经济活动就是合作性的博弈,而囚徒困境则是非合作性的博弈。作性的博弈,而囚徒困境则是非合作性的博弈。 博弈的类型博弈的类型现在学习的是第13页,共81页博弈论的几个经典模型博弈论的几个经典模型 博
5、弈的类型博弈的类型现在学习的是第14页,共81页博弈论的几个经典模型博弈论的几个经典模型 博弈的类型博弈的类型现在学习的是第15页,共81页博弈论的几个经典模型博弈论的几个经典模型 模型一、智猪博弈模型一、智猪博弈/ /完全信息静态博弈完全信息静态博弈 小猪小猪大猪大猪按按不按不按( (等待等待) )按按(5 (5,1) 1)(5 (5,3) 3)不按不按( (等待等待) )(9 (9,-1)-1)(0 (0,0) 0)大猪和小猪分别该如何选择。 现在学习的是第16页,共81页博弈论的几个经典模型博弈论的几个经典模型选择等待是小猪的占优策略。选择等待是小猪的占优策略。大猪的最佳选择取决于小猪的
6、行动,如果小猪去按大猪的最佳选择取决于小猪的行动,如果小猪去按,大猪最好选择等待;如果小猪不去按,大猪最好选择等待;如果小猪不去按, ,则最佳选则最佳选择是大猪亲自去按。择是大猪亲自去按。也就是说,在智猪博弈中,大猪没有占优策略也就是说,在智猪博弈中,大猪没有占优策略, ,而小猪而小猪有占优策略,它的最佳选择就是耐心等待大猪去有占优策略,它的最佳选择就是耐心等待大猪去按钮,才能获得最佳结果。按钮,才能获得最佳结果。“小猪躺着大猪跑小猪躺着大猪跑”的现象是由于故事中的游戏规的现象是由于故事中的游戏规则所导致的。规则的核心指标是则所导致的。规则的核心指标是: :每次落下的事物每次落下的事物数量和踏
7、板与投食口之间的距离。数量和踏板与投食口之间的距离。 模型一、智猪博弈模型一、智猪博弈/ /完全信息静态博弈完全信息静态博弈现在学习的是第17页,共81页博弈论的几个经典模型博弈论的几个经典模型如果改变一下核心指标,猪圈里还会出现同样的如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑小猪躺着大猪跑”的景象吗?试试看。的景象吗?试试看。 改变方案一:减量方案。改变方案一:减量方案。 改变方案二:增量方案。改变方案二:增量方案。 改变方案三:减量加移位方案。改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,
8、小猪和大猪都在拼命地抢着踩踏板。近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食等待者不得食, ,而多劳者多得。每次的收获刚好消而多劳者多得。每次的收获刚好消费完。费完。 对于游戏设计者,这是一个最好的方案。成本对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。不高,但收获最大。 模型一、智猪博弈模型一、智猪博弈/ /完全信息静态博弈完全信息静态博弈现在学习的是第18页,共81页博弈论的几个经典模型博弈论的几个经典模型 在博弈论中,含有占优战略均衡的一个著名例子在博弈论中,含有占优战略均衡的一个著名例子是 由 塔 克 给 出 的是 由 塔 克 给 出 的 “ 囚 徒 困 境囚
9、徒 困 境 ” ” (prisonersdilemmaprisonersdilemma)博弈模型。该模型用一种特别)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。的方式为我们讲述了一个警察与小偷的故事。 模型二、囚徒困境模型二、囚徒困境/ /非合作博弈非合作博弈现在学习的是第19页,共81页博弈论的几个经典模型博弈论的几个经典模型假设:有两个小偷假设:有两个小偷A A和和B B联合犯事、私入民宅被警察抓联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如讯,对每一个犯罪
10、嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑人也作了坦白,则两人各被判刑8 8年;如果另一个年;如果另一个犯罪嫌人没有坦白而是抵赖犯罪嫌人没有坦白而是抵赖, ,则以妨碍公务罪(因则以妨碍公务罪(因已有证据表明其有罪)再加刑已有证据表明其有罪)再加刑2 2年,而坦白者有功年,而坦白者有功被减刑被减刑8 8年,立即释放。如果两人都抵赖年,立即释放。如果两人都抵赖, ,则警方因则警方因证据不足不能判两人的偷窃罪,但
11、可以私入民宅证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱的罪名将两人各判入狱1 1年。年。 模型二、囚徒困境模型二、囚徒困境/ /非合作博弈非合作博弈现在学习的是第20页,共81页博弈论的几个经典模型博弈论的几个经典模型 不难看出,不难看出,“坦白坦白”是任一犯罪嫌疑人的占优战略,是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。而(坦白,坦白)是一个占优战略均衡。模型二、囚徒困境模型二、囚徒困境/ /非合作博弈非合作博弈 乙乙 甲甲坦白坦白抵赖抵赖坦白坦白(-8(-8,-8)-8)(0 (0,-10)-10)抵赖抵赖(-10(-10,0) 0)(-1(-1,-
12、1)-1)现在学习的是第21页,共81页博弈论的几个经典模型博弈论的几个经典模型 对于两个犯罪嫌疑人总体而言,他们设想的最好对于两个犯罪嫌疑人总体而言,他们设想的最好的策略可能是都不交代。但任何一个犯罪嫌疑人在的策略可能是都不交代。但任何一个犯罪嫌疑人在选择不交代的策略时,都要冒很大的风险,一旦自选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一犯罪嫌疑人交代了,自己就将可能己不交代而另一犯罪嫌疑人交代了,自己就将可能处于非常不利的境地。对于处于非常不利的境地。对于A A而言而言, ,不管不管B B采取何种采取何种策略,他的最佳策略都是交代。对于策略,他的最佳策略都是交代。对于B B而
13、言也是而言也是如此。最后两人都会选择交代。如此。最后两人都会选择交代。模型二、囚徒困境模型二、囚徒困境/ /非合作博弈非合作博弈现在学习的是第22页,共81页博弈论的几个经典模型博弈论的几个经典模型该博弈刻划了两大难题:该博弈刻划了两大难题: 冲突情形下,参与人的目标是什么?是采用冲突情形下,参与人的目标是什么?是采用( (作为个人作为个人) )他自己的最好策略,还是采用他自己的最好策略,还是采用( (作为集体的一员作为集体的一员) )他们他们共同的最好策略?前者导致均衡策略共同的最好策略?前者导致均衡策略( (坦白,坦白坦白,坦白) ),支付为,支付为(-8(-8,-8)-8);后者的最好策
14、略是;后者的最好策略是( (抵赖,抵赖抵赖,抵赖) ),支付为,支付为(-1(-1,-1)-1)。这里反映了个体理性行为与集体。这里反映了个体理性行为与集体理性行为之间的矛盾、冲突。理性行为之间的矛盾、冲突。 此博弈只进行一次还是重复进行?如果博弈只进行一此博弈只进行一次还是重复进行?如果博弈只进行一次,参与人似乎只有坦白才是最好的策略,因为没有次,参与人似乎只有坦白才是最好的策略,因为没有理由相信对手会对你有信心,他总认为你自己会坦白理由相信对手会对你有信心,他总认为你自己会坦白;因此,双方都采取坦白策略。然而,若博弈进行多;因此,双方都采取坦白策略。然而,若博弈进行多次,则结论将会发生变化
15、。次,则结论将会发生变化。模型二、囚徒困境模型二、囚徒困境/ /非合作博弈非合作博弈现在学习的是第23页,共81页博弈论的几个经典模型博弈论的几个经典模型囚徒困境可以用来说明许多现象。囚徒困境可以用来说明许多现象。寡头定价寡头定价拍卖出价拍卖出价推销员的努力推销员的努力政治上的讨价还价政治上的讨价还价军备竞赛等(冲突中出现两败俱伤的情况军备竞赛等(冲突中出现两败俱伤的情况, ,往往往要考虑到囚徒困境)往要考虑到囚徒困境) * *(纯策略)纳什均衡(纯策略)纳什均衡模型二、囚徒困境模型二、囚徒困境/ /非合作博弈非合作博弈现在学习的是第24页,共81页博弈论的几个经典模型博弈论的几个经典模型某年
16、在荷兰召开了一次某年在荷兰召开了一次“合作及社会两难困境研讨会合作及社会两难困境研讨会”,与会者都是博弈论的专家。,与会者都是博弈论的专家。 当大会结束之后,有两个学者,麦息克和路特提议大家玩当大会结束之后,有两个学者,麦息克和路特提议大家玩一个游戏。一个游戏。 他们将一个大信封拿出来,请在场的位专家拿出金钱装他们将一个大信封拿出来,请在场的位专家拿出金钱装到这个信封里。如果到最后这信封里的钱超过元,麦到这个信封里。如果到最后这信封里的钱超过元,麦息克和路特将自己掏腰包,退还每人元。不过,如果最息克和路特将自己掏腰包,退还每人元。不过,如果最后信封内的钱不足元,就统统没收,大家拿不到半毛后信封
17、内的钱不足元,就统统没收,大家拿不到半毛钱。钱。 仔细想一想,如果你也在场,你会奉献多少钱呢?仔细想一想,如果你也在场,你会奉献多少钱呢?问题与思考问题与思考现在学习的是第25页,共81页博弈论的几个经典模型博弈论的几个经典模型 什么是海萨尼转换?什么是海萨尼转换? 海萨尼提出了一种处理不完全信息博弈的方法海萨尼提出了一种处理不完全信息博弈的方法, ,即引入一个虚拟的局中人即引入一个虚拟的局中人“自然自然”。自然首。自然首先行动,它决定每个局中人的特征。每个局中人先行动,它决定每个局中人的特征。每个局中人知道自己的特征,但不知道别的局中人特征。这知道自己的特征,但不知道别的局中人特征。这种方法
18、将不完全信息静态博弈变成一个两阶段动种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然态博弈,第一个阶段是自然N N的行动选择,第二的行动选择,第二阶段是除阶段是除N N外的局中人的静态博弈。这种转换被称外的局中人的静态博弈。这种转换被称为为“海萨尼转换海萨尼转换”,这个转换把,这个转换把“不完全信息不完全信息”转转变成为完全但不完美信息,从而可以用分析完全信变成为完全但不完美信息,从而可以用分析完全信息博弈的方法进行分析。息博弈的方法进行分析。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/ /不完全信息静态博弈不完全信息静态博弈现在学习的是第26页
19、,共81页博弈论的几个经典模型博弈论的几个经典模型 海萨尼转换的具体方法海萨尼转换的具体方法一个虚拟的参与人一个虚拟的参与人“自然自然”, ,自然首先决定参与人自然首先决定参与人的类型,赋予各参与人的类型向量的类型,赋予各参与人的类型向量 ,其中,其中 ; 自然告知参与者自己的类型,却不告诉其他参与自然告知参与者自己的类型,却不告诉其他参与者的类型;者的类型; 参与者同时选择行动参与者同时选择行动, ,每一参与者每一参与者 从可行集从可行集 中选中选择行动方案择行动方案 ; 各方得到收益各方得到收益 。 借助于第一步和第二步中虚构的参与者借助于第一步和第二步中虚构的参与者“自然自然”的的行动,
20、我们可以把一个不完全信息的博弈表述为一行动,我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈。个不完美信息的博弈。模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/ /不完全信息静态博弈不完全信息静态博弈t12( , ,)ntt tt12(, )iiiA a aa tiiA现在学习的是第27页,共81页博弈论的几个经典模型博弈论的几个经典模型 海萨尼转换分析海萨尼转换分析 海萨尼转换是处理不完全信息博弈的标准方法海萨尼转换是处理不完全信息博弈的标准方法。一般地。一般地,“,“自然自然”在博弈开始的时候选择参与在博弈开始的时候选择参与人的类型,参与人的某个类型包括
21、表征类型的人的类型,参与人的某个类型包括表征类型的各个特征如策略空间、信息集、得益函数等,各个特征如策略空间、信息集、得益函数等,这些又称为该类型参与人所拥有的个人信息。这些又称为该类型参与人所拥有的个人信息。 不完全信息意味着博弈各方中至少有一个参与人不完全信息意味着博弈各方中至少有一个参与人有多个类型。有多个类型。 模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/ /不完全信息静态博弈不完全信息静态博弈现在学习的是第28页,共81页博弈论的几个经典模型博弈论的几个经典模型 通过海萨尼转换,博弈开始时,所有参与通过海萨尼转换,博弈开始时,所有参与人有关人有关“自然自
22、然”的行动有一致的信念,即都知的行动有一致的信念,即都知道所有参与人类型的概率分布函数,此即道所有参与人类型的概率分布函数,此即“海海萨尼公理萨尼公理”。 模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/ /不完全信息静态博弈不完全信息静态博弈现在学习的是第29页,共81页博弈论的几个经典模型博弈论的几个经典模型 经典案例解析经典案例解析例:某一市场原来被例:某一市场原来被A A企业所垄断。现在企业所垄断。现在B B企业考虑是否进入企业考虑是否进入。B B企业知道,企业知道,A A企业是否允许它进入,取决于企业是否允许它进入,取决于A A企业阻挠企业阻挠B B企业进入
23、所花费的成本。如果阻挠的成本低,那么,正企业进入所花费的成本。如果阻挠的成本低,那么,正如下表后两列所表示的,如下表后两列所表示的,A A企业的占优战略是阻挠,博弈有企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡重复剔除的占优战略均衡AA阻挠,阻挠,B B不进入。如果阻挠不进入。如果阻挠的成本高,那么,正如下表前两列所表示的,的成本高,那么,正如下表前两列所表示的,A A企业的企业的占优战略是默许占优战略是默许B B进入,博弈有重复剔除的占优战略均衡进入,博弈有重复剔除的占优战略均衡AA默许,默许,B B进入。进入。B B企业所不知道的,是企业所不知道的,是A A企业的阻挠成企业的阻挠成本
24、是高是低。这里,某一参与人本人知道、其他参与人则不本是高是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部私人信知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在本例中,阻挠成本就是息称为他的类型。在本例中,阻挠成本就是 A A的私人信息。的私人信息。高阻挠成本和低阻挠成本则是两种不同的类型。高阻挠成本和低阻挠成本则是两种不同的类型。 模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/ /不完全信息静态博弈不完全信息静态博弈现在学习的是第30页,共81页博弈论的几个经典模型博弈论的几个经典模型海萨尼转换后的市
25、场进入博弈:海萨尼转换后的市场进入博弈: 模型三、独立私人价值下的一级密模型三、独立私人价值下的一级密封拍卖封拍卖/ /不完全信息静态博弈不完全信息静态博弈 A A B B高成本高成本低成本低成本默许默许阻挠阻挠默许默许阻挠阻挠进入进入(40,50)(40,50)(-10,0)(-10,0)(30,100)(30,100)(-10,140)(-10,140)不进入不进入(0,300)(0,300)(0,300)(0,300)(0,400)(0,400)(0,400)(0,400) 显然,在这里,B所遇到的,是不确定性条件下的选择问题。因为B不仅不知道A的类型 (是高还是低),而且不知道不同类型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论的几个经典模型 2 博弈论 几个 经典 模型
限制150内