博弈论与决策行为.ppt
《博弈论与决策行为.ppt》由会员分享,可在线阅读,更多相关《博弈论与决策行为.ppt(173页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论与决策行为博弈论与决策行为现在学习的是第1页,共173页21博弈论的基本概念博弈论的基本概念l一、博弈参与人一、博弈参与人 博弈参与人(博弈参与人(player)是博弈中选择行动以最大化自)是博弈中选择行动以最大化自己效用的决策主体。参与人可以是自然人,也可以是己效用的决策主体。参与人可以是自然人,也可以是企业、团队、国家,甚至是国家组成的集团(如欧盟、企业、团队、国家,甚至是国家组成的集团(如欧盟、OPEC等)。等)。除一般意义上的参与人外,博弈论中还有除一般意义上的参与人外,博弈论中还有“虚拟参与人虚拟参与人”(pseudo player)自然(自然(nature),),“自然自然”
2、是指不是指不以博弈参与人意志为转移的外生事件,以博弈参与人意志为转移的外生事件,“自然自然”选择的是外选择的是外生事件的各种可能现象,并用概率分布来描述生事件的各种可能现象,并用概率分布来描述“自然自然”的的选择机理。也可以说,自然就是决定外生的随机变量的选择机理。也可以说,自然就是决定外生的随机变量的概率分布的机制。概率分布的机制。现在学习的是第2页,共173页l二、行动二、行动l行动(行动(actionormove)是参与人在博弈的某个时点的)是参与人在博弈的某个时点的决策变量。决策变量。l与行动相关的一个重要问题是行动的顺序。静态博与行动相关的一个重要问题是行动的顺序。静态博弈与动态博弈
3、就是依据行动的顺序进行区分的。所弈与动态博弈就是依据行动的顺序进行区分的。所谓静态博弈,就是指参与人同时选择行动,或虽然谓静态博弈,就是指参与人同时选择行动,或虽然不是准确意义上的同时,但后行动者并不知道先行不是准确意义上的同时,但后行动者并不知道先行动者采取了什么具体行动;动态博弈则是指参与人动者采取了什么具体行动;动态博弈则是指参与人的行动有先后顺序,且后行动者能够观察到先行动的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。者所选择的行动。现在学习的是第3页,共173页l三、战略三、战略l博弈中各参与人的行动规则称为博弈中各参与人的行动规则称为“战略战略”(strategy),
4、它规定参与人在什么情况下选择什么行动。各参与人可它规定参与人在什么情况下选择什么行动。各参与人可以选择的全部战略或战略选择的范围称为以选择的全部战略或战略选择的范围称为“战略空间战略空间”。l如果一个博弈中每个参与人的战略数都是有限的,则如果一个博弈中每个参与人的战略数都是有限的,则称为称为“有限博弈有限博弈”(finitegame),如果一个博弈中,如果一个博弈中至少有某些参与人的战略有无限多个,则称为至少有某些参与人的战略有无限多个,则称为“无限无限博弈博弈”(infinitegame)。现在学习的是第4页,共173页l四、得益四、得益l得益得益(payoff)是指在一个特定的战略组合下参
5、与人从是指在一个特定的战略组合下参与人从博弈中所获得的利益,是参与人追求的根本目标,也博弈中所获得的利益,是参与人追求的根本目标,也是他们行为和判断的主要依据。博弈的一个基本特征是他们行为和判断的主要依据。博弈的一个基本特征是参与人的得益不仅取决于自己的战略选择,而且取是参与人的得益不仅取决于自己的战略选择,而且取决于所有参与人的战略选择,因此参与人的得益是所决于所有参与人的战略选择,因此参与人的得益是所有参与人战略组合的函数。有参与人战略组合的函数。现在学习的是第5页,共173页l五、信息五、信息l信息指的是参与人在博弈过程中能够了解和观察到的知识,信息指的是参与人在博弈过程中能够了解和观察
6、到的知识,这些知识包括这些知识包括“自然自然”的选择、其他参与人的特征和行动的选择、其他参与人的特征和行动等。等。l一般地,将各博弈方都完全了解所有博弈方各种情况下一般地,将各博弈方都完全了解所有博弈方各种情况下得益的博弈称为得益的博弈称为“完全信息完全信息(completeinformation)博弈博弈”,而将至少部分博弈方不完全了解其他博弈方得,而将至少部分博弈方不完全了解其他博弈方得益情况的博弈称为益情况的博弈称为“不完全信息不完全信息(incompleteinformation)博弈博弈”。现在学习的是第6页,共173页l六、合作博弈与非合作博弈六、合作博弈与非合作博弈l合作博弈合作
7、博弈(cooperativegames)与非合作博弈与非合作博弈(non-cooperativegames)的区别,主要在于博弈的当事人的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。博弈;反之,就是非合作博弈。l当前,非合作博弈是博弈论研究的主流领域。非合作当前,非合作博弈是博弈论研究的主流领域。非合作博弈按照参与人的信息状态和行动顺序两个角度进行博弈按照参与人的信息状态和行动顺序两个角度进行划分,得到四种不同类型的博弈:完全信息静态博弈、划分,得到四种不同类型的博弈:完全信息静态博弈、完
8、全信息动态博弈、不完全信息静态博弈、不完全信完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。息动态博弈。现在学习的是第7页,共173页22完全信息静态博弈完全信息静态博弈参与者同时选择行动,根据所有参与者的选择,每个参与者同时选择行动,根据所有参与者的选择,每个参与者得到各自的结果(一定的收益或支出)。参与者得到各自的结果(一定的收益或支出)。每一参与者的收益函数(根据所有参与者选择行动的每一参与者的收益函数(根据所有参与者选择行动的不同组合决定某一参与者收益的函数)在所有参与者之不同组合决定某一参与者收益的函数)在所有参与者之间是共同知识。间是共同知识。现在学习的是第8页,共173
9、页221博弈的标准式表述和求解博弈的标准式表述和求解l博弈标准式表述含有以下三个要素:博弈标准式表述含有以下三个要素:(1)参与人集合,)参与人集合,(2)每一个参与人可供选择的战略集,)每一个参与人可供选择的战略集,(3)针对所有参与人可能选择的战略组合,每一)针对所有参与人可能选择的战略组合,每一个参与人获得的收益。个参与人获得的收益。现在学习的是第9页,共173页l用用G表示一个博弈,如果表示一个博弈,如果G有有n个博弈方,每个博个博弈方,每个博弈方的全部可选战略的集合称为弈方的全部可选战略的集合称为“战略空间战略空间”,分别用分别用S1,,Sn表示,表示,Sij Si表示博弈方表示博弈
10、方i的第的第j个个战略,其中战略,其中j可取有限个值(有限战略博弈),也可取有限个值(有限战略博弈),也可取无限个值(无限战略博弈);博弈方可取无限个值(无限战略博弈);博弈方i的得益的得益用用ui表示,是各博弈方战略的多元函数,表示,是各博弈方战略的多元函数,n个博弈个博弈方的博弈方的博弈G写成写成G=S1,Sn;u1,un现在学习的是第10页,共173页现在学习的是第11页,共173页占优战略均衡占优战略均衡l在博弈中,如果所有的参与人都有占优战略存在,在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与人的占优战略的基础上达因而博弈将在所有参与人的占优战略的基础上达到均衡,这
11、种均衡称为占优战略均衡。在上表中,到均衡,这种均衡称为占优战略均衡。在上表中,“A坦白,坦白,B也坦白也坦白”就是占优战略均衡。就是占优战略均衡。l占优战略均衡只要求所有的参与人是理性的,而并不要求每个参与人知道其他参与人也是理性的。l不论其他参与人是否理性,占优战略总是一个理性参与人的最优选择。现在学习的是第12页,共173页重复剔除严格劣势战略均衡重复剔除严格劣势战略均衡l在绝大多数博弈中,占优战略均衡是不存在的。在绝大多数博弈中,占优战略均衡是不存在的。我们可以通过逐步剔除劣势策略找出博弈的均衡。我们可以通过逐步剔除劣势策略找出博弈的均衡。l劣战略劣战略(dominated strate
12、gies):是指在其他博弈参是指在其他博弈参与人战略为既定的条件下,某一参与人可能采取与人战略为既定的条件下,某一参与人可能采取的战略中,对自己相对不利的战略。的战略中,对自己相对不利的战略。l严格劣战略严格劣战略(strictly dominated strategies)则是指:则是指:无论其他博弈参与人采取什么战略,某一参与人无论其他博弈参与人采取什么战略,某一参与人可能采取的战略中,对自己相对不利的战略。可能采取的战略中,对自己相对不利的战略。现在学习的是第13页,共173页l首先找出某一博弈参与人的严格劣战略,将它剔首先找出某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已
13、剔除战略的新的博除掉,重新构造一个不包括已剔除战略的新的博弈;然后继续剔除这个新的博弈中某一参与人的弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;重复进行这一过程,直到剩下唯一严格劣战略;重复进行这一过程,直到剩下唯一的参与人战略组合为止。的参与人战略组合为止。l这个唯一剩下的参与人战略组合,就是这个博弈这个唯一剩下的参与人战略组合,就是这个博弈的均衡解,称为的均衡解,称为“重复剔除的占优战略均衡重复剔除的占优战略均衡”(iterated dominance equilibrium).现在学习的是第14页,共173页l与占优战略均衡相比,重复剔除劣势战略均衡不仅要求博弈的所与占优战略均
14、衡相比,重复剔除劣势战略均衡不仅要求博弈的所有参与人都是理性的,而且要求每个参与人都了解所有的其他参与有参与人都是理性的,而且要求每个参与人都了解所有的其他参与人都是理性的。在上例中,如果大猪不能排除小猪按按钮的可能性,人都是理性的。在上例中,如果大猪不能排除小猪按按钮的可能性,按按钮就不一定是大猪的最优选择。按按钮就不一定是大猪的最优选择。现在学习的是第15页,共173页纳什均衡(纳什均衡(NASHEQUILIBRIUM)l设想在博弈论预测的博弈结果中,给定每个参与设想在博弈论预测的博弈结果中,给定每个参与人选定各自的战略,为使该预测是正确的,必须人选定各自的战略,为使该预测是正确的,必须使
15、参与人自愿选择理论给他推到出的战略。使参与人自愿选择理论给他推到出的战略。l这样,每个参与人要选择的战略必须是针对其他这样,每个参与人要选择的战略必须是针对其他参与人选择战略的最优反应,这种理论推测结果参与人选择战略的最优反应,这种理论推测结果可以叫做可以叫做“战略稳定战略稳定”或或“自动实施自动实施”的,因为的,因为没有参与人愿意独自离弃他所选定的战略,我们没有参与人愿意独自离弃他所选定的战略,我们把这一状态就称为纳什均衡。把这一状态就称为纳什均衡。现在学习的是第16页,共173页qNashEquilibrium:“ImdoingthebestIcangiven what you are d
16、oing”“Youredoingthebestyoucangiven what I am doing.”现在学习的是第17页,共173页l定义:在博弈定义:在博弈G=S1,Sn;u1,un中,如果中,如果由各个博弈方的各一个策略组合(由各个博弈方的各一个策略组合(s1*,,sn*)中,任一博弈方中,任一博弈方i的策略的策略si*都是对其余博弈方策略都是对其余博弈方策略组合(组合(s1*,,si-1*,si+1*,sn*)的最佳策略,)的最佳策略,即即ui(s1*,,si-1*,si*,si+1*,sn*)ui(s1*,,si-1*,sij,si+1*,sn*)对任意)对任意sij Si都成立,
17、都成立,则称(则称(s1*,,sn*)为)为G的一个纳什均衡。的一个纳什均衡。现在学习的是第18页,共173页l可以证明:纳什均衡战略决不会在重复剔除劣战可以证明:纳什均衡战略决不会在重复剔除劣战略的过程中被剔除掉,而重复剔除劣战略后所留略的过程中被剔除掉,而重复剔除劣战略后所留战略却不一定满足纳什均衡战略的条件,因此纳战略却不一定满足纳什均衡战略的条件,因此纳什均衡是一个比重复剔除严格劣战略要强的解的什均衡是一个比重复剔除严格劣战略要强的解的概念。概念。现在学习的是第19页,共173页无限策略博弈分析和反应函数无限策略博弈分析和反应函数l在在无无限限策策略略、连连续续策策略略空空间间的的博博
18、弈弈中中,我我们们仍仍然然可以以纳什均衡概念为基础进行博弈分析。可以以纳什均衡概念为基础进行博弈分析。现在学习的是第20页,共173页古诺的寡头模型古诺的寡头模型寡头产量竞争寡头产量竞争以两厂商产量竞争为例以两厂商产量竞争为例222126qqqq-=现在学习的是第21页,共173页反应函数反应函数古诺模型的反应函数古诺模型的反应函数现在学习的是第22页,共173页 q1*=q2*=2现在学习的是第23页,共173页4.5,4.55,3.753.75,54,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益为目标:各生产以自身最大利益为目标:各生产2单位产量,各自得益为单位产量,各自得益
19、为4以两厂商总体利益最大:各生产以两厂商总体利益最大:各生产1.5单位产量,各自得益为单位产量,各自得益为4.5两寡头间的囚徒困境博弈两寡头间的囚徒困境博弈现在学习的是第24页,共173页222完全信息静态博弈的典型应用完全信息静态博弈的典型应用l一、豪泰林(一、豪泰林(Hotelling)价格竞争模型)价格竞争模型l在在古古诺诺模模型型中中,产产品品是是同同质质的的。在在这这个个假假设设下下,如如果果企企业业的的竞竞争争战战略略是是价价格格而而不不是是产产量量,伯伯川川德德(Bertrand)证证明明,即即使使只只有有两两个个企企业业,在在均均衡衡情情况况下下,价价格格等等于于平平均均成成本
20、本,企企业业的的利利润润为为零零,与与完完全全竞竞争争市市场场均均衡衡一一样样。这这便便是是所所谓谓的的“伯伯川川德悖论德悖论”。(。(BertrandParadox)现在学习的是第25页,共173页l与古诺模型相比,伯川德模型中的纳什均衡是与古诺模型相比,伯川德模型中的纳什均衡是完全竞争的结果:双方的定价都等于成本,这完全竞争的结果:双方的定价都等于成本,这与古诺模型中双方均获得正利润的结果截然不与古诺模型中双方均获得正利润的结果截然不同。同。l为什么?每个厂商都有削价的动机,如果一方为什么?每个厂商都有削价的动机,如果一方削价(哪怕是些微的),它就可以占领整个市削价(哪怕是些微的),它就可
21、以占领整个市场并提高其利润水平。因此,直至价格被压低场并提高其利润水平。因此,直至价格被压低至成本水平(假如双方相同),双方都将价格至成本水平(假如双方相同),双方都将价格定为在略低于对手的水准。定为在略低于对手的水准。l纳什均衡的含义:一旦双方的索价等于成本,纳什均衡的含义:一旦双方的索价等于成本,任一方就不存在调整其价格的动机了。任一方就不存在调整其价格的动机了。现在学习的是第26页,共173页l解解开开这这一一悖悖论论的的办办法法之之一一是是引引入入产产品品的的差差异异性性。如如果果不不同同企企业业生生产产的的产产品品是是有有差差异异的的,替替代代弹弹性性就就不不会会是是无无限限的的,此
22、此时时消消费费者者对对不不同同企企业业的的产产品品有有着着不不同同的的偏偏好好,价价格格不不是是他他们们唯唯一一感感兴兴趣趣的的变变量量。在在存存在在产产品品差差异异的的情情况况下下,均均衡衡价价格格不不会会等等于成本。于成本。现在学习的是第27页,共173页l产产品品差差异异有有多多种种形形式式,经经典典的的豪豪泰泰林林模模型型考考虑虑了了一一种种特特殊殊的的差差异异,即即空空间间上上的的差差异异。在在模模型型中中,产产品品在在物物质质性性能能上上是是相相同同的的,但但在在空空间间位位置置上上有有差差异异。因因为为不不同同位位置置上上的的消消费费者者要要支支付付不不同同的的运运输输成成本本,
23、他他们们关关心心的的是是价价格格与与运运输输成成本本之之和和,而而不仅仅是价格。不仅仅是价格。现在学习的是第28页,共173页l假假定定有有一一个个长长度度为为1的的线线性性城城市市,消消费费者者均均匀匀分分布布在在0,1区区间间里,分布密度为里,分布密度为1。l两两个个商商店店,分分别别位位于于城城市市的的两两端端,商商店店1在在x=0,商商店店2在在x=1,出售性能相同的产品。,出售性能相同的产品。l每每个个商商店店提提供供单单位位产产品品的的成成本本为为c,消消费费者者购购买买商商品品的的旅旅行行成本为成本为tl住住在在x的的消消费费者者如如果果在在商商店店1购购买买,要要花花费费tx的
24、的旅旅行行成成本本;如如果在商店果在商店2购买,要花费购买,要花费t(1-x)的旅行成本的旅行成本l假假定定消消费费者者具具有有单单位位需需求求,即即或或者者消消费费1个个单单位位,或或者者消消费费0个个单位。单位。现在学习的是第29页,共173页l考考虑虑两两商商店店之之间间价价格格竞竞争争的的纳纳什什均均衡衡,即即行行动动变变量量为为价价格格pi,(i=1,2)。需需求求函函数数Di(p1,p2),(i=1,2)。l如如果果住住在在x的的消消费费者者在在两两个个商商店店之之间间是是无无差差异异的的,即满足:即满足:lp1+tx=p2+t(1-x)现在学习的是第30页,共173页l那那么么,
25、住住在在比比x距距离离近近的的消消费费者者都都会会在在商商店店1购购买买,住住在在比比x距距离离远远的的消消费费者者都都会会在在商商店店2购购买买。则则需需求函数分别为:求函数分别为:l现在学习的是第31页,共173页l利润函数分别为:利润函数分别为:现在学习的是第32页,共173页l求求使使得得利利润润最最大大的的价价格格水水平平,分分别别令令以以下下一一阶阶导导数为零:数为零:现在学习的是第33页,共173页l解得:解得:lp1*=p2*=c+tl每个企业的均衡利润为:每个企业的均衡利润为:lu1=u2=t/2现在学习的是第34页,共173页l当当旅旅行行成成本本为为零零时时,不不同同商商
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 决策 行为
限制150内