博弈论第讲精.ppt
《博弈论第讲精.ppt》由会员分享,可在线阅读,更多相关《博弈论第讲精.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论第讲博弈论第讲第1页,本讲稿共59页2q 局中人2 L R U局中人1 M D5,10,21,34,14,22,3No dominant strategies and dominated strategies,what about the result?第2页,本讲稿共59页Best Response(BR)3U does best against L;M does best against R第3页,本讲稿共59页L、R概率为概率为0.5时时Expected payoff of U:2.5Expected payoff of M:2.5Expected payoff of D:3此时,
2、D does best。4第4页,本讲稿共59页假定假定1认为认为2选择选择r的概率为的概率为p(r),则则1选选U、M、D的期望收益分别为的期望收益分别为 E u1(U,p(r)=(1-p(r)5+p(r)0 E u1(M,p(r)=(1-p(r)1+p(r)2 E u1(D,p(r)=(1-p(r)4+p(r)25第5页,本讲稿共59页6)第6页,本讲稿共59页BR是期望收益最大时的反应是期望收益最大时的反应q图中 x=1/3,y=3/5q由图可知,p(r)1/3时,1的最佳反应是选U;q1/3p(r)3/5时,1的最佳反应是选D;qp(r)3/5时,1的最佳反应是选M。7第7页,本讲稿共
3、59页8第8页,本讲稿共59页点球博弈点球博弈9第9页,本讲稿共59页10第10页,本讲稿共59页Partnership Game2 人拥有一家公司,每人分享利润的一半每人的策略:精力投入水平,Si=0,4利润:4S1+S2+b S1 S2 b=0,1/4U1=2S1+S2+b S1 S2-S1 S1U2=2S1+S2+b S1 S2 S2 S211第11页,本讲稿共59页参与人的参与人的BR是什么?是什么?12第12页,本讲稿共59页13b=1/4时第13页,本讲稿共59页14第14页,本讲稿共59页纳什均衡纳什均衡15第15页,本讲稿共59页16Nash EquilibriumThe ac
4、tion profile s*is a Nash Equilibrium if,for every player i and every action si of player i,s*is at least as good as according to player is preferences as the the action profile(si*,s-i*)in which player i chooses si*while every other player choose s-i*.Equivalently,for every player i,ui(s*)ui(si,s-i*
5、),For every action of player i第16页,本讲稿共59页17Definition In the n-player game G=S1,Sn;u1,un,the strategies profile(s1*,sn*)are a Nash equilibrium if,for each player i,si*is (at least tied for(至少不劣于)(至少不劣于))player is best response to the strategies specified for the n-1 other players,(s1*,sn-1*,sn+1*,s
6、n*):ui(s1*,sn-1*,si*,sn+1*,sn*)ui(s1*,sn-1*,si ,sn+1*,sn*)(NE)第17页,本讲稿共59页18 for every feasible strategy si in Si;That is,si*solves max ui(s1*,sn-1*,si,sn+1*,sn*).siSi 上述均衡概念是上述均衡概念是1951年由数学家约翰年由数学家约翰纳什纳什(John Nash)首先提出的,称为纳什均衡。)首先提出的,称为纳什均衡。第18页,本讲稿共59页19纳什均衡纳什均衡(Nash Equilibrium)q定义。对于一个策略式表述的博弈G=
7、N,Si,ui,iN。称策略组合s*=(s1,si,sn)是一个纳什均衡,如果对于每一个i N,si*是给定其他参与人选择s-i*=s1*,si-1*,si+1*,sn*q情况下参与人i的最优策略(经济理性策略),即:ui(si*,s-i*)ui(si,s-i*),对于任意的 siSi,任意的 iN均成立。第19页,本讲稿共59页20纳什均衡的通俗定义纳什均衡的通俗定义 纳什均衡是一种策略组合,给定对手的策略,每个参与人选择自己的最优策略。第20页,本讲稿共59页21 1 If game theory is to provide a unique solution to a game-theo
8、retic problem then the solution must be a Nash equilibrium,in the following sense.Suppose that game theory makes a unique prediction about the strategy each player will choose.In order for this prediction to be correct,it is necessary that each player be willing to choose the strategy predicted by t
9、he theory.第21页,本讲稿共59页22Thus each players predicted strategy must be that players best response to the strategies of the other players.Such a prediction could be called strategically stable or self-enforcing,because no single player wants to deviate from his or her Predicted strategy.We will call su
10、ch a prediction a Nash equilibrium.-Robert Gibbons第22页,本讲稿共59页232 一种稳定的策略组合:当所有参与人一种稳定的策略组合:当所有参与人的选择公开以后,每个人都满意自己作的选择公开以后,每个人都满意自己作出了正确的选择;没有人能得到更好的出了正确的选择;没有人能得到更好的结果了。在博弈论中这种结果被称为结果了。在博弈论中这种结果被称为NE。第23页,本讲稿共59页243 NE的哲学含义:的哲学含义:n个参与人在博弈之前个参与人在博弈之前协商达成一个协议,规定每一个参与人选择协商达成一个协议,规定每一个参与人选择一个特定的策略。一个特定
11、的策略。问题是,给定其他参与人都遵守该协议,在问题是,给定其他参与人都遵守该协议,在没有外在强制的情况下,是否有人选择不遵没有外在强制的情况下,是否有人选择不遵守?守?第24页,本讲稿共59页25只有当遵守协议带来的效用大于不遵守时,参与人才只有当遵守协议带来的效用大于不遵守时,参与人才会遵守。如果没有任何参与人有积极性不遵守这个协会遵守。如果没有任何参与人有积极性不遵守这个协议,该协议议,该协议是可以自动实施的(是可以自动实施的(self-enforcing),),构成纳什均衡;否则,就不是纳什均衡。构成纳什均衡;否则,就不是纳什均衡。第25页,本讲稿共59页26 4 纳什均衡是一种策略组合
12、,每个参与纳什均衡是一种策略组合,每个参与人的策略是对其他参与人策略的最优反应。人的策略是对其他参与人策略的最优反应。纳什均衡是博弈将会如何进行的纳什均衡是博弈将会如何进行的“一致一致”(consistent)预测。如果所有参与人预测特)预测。如果所有参与人预测特定纳什均衡会出现,那么没有参与人有动力定纳什均衡会出现,那么没有参与人有动力采用与均衡不同的行动。采用与均衡不同的行动。第26页,本讲稿共59页27纳什均衡(纳什均衡(也只有纳什均衡也只有纳什均衡)一致预测性。)一致预测性。任何非纳什均衡的出现意味着至少有一个参与人任何非纳什均衡的出现意味着至少有一个参与人“犯了犯了错错”,或者是对对
13、手行动的预测上犯了错,或者是(给,或者是对对手行动的预测上犯了错,或者是(给定那种预测)在最大化自己的收益时犯了错。定那种预测)在最大化自己的收益时犯了错。(Jean Tirole)第27页,本讲稿共59页28纳什均衡的一致预测性纳什均衡的一致预测性q如果所有参与方都预测一个特定的博弈结果会出现,那么所有的参与方都不会利用该预测或者这种预测能力来选择与预测结果不一致的策略,即没有哪个参与方有偏离这个预测结果的愿望,因此这个预测结果最终就真会成为博弈的结果。q“一致”的意义在于各博弈方的实际行为选择与他们的预测一致。第28页,本讲稿共59页q假设各参与方预测的策略组合相同,以及各参与方都是完全理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 第讲精
限制150内