完全信息静态博弈基础理论.pptx
《完全信息静态博弈基础理论.pptx》由会员分享,可在线阅读,更多相关《完全信息静态博弈基础理论.pptx(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.1.A 基础理论:博弈的标准式和纳什均衡1.1.A 博弈的标准式表述在博弈的标准式表述中,每一参与者同时选择一个战略,所有参与者选择战略的组合决定了每个参与者的收益。我们借一个经典的例子说明博弈的标准式囚徒困境。第1页/共48页囚徒困境:两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招认犯罪,警方并无充足证据将其按罪判刑。警方把他们关入不同牢室,并对他们说明不同行动带来的后果。如果两人都不坦白,将均被判为轻度犯罪,入狱一个月;如果双方都坦白招认,都将被判入狱6个月;最后,如果一人招认而另一人拒不坦白,招认的一方将马上获释,而另一人将判入狱9个月所犯罪行6个月,干扰司法加判3个月。第2页/共
2、48页囚徒面临的问题可用下图所示的双变量矩阵表来描述。“双变量”指的是在两个参与者的博弈中,每一单元格有两个数字,分别表示两个参与者的收益。第3页/共48页在此博弈中,每一囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默).在一组特定的战略组合被选定后,两人的收益由上图双变量矩阵中相应单元的数据所表示。习惯上,横行代表的参与者(此例中为囚徒1)的收益在两个数字中放前面,列代表的参与者(此例为囚徒2)的收益置于其后。第4页/共48页博弈的要素:现在我们回到一般情况。博弈的标准式表述包括:(1)博弈的参与者;(2)每一参与者可供选择的战略集;(3)针对所有参与者可能选择的战略组合,每一个参与
3、者获得的收益。第5页/共48页考虑n个参与者的博弈:(1)参与者从1到n排序;(2)设其中任一参与者的序号为i,令Si代表参与者i可以选择的战略集合(称为i的战略空间),其中任意一个特定的战略用si表示(有时我们写成,siSi表示战略si是战略集Si中的要素);(3)令(s1,.,sn)表示每个参与者选定一个战略形成的战略组合,ui表示第i个参与者的收益函数,ui(si,.,sn)即为参与者选择战略(s1,.,sn)时第i个参与者的收益。第6页/共48页博弈的标准式表述将上述内容综合起来,我们得到:定义 在一个n人博弈的标准式表述中,参与者的战略空间为S1,Sn,收益函数为u1,un,我们用G
4、=S1,Sn;u1,un表示此博弈。第7页/共48页同时选择战略的含义:尽管我们曾提到,在博弈的标准式中,参与者是同时选择战略的,但这并不意味着各方的行动也必须是同时的。只要是每一参与者在选择行动时不知道其他参与者的选择就足够了。像上例中牢里分开关押的囚徒,可以在任何时间作出他们的选择。更进一步,尽管在本章中博弈的标准式只用来表示参与者行动时不清楚他人选择的静态博弈,但标准式也可用来表示序贯行动的博弈,只不过另一种变通的方式博弈的扩展式表述更为常用,它在分析动态问题时也更为方便。第8页/共48页1.1.B 重复剔除严格劣战略下面开始介绍如何着手分析一个博弈论问题。我们从囚徒的困境这个例子开始,
5、因为它较为简单,只需用到理性的参与者不会选择严格劣战略这一原则。第9页/共48页严格劣战略的定义:定义 在标准式的博弈G=S1,Sn;u1,un中,令si和si”代表参与者i的两个可行战略(即si和si”是Si中的元素)。如果对其他参与者每一个可能的战略组合,i选择si的收益都小于其选择si”的收益,则称战略si相对于战略si”是严格劣战略:ui(s1,si-1,si,si+1,sn)ui(s1,si-1,si”,si+1,sn)对其他参与者在其战略空间S1,Si-1,Si+1,Sn中每一组可能的战略(s1,si-1,si+1,sn)都成立。第10页/共48页重复剔除严格劣战略均衡:理性的参与
6、者不会选择严格劣战略,因为他对其他人选择的战略)无法作出这样的推断,使这一战略成为他的最优反应。这样,在囚徒的困境中,一个理性的参与人会选择招认,于是(招认,招认)就成为两个理性参与者的结果,尽管(招认,招认)带给双方的福利都比(沉默,沉默)要低。第11页/共48页第12页/共48页现在,我们来看理性参与者不选择严格劣战略这一原则是否能解决其他博弈问题。考虑图1.1.1所示抽象博弈的例子:第13页/共48页重复剔除严格劣战略均衡的缺陷:上面的过程可称为“重复剔除严格劣战略”。尽管此过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上,它仍有两个缺陷:第一,每一步剔除都需要假定,参与者间
7、相互了解。如果我们要把这一过程应用到任意多步,就需要假定“参与者是理性的”是共同知识。这意味着,我们不仅需要假定所有参与人是理性的,还要假定所有参与人都知道所有参与人是理性的,还需要假定所有参与人都知道所有参与人都知道所有参与人是理性的,如此等等,以至无穷。第14页/共48页第二个缺陷在于这一方法对博弈结果的预测经常是不精确的。例如,在下图1.1.4中的博弈中,就没有可以剔除的严格劣战略。既然所有战略都经得住对严格劣战略的重复剔除,该方法对分析博弈将出现什么结果毫无帮助。第15页/共48页1.1.C 纳什均衡的导出和定义下面我们介绍纳什均衡,它是一种博弈的解的概念,可以对非常广泛类型的博弈作出
8、严格得多的预测。导出纳什均衡的途径之一,是证明:如果博弈论可以为博弈问题提供一个惟一解,此解一定是纳什均衡。原因如下:第16页/共48页设想在博弈论预测的博弈结果中给每个参与者选定各自的战略。为使该预测是正确的,必须使参与者自愿选择理论给他推导出的战略。这样,每一参与者要选择的战略必须是针对其他参与者选择战略的最优反应。这种理论推测结果可以叫做“战略稳定”或“自动实施”的,因为没有参与人愿意独自离弃他所选定的战略。我们把这一状态称为纳什均衡。第17页/共48页纳什均衡的定义:定义 在n个参与者标准式博弈G=S1,Sn;u1,un中,如果战略组合s*1,s*n满足对每一参与者i,si*是(至少不
9、劣于)他针对其他n-1个参与者所选战略s*1,s*i-1,s*i+1,s*n 的最优反应战略,则称战略组合s*1,s*n 是该博弈的一个纳什均衡。即:ui(s*1,s*i-1,s*i,s*i+1,s*n)ui(s*1,s*i-1,si,s*i+1,s*n)对所有Si中的si都成立,亦即s*i是以下最优化问题的解:第18页/共48页纳什均衡与协议的理念和纳什均衡推导密切相关的是协议的理念:对给定的博弈,如果参与者之间要商定一个协议决定博弈如何进行,那么一个有效的协议中的战略组合必须是纳什均衡的战略组合,否则,至少有一个参与人会不遵守该协议。为更准确地理解纳什均衡这一概念,下面求解几个例题。第19
10、页/共48页寻找纳什均衡的方法:划线法一个最直接办法就是:简单查看每一个可能的战略组合是否符合定义中不等式的条件。在两人博弈中,这一方法开始的程序如下:对每一个参与者,并且对该参与者每一个可选战略,确定另一参与者相应的最优战略。图1.1.5中,就把图1.1.4所示博弈作了上述处理,对参与者i的每一个可选战略,在参与者j使用最优反应战略时的收益下面划了横线。如果在一对战略中,每一参与人的战略都是对方战略的最优反应战略,则双变量矩阵相应单元的两个收益值下面都被划了横线)。第20页/共48页第21页/共48页第22页/共48页猪圈里一头大猪和一头小猪。圏的一头有一槽,另一头一按钮,控制食量。按一下进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完全 信息 静态 博弈 基础理论
限制150内