博弈论中的经典分析及启示囚徒困境优秀PPT.ppt
《博弈论中的经典分析及启示囚徒困境优秀PPT.ppt》由会员分享,可在线阅读,更多相关《博弈论中的经典分析及启示囚徒困境优秀PPT.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、引引 言言 20世纪90年头至2008年,诺贝尔经 济学奖五次(1994,1996,2001,2005,2007)授予了与博弈论相关的探讨领域,总共有十位经济学家获奖,是获奖人数最多的领域(排在其次位的是金融)。博弈论探讨的最大特点一般决策探讨(数学表达):Y f(x1,x2,xn)博弈论的决策探讨(数学表达):Y f(x1,x2,xn,z)(z为他人行为)特点:决策者目标函数的自变量中包含他人行为。严格地讲,博弈论是一种方法,应用范围不仅包括经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学,都涉及到博弈论。事实上,不少人把博弈论看成是数学的一个分支。纳什1951年的奠基性文章就是发
2、表在数学杂志上。夏普里1953年的文章本身也是一篇数学手稿。一、博弈论基础学问一、博弈论基础学问 1.博弈论的基本概念博弈论的基本概念 “博弈论”译自英文“Game Theory”。直译:“游戏理论”。游戏有下列特征:游戏有下列特征:(1)都有规则。都有规则。(2)都有结果(赢、输、平),结果能折算成都有结果(赢、输、平),结果能折算成数值。数值。(3)都有策略或者说计谋,选择不同的策略或都有策略或者说计谋,选择不同的策略或计谋计谋 往往带来不同的结果。往往带来不同的结果。(4)策略和利益有相互依存性,即每一个游戏策略和利益有相互依存性,即每一个游戏者所者所 得结果的好坏,不仅取决于自身的策略
3、选得结果的好坏,不仅取决于自身的策略选择,择,也取决于其他参与者的策略选择。也取决于其他参与者的策略选择。策略本身常常没有确定的好坏之分,只有相策略本身常常没有确定的好坏之分,只有相对于对于他方策略的相对好坏。他方策略的相对好坏。博弈论也称为“对策论”。其实并不是很恰当。因为“对策”在实际中常被用来表示具体的针对性反应方案,或站在某个决策方的立场上找针对其他方的对策。博弈论所探讨的决策问题却是有起先、有次序、有结果的整个过程。“博弈”的通俗含意不过是弈棋、赌胜,但由于它是带有文言性质的词,因而显得学术味浓一些,既能反映这门学科的特点和实质,又给人一种高深莫测的感觉。博弈的简明定义:博弈即一些个
4、人 或其他组织,面对确定的环境条件,在 确定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进 行选择并加以实施,各自取得相应结果 的过程。博弈论,是探讨决策主体的行为发 生干脆相互作用时候的决策以及这种决 策的均衡问题。博弈论探讨的对象是理性的参与者 如何选择策略或如何作出行动的确定,使自己的目标最大化。2.构成一个博弈的基本要素构成一个博弈的基本要素 博弈的七要素参与人、行动、信息、战略、支付函数、结果、均衡。参与人是博弈中选择行动以最大化自己效用的决 策主体(可以是个人、团体等);行动是参与人的决策变量;战略是参与人选择行动的规则,它告知参与人在什么时候选择什么行动;信息
5、指的是参与人在博弈中的学问,特殊是有关其他参与人(对手)的特征和行动的学问;支付函数是参与人从博弈中获得的效用水平,是每个参与人真正关切的东西;结果是指博弈分析者感爱好的要素的集合;均衡是全部参与人的最优战略或行动的组合。博弈的三要素1)博弈的参与者2)博弈方各自可选择的全部策略 或行动的集合3)博弈方的得益3.博弈的表述形式博弈的表述形式(1)标准形式(策略形式)标准形式(策略形式)被擒,中计(主观)胜利(客观)逃脱,和被擒,胜利逃脱,和守城弃城 攻城退兵诸诸葛葛亮亮司马懿司马懿捉住曹操,被捉 扑空,逃脱 扑空,逃脱 捉住曹操,被捉 华容道 大 路 华容道 大路诸诸葛葛亮亮曹曹 操操(2)扩
6、扩展形式(博弈展形式(博弈树树)诸葛亮诸葛亮司司 马马 懿懿弃城弃城守城守城进攻进攻退兵退兵 进攻进攻退兵退兵擒住擒住孔明孔明胜利胜利 和和和和 司马懿司马懿诸诸 葛葛 亮亮攻城攻城退兵退兵 守城守城弃城弃城 守城守城弃城弃城逃脱逃脱被擒被擒被擒被擒逃脱逃脱(3)联盟形式(特殊函数形式)联盟形式(特殊函数形式)4.博弈的类别博弈的类别 博弈的分类表 行动顺序信 息 静 态 动 态完全信息 完全信息静态博弈 完全信息动态博弈 不完全信息 不完全信息静态博弈 不完全信息动态博弈二、博弈论中的经典分析及启示二、博弈论中的经典分析及启示1.囚徒逆境囚徒逆境 “囚徒逆境”博弈是1950年图克(Tucke
7、r)提出的。它特别简洁,却反映了博弈的根本特征,是阐释众多经济社会问题的经典范式。警察抓住两个罪犯,分别关押,并与罪犯讲清:假如一人坦白,一人抗拒,坦白者马上释放,抗拒者判刑 8 年;若两人都坦白,按律从轻各判 5 年。罪犯知道,他们若抗拒,警察驾驭的证据只能各判 1 年。最终的结果会怎样?-5 -5,-5-5 0 0,-8-8 -8 -8,0 0 -1 -1,-1-1乙乙乙乙抗拒抗拒抗拒抗拒坦白坦白坦白坦白甲甲甲甲抗拒抗拒抗拒抗拒坦白坦白坦白坦白 -5 -5,-5-5 0 0,-8-8 -8 -8,0 0 -1 -1,-1-1乙乙乙乙抗拒抗拒抗拒抗拒坦白坦白坦白坦白甲甲甲甲抗拒抗拒抗拒抗拒坦
8、白坦白坦白坦白此博弈的“均衡”为(坦白,坦白)该均衡就是大名鼎鼎的“纳什均衡”纳什均衡:在对方策略确定的状况下,每个参与者的策略都是最好的,没有人情愿先变更自己的策略。假如博弈中的全部参与人事先达成一项协议,这个协议是否可以自动实施?若当事人都会自觉遵守这个协议,这个协议就构成纳什均衡:没有人有主动性偏离协议。换句话说,假如一个协议不构成纳什均衡,它就不行能自动实施,因为至少有一个参与人会违反这个协议。结论:一种制度支配要生效,必需是 纳什均衡。不满足纳什均衡要求的制 度没有意义。类似囚徒逆境 应试教化 公共产品供应不足(修路、公 寓楼道 的路灯)卡特尔的内在不稳定性产量限制、价格限制)商业诚
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 中的 经典 分析 启示 囚徒 困境 优秀 PPT
限制150内