《对策与决策》PPT课件.ppt
《《对策与决策》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《对策与决策》PPT课件.ppt(114页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、对策与决策第一部分 对策论背景n冯诺依曼(Von Neumann),摩根斯坦恩(Morgenstern)(1944),博弈论和经济行为(The Theory of Games and Economic Behavior)。标志着博弈理论的初步形成nNash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下。定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石。第一章 导论1.什么是博弈论n定定义义:关于包含相互依存情况中理性行为的研究。n目的:决策,合理的预测n思想:有限性,东方性 妻子 B F B 丈夫 F1,2 0,00,0 2,1性别战
2、(battle of sexes)腐败问题的博弈分析 政府 监督 不监督 受贿 官员 不受贿R-F,F-C-SR,-S0,-C0,0贸易自由化的博弈分析 乙国 自由化 保护 自由化 甲国 保护10,10-10,2020,-10-5,-5大户与散户的博弈模型 散户 分析并进入 跟随大户进入 分析并进入大户 跟随散户进入0.7p-c,0.3p-c0.7p-c,0.3p0.7p,0.3p-c0,0国有股减持 投资者 支持 不支持 减持 国有股东 不减持5,-6-8,-2-3,-1-5,0机构投资者之间的博弈分析 机构乙 合作 不合作 合作 机构甲 不合作0.5,0.5双方获利均为溢价的一半0,1乙获
3、全部溢价1,0甲获全部溢价0,0双方获利均为零货币政策目标的博弈分析 企业 增加投资 不增加投资 增加货币供给中央银行 不增加货币供给0,2通货膨胀率10%经济增长率5%2,1通货膨胀率0%经济增长率10%-1,0通货膨胀率10%经济增长率0%1,3通货膨胀率0%经济增长率5%上市公司虚假信息披露行为的博弈分析发现()F-C+E,-F-D-C,0未发现(1-)-C,E-D0,E-D0,0证券监管机构上市公司 造假 不造假检查不检查E:造假行为对上市公司的额外收益;F:监管机构发现公司造假后的惩罚;C:监管机构的检查成本;D:上市公司造假的成本;:监管机构成功查实公司造假行为之概率。2.博弈要素
4、n局中人n策略纯策略空间Si=Si1,Si2,Sikin盈利(支付)函数(payoff function):Ui(s)3.博弈的分类n从信息的角度:完全信息、不完全信息n从局中人行动的先后次序:静态博弈、动态博弈n完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈第二章 策略型博弈与Nash均衡1.博弈的策略型n两人零和游戏(猜谜游戏)局中人2 1 2 局中人11,-1-1,1-1,11,-112n定定义义:n人博弈策略型表示指定了n个局中人的纯策略空间,以及对应每个策略组合的盈利函数U1,U2,Un,可将该博弈表示为:G=S1,S2,Sn;U1,U2,Un2.混合策略n猜谜
5、游戏无纯策略解n设甲的策略为(p,1-p)乙的策略为(q,1-q)n对于甲来说,如果乙伸一个指头,期望盈利为:p+(-1)(1-p)=2p-10p0.5如果乙伸两个指头,期望盈利为:-p+(1-p)=-2p+10 p0.5n因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-1n定定义义:局中人i(i=1,2,n)中的一个混合 策 略 是 该 局 中 人 的 纯 策 略 空 间Si=(si1,si2,siki)上的一个概率分布,可用i来表示。所有n个局中人各自的混合策略1,2,n是独立的。n个混合策略构成的=1,2,n是一个策略组合(策略剖面,profile)。ni(si j
6、)表示第i个局中人混合策略i在纯策略si j上的概率,因此局中人i在混合策略上的期望盈利为:算例 局中人2 L M R U局中人1 M D4,35,16,22,18,43,63,09,62,8n局中人1的混合策略:1=(1(U),1(M),1(D)=(1/3,1/3,1/3)n局中人2的混合策略:2=(2(U),2(M),2(D)=(0,1/2,1/2)n策略组合:=(1,2)4,35,16,22,18,43,63,09,62,8局中人1策略组合的期望盈利为:U1()=4*1/3*0+5*1/3*1/2+6*1/3*1/2+2*1/3*0+8*1/3*1/2+3*1/3*1/2+3*1/2*0
7、+9*1/3*1/2+2*1/3*1/2=11/2n局中人1的混合策略:1=(1(U),1(M),1(D)=(1/3,1/3,1/3)n局中人2的混合策略:2=(2(U),2(M),2(D)=(0,1/2,1/2)n策略组合:=(1,2)4,35,16,22,18,43,63,09,62,8局中人2策略组合的期望盈利为:U2()=3*1/3*0+1*1/3*1/2+2*1/3*1/2+1*1/3*0+4*1/3*1/2+6*1/3*1/2+0*1/2*0+6*1/3*1/2+8*1/3*1/2=9/23.累次严优(iterated dominance)n隐含着Nash均衡的思想 局中人2 L
8、M R U局中人1 M D4,35,16,22,18,43,63,09,62,8 局中人2 L M R4562833923121460684,35,16,22,18,43,63,09,62,8局中人1 局中人2 L R U局中人1 M D 局中人2 L R局中人1 U4,36,22,13,63,02,84,36,2312146068n合理,符合逻辑的过程,得到累次严优的解为:局中人2 L 局中人1 Un累次严优的局限性 4,3严劣纯策略n定义定义:对局中人i的某个纯策略si,如果存在混合策略i*,使得s-i S-iUi(i*,s-i)Ui(si,s-i)且在S-i中至少存在一个纯策略组合s-i
9、*S-i,使上式中的不等号严格成立Ui(i*,s-I*)Ui(si,s-I*)则称纯策略si为局中人i的弱劣纯策略。如果对一切s-i S-I,上式中的不等式严格的成立Ui(i*,s-i)Ui(si,s-i)s-i S-i 则称si为局中人i的严劣纯策略。4.累次严优的应用n囚徒困境 乙 坦白 抗拒 坦白 甲 抗拒-8,-8 0,-15-15,0-1,-1n虽然(坦白,坦白)是累次严优的解,但不是有效解。n定义定义:如果不存在其他的结局,使得某些局中人的效用(盈利)比在这个结果的效用好,同时又不会使其他局中人的效用变的更差,则称博弈的这个结局是有效的。n(抗拒,抗拒)是有效的,但不是博弈的解。n
10、个体理性并非一定导致集体理性。5 Nash均衡寻找纯策略Nash均衡的方法:划线法a,eb,fc,gd,ha,eb,fc,gd,ha,eb,fc,gd,ha,eb,fc,gd,ha,eb,fc,gd,h 妻子 B F B 丈夫 F1,2 0,00,0 2,1性别战(battle of sexes)贸易自由化的博弈分析 乙国 自由化 保护 自由化 甲国 保护10,10-10,2020,-10-5,-5国有股减持 投资者 支持 不支持 减持 国有股东 不减持5,-6-8,-2-3,-1-5,0机构投资者之间的博弈分析 机构乙 合作 不合作 合作 机构甲 不合作0.5,0.5双方获利均为溢价的一半0
11、,1乙获全部溢价1,0甲获全部溢价0,0双方获利均为零n猜谜游戏无纯策略解n设甲的策略为(p,1-p)乙的策略为(q,1-q)n固定乙的混合策略(q,1-q),则甲的期望盈利为:pq+(1-p)(1-q)-p(1-q)-q(1-p)=1+4pq-2p-2q要使甲的收益达到最大:4q-2=0q=0.5n同理可得:p=0.5n因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-1寻找混合策略Nash均衡的方法p1-pq1-q第三章 矩阵博弈1、矩阵博弈的模型n二人有限零和博弈就是矩阵博弈,是指只有两个参加博弈的局中人,每个局中人都只有有限个策略可供选择。在任一局势下,两个局中人的
12、支付之和总是为零,即双方的利益是激烈对抗的。n最优策略 博弈的值为2n我们发现有四个局势都是博弈的解,且解为5两个性质n无差别性。如果(ki1,lj1)和(ki2,lj2)是博弈的两个解,则ai1j1=ai2j2。n可交换性。如果(ki1,lj1)和(ki2,lj2)是博弈的两个解,则(ki1,lj2)和(ki2,lj1)也是解。鞍点的定义2、矩阵博弈的定理n我们应用定理1可以得到方程组3、矩阵博弈的解法n公式法n图解法n方程组法n线性规划方法n线性规划方法n用线性规划方法求解支付矩阵为A的矩阵博弈n解上述方程组得到决策分析n第1节 决策的分类n第2节 决策过程n第3节 不确定型的决策n第4节
13、 风险决策第1节 决策的分类n1.按性质的重要性分类:可将决策分为战略决策、策略决策和执行决策,或叫战略计划、管理控制和运行控制。n2.按决策的结构分类:分为程序决策和非程序决策。n3.按定量和定性分类:分为定量决策和定性决策,描述决策对象的指标都可以量化时可用定量决策,否则只能用定性决策。总的发展趋势是尽可能地把决策问题量化。n4.按决策环境分类:可将决策问题分为确定型的、风险型的和不确定型的三种。n 5.按决策过程的连续性分类:可分为单项决策和序贯决策。第2节 决 策 过 程构造人们决策行为的模型主要有两种方法:一种是面向决策结果的方法;另一种是面向决策过程的方法。面向决策结果的方法认为:
14、若决策者能正确地预见到决策结果,其核心是决策的结果和正确的预测。通常的单目标和多目标决策是属这类型的。面向决策过程的方法认为:n若决策者了解了决策过程,掌握了过程和能控制过程,他就能正确地预见决策的结果。对于面向决策结果的方法的程序比较简单,见图15-1。由上图可知,任何决策都有一个过程和程序,绝非决策者灵机一动拍板就行。面向决策过程的方法一般包括:预决策决策决策后三个互相依赖的阶段。决策问题的要素构成:(1)决策者,他的任务是进行决策。决策者可以是个人、委员会或某个组织。一般指领导者或领导集体。n(2)可供选择的方案(替代方案)、行动或策略。参谋人员的任务是为决策者提供各种可行方案。n(3)
15、准则是衡量选择方案,包括目的、目标、属性、正确性的标准,在决策时有单一准则和多准则。n(4)事件是指不为决策者所控制的客观存在的将发生的状态。n(5)每一事件的发生将会产生某种结果,如获得收益或损失。n(6)决策者的价值观,如决策者对货币额或不同风险程度的主观价值观念。第3节 不确定型的决策所谓不确定型的决策是指决策者对环境情况一无所知。这时决策者是根据自己的主观倾向进行决策,由决策者的主观态度不同基本可分为四种准则:悲观主义准则乐观主义准则等可能性准则最小机会准则例1n设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元。若每月生产的产品当月销售不完,则每件损失1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对策与决策 对策 决策 PPT 课件
限制150内