2022年电大博弈与决策作业- .pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2022年电大博弈与决策作业- .pdf》由会员分享,可在线阅读,更多相关《2022年电大博弈与决策作业- .pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 博弈与决策平时作业参考答案(1)一、名词解释1 博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。2完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。3静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。4动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。5非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
2、6纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。7纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。8纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。二、请用剔除劣势策略的方法寻找以下博弈的最优策略。要求 : (1)写出剔除的步骤或顺序;(2)画出相应的剔除线; (3)给出最优的博弈结果。乙坦白抵赖甲坦白-3 -3 -5 0 抵赖0 -5 -
3、1 -1 答: (1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。注:步骤( 1) (2)颠倒亦可 百事可乐低价高价可口可乐低价3 3 1 6 高价6 1 5 5 答: (1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 14 页 - - - - - - - - - 2 (2
4、)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列;(3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。注:步骤( 1) (2)颠倒亦可 员工乙L M R 员工甲U 1 1 2 2 1 0 C 3 0 1 0 0 2 D 2 0 3 1 0 1 答: (1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R”所对应的列;(2)对员工甲而言,在员工乙剔除R 策略之后, C 策略是劣势策略,用横线划去“C”所对应的行;(3)对员工乙而言,此时劣势的策略是L,用竖线划去“ L”所对应的列;(4)对员工甲而言,此时劣势的策略是D,用竖线划去“ D”所对应的行;(5)余下的策略组
5、合是(U,M) ,这就是该博弈的最优结果。三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均衡。要求 : (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。2 号厂商X Y 1 号厂商A 4 10 1 10 B 4 7 1 7 答: (1)下划线如图所示;(2)只形成一个纯策略纳什均衡,即(A,X) 。(3)博弈的结果为(10,4) ,即 1 号厂商获得10 单位支付, 2 号厂商获得4 单位支付。(4)按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒 2 号厂商X Y 1 号厂商A -1 1 1 -1 名师资料总结
6、- - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 14 页 - - - - - - - - - 3 B 1 -1 -1 1 答: (1)下划线如图所示;(2)没有形成一个纯策略纳什均衡。(3)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒 2 号厂商W X Y 1 号厂商A 3 7 2 0 5 4 B 6 8 2 2 5 0 答: (1)下划线如图所示;(2)形成两个纯策略纳什均衡,即(A,Y)和( B,W) 。(3)博弈的结果有两个: (4,5
7、) ,即 1 号厂商获得 4 单位支付, 2 号厂商获得5 单位支付;(8,6) ,即 1 号厂商获得 8 单位支付, 2号厂商获得6 单位支付。(4)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒 四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈,并简要解释理由。乙坏心好心甲坏心12 10 2 50 好心60 12 39 100 图 1-1 乙坏心好心甲坏心12 10 0 110 好心50 0 39 100 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - -
8、 - - 第 3 页,共 14 页 - - - - - - - - - 4 图 1-2 乙坏心好心甲坏心20 10 0 30 好心30 0 12 11 图 1-3 答: (1)利用下划线法找出博弈的纳什均衡,如图所示。(2)囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择,参与者之间会选择相互“坏心”,而且对双方而言,(好心,好心)的结果一定要比(坏心,坏心)更好。(3)在三个博弈中, 图 1-1 不是囚徒困境博弈,因为参与者甲在选择“好心” (即合作) 策略时才能实现均衡。图 1-2 所示的博弈为囚徒困境博弈,因为参与者只有在都选择“坏心”(即不合作)策略时才能实现均衡。图1-32
9、所示的博弈也不是囚徒困境博弈,因为对乙而言,(坏心,坏心)的结果比(好心,好心)的结果有利。五、博弈分析假设你所在的公司现在的发展虽然还可以,但是未来前景不容乐观,所以老板只能对一个人加薪。如果你和你的同事之间只有一个人提出来加薪的请求,老板会考虑为提出要求的这个员工加薪,当然不会对那个没有提出来的员工加薪了。但是假如你和你的同事两个人一起提出来要加薪,那么老板就只有选择同时辞退你们俩。请给出这个博弈的矩阵分析图,并解释你最优的策略。答:该博弈矩阵如下:同事要求不要求你要求被辞退被辞退无影响加薪不要求加薪无影响无影响无影响根据下划线方法,在这个博弈中,我们可以找到两个纳什均衡,即(要求,不要求
10、)和(不要求,要求)。这个结果说明,你和同事只能一方提出加薪的要求才可以,同时选择要求加薪的行动只会带来最坏的结果都被辞退。换句话说, 你要想获得福利的改进,就应该先行一步提出来加薪的要求。而假如你看到你的同事首先选择了要求加薪的策略之后,你最好不再提出来这样的要求。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 14 页 - - - - - - - - - 5 博弈与决策平时作业参考答案(2)一、名词解释1不确定性:就是指经济行为者在事先不能准确地知道自己的某种决策的结
11、果,或者说,只要经济行为主体的一种决策的可能结果不止一种,就会产生不确定性。2最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最大的策略。3混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。4支付均等法:当一个参与者在均衡中应用一个混合策略时,他所得到的支付必须与他在混合策略中所应用的每一个纯策略的支付相同。5子博弈:如果从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。6逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去
12、,逐步向前倒推以求解动态博弈均衡,这就是逆向归纳法。7承诺:就是对愿意与你合作的人给予回报的方式。8空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没有好处,这就不可信了, 这叫做“空洞威胁”。二、请用最大期望收益法寻找最优策略。要求 : (1)写出计算步骤; (2)给出最优的策略结果。甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1 所示。两家企业都知道自己在各个策略组合下的收益情况,但是并不知道对方的收益。假设甲采取U 的概率为 0.3,乙采取 R 的概率为0.6。乙L R 甲U 1 2 4 3 D 4 4 2 1 答: (1)当乙采取 R
13、策略的可能性为0.6 时,采取 L 策略的可能性为0.4,那么甲据此判断采取自己的策略U 时所 获得 的 可 能 的 期 望 收 益EU(U)=0.6 2+0.4 3=2.4。 甲 采 取自 己 的策 略D 时 所 获 得 的 可 能 的期 望 收益EU(D)=0.6 4+0.4 1=2.8。很显然,甲应该选择策略D,因为 EU(D) EU(U)。(2)当甲采取 U 策略的可能性为0.3 时,采取 D 策略的可能性为0.7,那么乙据此判断采取自己的策略L 时所 获 得 的 可能 的 期 望 收 益EU(L)=0.3 1+0.7 4=3.1。 乙 采 取 自己 的 策 略R 时 所 获 得 的可
14、 能 的 期 望 收 益EU(R)=0.3 4+0.7 2=2.6。很显然,乙应该选择策略L,因为 EU(L) EU(R)。(3)最终该博弈的结果就是(D,L) ,均衡的支付为(4,4) 。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 14 页 - - - - - - - - - 6 三、求解以下博弈的所有纳什均衡。要求 : (1)写出计算步骤; (2)给出所有纳什均衡策略。曹操华容道其它路关羽华容道-2 2 3 -2 其它路1 -2 -1 2 答: (1)对该博弈矩阵
15、利用下划线法,发现没有纯策略纳什均衡。(2)假设关羽选择华容道的概率为p,选择另外一条道的概率为1-p;也假设曹操选择华容道的概率为q,选择另外一条道的概率为1-q。根据支付均等法:对关羽而言, U华容道= U其他路,即 2 q+(-2) (1-q)= (-2)q+2 (1-q),可以得到q=1/2。对于曹操而言, V华容道= V其他路,即(-2) p+1 (1-p)=3 p+(-1) (1-p),可以得到p=2/7。该博弈的混合纳什均衡为(2/7,1/2) 。2 号厂商X Y 1 号厂商A 10 10 4 1 B 1 4 5 5 答: (1)对该博弈矩阵利用下划线法,发现有两个纯策略纳什均衡
16、(A,X)和( B,Y) 。(2)假设 1 号厂商选择 A 的概率为 p,选择 B 的概率为 1-p;也假设 2 号厂商选择X 的概率为 q,选择 Y 的概率为 1-q。根据支付均等法:对 1 号厂商而言, UA= UB,即 10 q+1 (1-q)=4 q+5 (1-q),可以得到q=2/5。对 2 号厂商而言, VX= VY,即 10 p+1 (1-p)=4p+5 (1-p),可以得到p=2/5。该博弈的混合纳什均衡为(2/5,2/5) 。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - -
17、- 第 6 页,共 14 页 - - - - - - - - - 7 四、请用逆向归纳法分析以下博弈的可能结果。答: (1)逆向归纳法画图如图所示。(2)可能的均衡路径为AU,1 号参与者选A,2 号参与者选U,结果为( 20,20) ,双方各得到20 单位的报酬。(3)CY 路径上的报酬( 1000,1000)远大于AU 路径上的( 20,20) ,但是并不能成为均衡。因为如果 1 号参与者选择了C,2 号参与者选择Z 就可以获得做大的报酬,并使1 号只能获得0 单位报酬。 1 号参与者并不能保证2 号参与者会选择Z,而且 2 号即使有这种保证也是不可信的。五、寻找可信的威胁。假如有两个博弈
18、参与者,2 号威胁 1 号说,假如 1 号参与者对他使坏心,他就会对1 号参与者也使坏心。那么在以下哪些博弈图中,1 号会相信 2 号的威胁?图 2-1 图 2-2 1 号参与者2 号参与者好心坏心好心坏心(7,7)(20,3)(4,4)1 号参与者2 号参与者A U (0,0)(20,20)V W (15,15)(10,10)X Y (0,1100)(1000,1000)Z 2 号参与者2 号参与者B C 1 号参与者2 号参与者好心坏心好心坏心(5,5)(20,1)(2,2)1 号参与者2 号参与者好心坏心好心坏心(9,9)(20,2)(1,1)名师资料总结 - - -精品资料欢迎下载 -
19、 - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 14 页 - - - - - - - - - 8 图 2-3 答: (1)对三个博弈图利用逆向归纳法分析,如图所示。(2)只有当坏心比好心对2 号参与者更有利时,2 号所提出的威胁才可信。(3)在图 2-1 和 2-2 中的威胁才可信。 因为如果 1 号选择坏心的话, 2 号选择坏心才是最优的,所以威胁可信。(4)在图 2-3 中, 2 号所提出的威胁不可信。因为如果1 号选择坏心的话,2 号选择好心才是最优的,不会选择坏心的。六、博弈分析1假设你是公司的管理者,某天
20、有位员工向你提出加薪的要求,但是你既不舍得他辞职,也暂时不想给他加薪,那么你该如何巧妙地回绝呢?答:你应该告诉他,加薪这事不属于你管,有专门的部门或其他领导负责。所以,你对此无能为力,因为你对此事没有决定权。而一旦知道自己要和这样的人力资源部门去博弈了,这位员工的立场就会发生变化,也许就会软化下来。2 (1)如果一个男孩子给女孩发短信说:“亲爱的,你知道我爱你爱得很深,我愿意为你赴汤蹈火,我每天每时每刻都很想见到你,什么艰难险阻也不能阻止我向你靠近。周五下班的时候,如果不下雨, 我就一定过去找你! ” 。 (2)有一位父亲对自己很淘气的儿子说“你再不听话,我就拧掉你的耳朵!”请你分析一下这两个
21、场景中的“承诺”和“威胁”是否值得信赖。答: (1)中的男孩对女孩的“承诺”是不可信的,因为“下雨”是一件成本很小的事,但是男孩却因此不能去做他所说的“每天每时每刻都很想见到你,什么艰难险阻也不能阻止我向你靠近”。所以,廉价的承诺是不可置信的。(2)中的父亲的“威胁”是不可置信的“空洞威胁”。因为拧掉儿子的耳朵对他并没有任何好处,还会因此带来更大的负担,也影响了孩子的一生,父亲也要为此背负一辈子的心理成本和经济成本。对孩子而言,这也是一生的不良影响和沉重的心理负担,以及巨大的机会成本。显然这个威胁这对整个家庭没有任何好处。所以,这个威胁根本不可置信。名师资料总结 - - -精品资料欢迎下载 -
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年电大博弈与决策作业- 2022 电大 博弈 决策 作业
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内