中级微观经济学博弈论.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《中级微观经济学博弈论.ppt》由会员分享,可在线阅读,更多相关《中级微观经济学博弈论.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九讲 博弈论1博弈论n n 完全信息静态博弈:纳什均衡n n 完全信息动态博弈:子博弈精炼纳什均衡n n 不完全信息静态博弈:贝叶斯纳什均衡n n 不完全信息动态博弈:精炼贝叶斯均衡2博弈的分类及对应的均衡概念静态静态动态动态完全信息完全信息完全信息静态博弈;完全信息静态博弈;纳什均衡;纳什均衡;纳什(纳什(1950 1950,1951 1951)完全信息动态博弈;完全信息动态博弈;子博弈精炼纳什均衡;子博弈精炼纳什均衡;泽尔腾(泽尔腾(1965 1965)不完全信息不完全信息不完全信息静态博弈;不完全信息静态博弈;贝叶斯纳什均衡;贝叶斯纳什均衡;海萨尼(海萨尼(1967-1968 1967
2、-1968)不完全信息动态博弈;不完全信息动态博弈;精炼贝叶斯纳什均衡;精炼贝叶斯纳什均衡;泽尔腾(泽尔腾(1975 1975),),Kreps Kreps 和 和Wilson Wilson(1982 1982),),Fudenberg Fudenberg 和 和Tirole Tirole(1991 1991)行动顺序信息3博弈论与策略行为(1):学科概念n n博弈论(博弈论(Game TheoryGame Theory)又名对策论,游戏论。顾名)又名对策论,游戏论。顾名思义,是一门研究互动关系的游戏中参与者各自选择思义,是一门研究互动关系的游戏中参与者各自选择策略的科学,换言之,是研究机智而
3、理性的决策者之策略的科学,换言之,是研究机智而理性的决策者之间冲突及合作的学科。博弈论把这些复杂关系理论化,间冲突及合作的学科。博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导以便分析其中的逻辑和规律,并对实际决策提供指导或借鉴。或借鉴。n n一个所谓游戏至少需要三个要素:(一个所谓游戏至少需要三个要素:(11)博弈或游戏)博弈或游戏参加者。博弈论分析假定参与者都是机智而理性的。参加者。博弈论分析假定参与者都是机智而理性的。(22)行动或策略空间。博弈参与者必须知道他自己)行动或策略空间。博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间及其对手伙
4、伴的策略选择范围,并了解各种策略之间的因果关系。(的因果关系。(33)有可评价优劣高下的决策行为结)有可评价优劣高下的决策行为结果。博弈论用数字表示这类结果,并称之为支付果。博弈论用数字表示这类结果,并称之为支付(Payoff).Payoff).上述上述33部分描述了一个博弈的规则或结构。部分描述了一个博弈的规则或结构。4博弈论与策略行为(2):支付矩阵n n 可以用支付矩阵(可以用支付矩阵(Payoff Matrix Payoff Matrix,又称得益矩阵,收益矩阵,赢,又称得益矩阵,收益矩阵,赢得矩阵等)来描述一个博弈结构。下面这个简单的支付矩阵中,得矩阵等)来描述一个博弈结构。下面这个
5、简单的支付矩阵中,有两个参与者厂商 有两个参与者厂商A A 和厂商 和厂商B B;它们各自可以选择两种策略,分 它们各自可以选择两种策略,分别用 别用“左右 左右”和 和“上下 上下”来标识(它们可以表示生产或不生产 来标识(它们可以表示生产或不生产某种商品,提高或不提高价格,做不做广告的选择等);数字 某种商品,提高或不提高价格,做不做广告的选择等);数字表示双方在不同策略选择组合下各自得到的支付,较大数字代 表示双方在不同策略选择组合下各自得到的支付,较大数字代表较大利益或效用。例如,在厂商 表较大利益或效用。例如,在厂商A A 和 和B B 分别选择上和左代表的 分别选择上和左代表的策略
6、时,左上角方框的数字 策略时,左上角方框的数字“1“1,2”2”表示 表示A A 和 和B B 分别得到的支付。分别得到的支付。同理,同理,A A 和 和B B 分别选择策略下和右时,它们分别得到右下角方框 分别选择策略下和右时,它们分别得到右下角方框数字 数字“1“1,0”0”代表的支付。代表的支付。1,21,02,10,1左上右下厂商B厂商A5博弈论与策略行为(3):支配策略n n 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具 策能力,加上信息方面的假定,所以上述支
7、付矩阵表示的博弈具有一个简单而确定的结果。从厂商 有一个简单而确定的结果。从厂商A A 角度来说,它采取策略 角度来说,它采取策略“下 下”而得到的支付总是好于 而得到的支付总是好于“上 上”(2 2,1 1 分别对 分别对1 1,0 0)。同样,对)。同样,对于 于B B 来说,选择策略 来说,选择策略“左 左”得到的利益总是优于 得到的利益总是优于“右 右”(1 1,2 2 分 分别对 别对0 0,1 1)。因此,我们可以确定预期均衡选择策略是)。因此,我们可以确定预期均衡选择策略是A A 选择 选择“下 下”而 而B B 选择 选择“左 左”的策略。的策略。n n 这一博弈中每个参与者都
8、存在一个支配策略(这一博弈中每个参与者都存在一个支配策略(Dominant Strategy Dominant Strategy,又称占优或超优策略,又称占优或超优策略)。不管其它参与者如何选择,每个局中 不管其它参与者如何选择,每个局中人自有的那个最优选择称作支配策略,由此实现的均衡是支配均 人自有的那个最优选择称作支配策略,由此实现的均衡是支配均衡(又称 衡(又称 占优或超优均衡)占优或超优均衡)。1,21,02,10,1左上右下厂商B厂商A6博弈论与策略行为(4):囚徒困境n n 下面支付矩阵表示著名的 下面支付矩阵表示著名的“囚徒困境(囚徒困境(Prisoners Dilemma)”P
9、risoners Dilemma)”游戏。游戏。从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯 从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯A A,B B 来说,无论对方如何选择 来说,无论对方如何选择“坦白 坦白”都是各自的最优选择。都是各自的最优选择。n n 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(持沉默,然而,由于猜忌,试图获得更大好处(3 3 个月刑期)等 个月刑期)等竞争性动机阻碍了它们达到更好的互利选择,它们面临 竞争性动机阻碍了它们达到更好的互利选
10、择,它们面临“囚徒困 囚徒困境 境”。我们将看到,寡头垄断厂商经常面临类似的困境。我们将看到,寡头垄断厂商经常面临类似的困境。n n 囚徒困境告诉我们,不满足纳什均衡的协议是无效的。囚徒困境告诉我们,不满足纳什均衡的协议是无效的。A坐3年牢B坐3年牢A坐1年牢B坐1年牢A坐10年牢B坐3个月牢A坐3个月牢B坐10年牢坦白坦白保持沉默保持沉默囚犯B囚犯A7完全信息静态博弈:纳什均衡n n 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵表示的博弈中,厂商 表示的博弈中,厂商A A,B B 在选择做广告问题上存在
11、的策略关系。其中厂商 在选择做广告问题上存在的策略关系。其中厂商A A没有支配策略。因为 没有支配策略。因为A A 的最佳决策取决于 的最佳决策取决于B B 的选择。例如,当 的选择。例如,当B B 选择做广告时,选择做广告时,A A 应当选择做广告,由此得到 应当选择做广告,由此得到10 10 而不是 而不是6 6 的支付得益;然而,当 的支付得益;然而,当B B 选择不做广告 选择不做广告时,时,A A 应当选择不做广告,从而得到 应当选择不做广告,从而得到20 20 而不是 而不是15 15 的支付得益。假定两个厂商需 的支付得益。假定两个厂商需要同时决策,要同时决策,A A 应当如何决
12、策?应当如何决策?n n 解答这一问题,解答这一问题,A A 需要把自己放在 需要把自己放在B B 的位置,从 的位置,从B B 的角度看什么是最好的选择,的角度看什么是最好的选择,并在此基础上考虑自己的选择。支付矩阵表明 并在此基础上考虑自己的选择。支付矩阵表明B B 有一个支配策略:不论 有一个支配策略:不论A A 选择 选择如何,如何,B B 选择做广告时利益较大(选择做广告时利益较大(5 5,8 8 对 对0 0,2 2),因而),因而A A 可以判断 可以判断B B 会选择做 会选择做广告。而在 广告。而在B B 做广告时,做广告时,A A 应当选择做广告。因而,均衡结局是双方都做广
13、告。应当选择做广告。因而,均衡结局是双方都做广告。10,520,26,815,0做广告不做广告厂商B厂商A做广告不做广告8完全信息静态博弈:纳什均衡n n 上述均衡结果被称作纳什均衡 上述均衡结果被称作纳什均衡(The Nash Equilibrium)(The Nash Equilibrium)。纳什均衡。纳什均衡指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳 指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不变换策略选择,任何单个参与 什均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高他的所获支付。美国数学
14、家 者不可能单方面通过变换策略来提高他的所获支付。美国数学家和统计学家纳什(和统计学家纳什(Nash)50 Nash)50 年代提出这一概念,所以称作纳什均 年代提出这一概念,所以称作纳什均衡。衡。n n 在上面广告策略关系事例中,给定厂商 在上面广告策略关系事例中,给定厂商B B 做广告的策略,做广告的策略,A A 所能 所能做的一个最好选择是做广告;而当 做的一个最好选择是做广告;而当A A 做广告时,做广告时,B B 的选择仍是它 的选择仍是它能做的最好的。因而,纳什均衡条件得到满足。能做的最好的。因而,纳什均衡条件得到满足。n n 它与支配策略均衡的区别在于:在纳什均衡下,它与支配策略
15、均衡的区别在于:在纳什均衡下,“我(你)所做 我(你)所做的是 的是 给定 给定 你(我)的选择我(你)所能做的最好的 你(我)的选择我(你)所能做的最好的”,而支配均,而支配均衡下,衡下,“我(你)所做的是 我(你)所做的是 不论 不论 你(我)的选择我(你)所能做 你(我)的选择我(你)所能做的更好的 的更好的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配。支配均衡必然是纳什均衡,但纳什均衡未必是支配均衡。均衡。9完全信息静态博弈:纳什均衡n n 一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策 一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略),有时又可能不存在纳什均
16、衡。下面左表存在两个纳什均衡:略),有时又可能不存在纳什均衡。下面左表存在两个纳什均衡:其中 其中“上,左 上,左”是纳什均衡(是纳什均衡(A A 选上,则 选上,则B B 选左;且 选左;且B B 选左时 选左时A A 仍 仍应选上);应选上);“下,右 下,右”也是纳什均衡(也是纳什均衡(A A 选下,则 选下,则B B 选右;且 选右;且B B 选 选右时 右时A A 仍应选下)。如没有更多信息,则无法判断均衡在什么位 仍应选下)。如没有更多信息,则无法判断均衡在什么位置。右表没有纳什均衡。如 置。右表没有纳什均衡。如A A 选 选“上 上”,B B 则选 则选“左 左”;然而当;然而当
17、B B选 选“左 左”时,时,A A 却应当选 却应当选“下 下”。反之,。反之,A A 选 选“下 下”时,时,B B 应选 应选“右 右”;然而当;然而当B B 选右时,选右时,A A 又应选 又应选“上 上”。没有均衡点。没有均衡点。2,11,20,00,0左上右下局中人B局中人A(左)0,0-1,31,00,-1左上右下局中人B局中人A(右)10纳什均衡举例:智猪博弈n n在这一例子中,无论大猪选择在这一例子中,无论大猪选择“按按”还是还是“等待等待”,小猪都有一个占优策略,小猪都有一个占优策略“等待等待”。在给定小。在给定小猪选择猪选择“等待等待”的条件下,打住的最优选择只能的条件下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中级 微观经济学 博弈论
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内