北京大学博弈论课件第2章-完全信息静态博弈教案资料.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《北京大学博弈论课件第2章-完全信息静态博弈教案资料.ppt》由会员分享,可在线阅读,更多相关《北京大学博弈论课件第2章-完全信息静态博弈教案资料.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北京大学博弈论课件第北京大学博弈论课件第2 2章章-完全信息静态博弈完全信息静态博弈v在完全信息静态博弈中,博弈各参与方同时行动,在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。且对博弈相关信息完全了解。v“划横线法划横线法”是求解完全信息静态博弈的常用方法。是求解完全信息静态博弈的常用方法。v通常说来,完全信息静态博弈都存在通常说来,完全信息静态博弈都存在“纳什均衡纳什均衡”或或“混合策略纳什均衡混合策略纳什均衡”。第一节第一节 定义和求解方法定义和求解方法v一、完全信息静态博弈的定义和实例一、完全信息静态博弈的定义和实例v完全信息静态博弈指:博弈各方同时决策,任何博弈
2、参与完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。弈结果、博弈各方的策略集、收益等。v可以通过支付矩阵(可以通过支付矩阵(Payoff Matrix)寻找完全信息静)寻找完全信息静态博弈的均衡。态博弈的均衡。v以以“囚徒困境囚徒困境”为例,介绍支付矩阵的构造方法和应用。为例,介绍支付矩阵的构造方法和应用。1囚徒困境囚徒困境v在在“囚徒困境囚徒困境”博弈中,有两个博弈参与者:嫌疑人甲和博弈中,有两个博弈参与者:嫌疑人甲和嫌疑人乙。嫌疑人乙。v将嫌疑人甲标识在支
3、付矩阵左侧,将嫌疑人乙标识在支付将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方矩阵上方。v嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。甲可能的策略纵向排列在博弈支付矩阵左侧。v嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。人乙可能的策略横向排列在博弈支付矩阵上方。嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)“囚徒困境囚徒困
4、境”博弈的支付矩阵博弈的支付矩阵v矩阵左上方的(矩阵左上方的(5,5)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“坦白坦白”、嫌疑人乙选、嫌疑人乙选择择“坦白坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。表示嫌疑人乙的收益。v矩阵左下方的(矩阵左下方的(10,1)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“不坦白不坦白”、嫌疑人乙选择嫌疑人乙选择“坦白坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够
5、得到的收益。v矩阵右上方的(矩阵右上方的(1,10)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“坦白坦白”、嫌、嫌疑人乙选择疑人乙选择“不坦白不坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够得到的收益。v矩阵右下方的(矩阵右下方的(2,2)表示:当嫌疑人甲选择)表示:当嫌疑人甲选择“不坦白不坦白”、嫌、嫌疑人乙选择疑人乙选择“不坦白不坦白”时,两名嫌疑人能够得到的收益。时,两名嫌疑人能够得到的收益。2智猪博弈智猪博弈v猪栏里养了两头猪,一头大猪、一头小猪。猪栏里养了两头猪,一头大猪、一头小猪。v在猪圈的一端有一个盛食槽。在猪圈的一端有一个盛食槽。v在猪圈的另一端有一个按压式开关。在猪圈
6、的另一端有一个按压式开关。v开关每被按压一次,就有固定数量的食物出现在盛食槽中。开关每被按压一次,就有固定数量的食物出现在盛食槽中。v大猪和小猪都在思考是否去按压开关。大猪和小猪都在思考是否去按压开关。v如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为压开关的劳动却没有
7、吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为,小猪的收益为-1。v如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是下,大猪得到的收益是 4,小猪得到的收益是,小猪得到的收益是 2。v如果
8、小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收益为益为 10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益的郁闷,小猪得到收益-2。v如果大猪和小猪都不
9、去按压开关,则大猪和小猪都无法吃到食如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益物,大猪和小猪均得到收益 0。小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,-1)(4,2)等待等待(10,-2)(0,0)“智猪博弈智猪博弈”的支付矩阵的支付矩阵二、划横线法二、划横线法v1通过通过“划横线法划横线法”求解求解“囚徒困境囚徒困境”博弈的均衡博弈的均衡嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)v如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择?如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选
10、择?v理性的嫌疑人甲会选择坦白。理性的嫌疑人甲会选择坦白。v在嫌疑人甲选择坦白所对应的收益在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。的下方划一道短横线。v类似可分析其他情况类似可分析其他情况v2通过通过“划横线法划横线法”求解求解“智猪博弈智猪博弈”的均衡的均衡v如果大猪选择按开关,那么小猪应该如何选择?如果大猪选择按开关,那么小猪应该如何选择?v理性的小猪会选择等待。理性的小猪会选择等待。v在小猪选择等待所对应的收益在小猪选择等待所对应的收益“2”的下方划一道短横线。的下方划一道短横线。v类似可分析其他情况类似可分析其他情况小猪小猪按开关按开关等待等待大猪大猪按开关按开关(5,
11、-1)(4,2)等待等待(10,-2)(0,0)第二节第二节 纳什均衡纳什均衡v一、纳什均衡的定义一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者都给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为被称为“纳什均衡纳什均衡”(Nash Equilibrium)。)。v“囚徒困境囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。嫌疑人乙选择坦白)。v给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑人甲的给定嫌疑人乙在纳什
12、均衡的策略选择:坦白;嫌疑人甲的最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均最优策略就是坦白,嫌疑人甲没有动机改变自己在纳什均衡的策略。衡的策略。v给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的给定嫌疑人甲在纳什均衡的策略选择:坦白;嫌疑人乙的最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什最优策略就是坦白,嫌疑人乙也没有动机改变自己在纳什均衡的策略。均衡的策略。v“智猪博弈智猪博弈”的纳什均衡为:(大猪选择按开关,小猪选的纳什均衡为:(大猪选择按开关,小猪选择等待)。择等待)。v给定大猪在纳什均衡的策略选择:按开关;小猪的最优策给定大猪在纳什均衡的策略选择:按开关;小猪的最优策略
13、就是等待,小猪没有动机改变策略。略就是等待,小猪没有动机改变策略。v给定小猪在纳什均衡的策略选择:等待;大猪的最优策略给定小猪在纳什均衡的策略选择:等待;大猪的最优策略就是按开关,大猪没有动机改变策略。就是按开关,大猪没有动机改变策略。二、存在多个纳什均衡的博弈二、存在多个纳什均衡的博弈v1性别博弈性别博弈v采用采用“划横线法划横线法”寻找寻找“性别博弈性别博弈”的纳什均衡的纳什均衡v(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是(男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博弈性别博弈”的纳什均衡。的纳什均衡。女方女方看足球看足球听昆曲听昆曲男方男方看足球看足球
14、(10,2)(-1,-1)听昆曲听昆曲(-1,-1)(2,10)v甲、乙两人相对而行,试图通过一座独木桥。甲、乙两人相对而行,试图通过一座独木桥。v独木桥仅能容纳一人通行。独木桥仅能容纳一人通行。v如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄的独木桥,两人都会掉到河里,均得到收益的独木桥,两人都会掉到河里,均得到收益-10。v如果甲选择退让,让乙先行,那么得意的乙将得到收益如果甲选择退让,让乙先行,那么得意的乙将得到收益 20,面子受损的甲面子受损的甲 得到收益得到收益-2。v如果乙选择退让,让甲先行,那么得意的甲将得到收益如果乙
15、选择退让,让甲先行,那么得意的甲将得到收益 20,面子受损的乙得到收益面子受损的乙得到收益-2。v如果甲和乙均选择退让,那么双方均得到收益如果甲和乙均选择退让,那么双方均得到收益 10。2.“斗鸡博弈斗鸡博弈”v采用采用“划横线法划横线法”寻找寻找“斗鸡博弈斗鸡博弈”的纳什均衡的纳什均衡v(甲前行、乙退让)和(甲退让、乙前行)都是(甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈斗鸡博弈”的纳什均衡。的纳什均衡。乙乙前行前行退让退让甲甲前行前行(-10,-10)(20,-2)退让退让(-2,20)(0,0)v假设在市场中有两个竞争对手。一个是已经在市场中的假设在市场中有两个竞争对手。一个是已
16、经在市场中的“在位者在位者”,另一个是企图进入市场的另一个是企图进入市场的“潜在进入者潜在进入者”。v潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个可以选择的策略:斗争、默许。可以选择的策略:斗争、默许。v如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会使得双方均亏损,双方收益均为使得双方均亏损,双方收益均为-10。v如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可获得收益获得收
17、益 5。v如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收益为益为 0,在位者的收益为,在位者的收益为 20。v如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收益为益为 0,在位者的收益为,在位者的收益为 153“市场争夺战市场争夺战”博弈博弈v采用采用“划横线法划横线法”寻找寻找“市场争夺战市场争夺战”博弈的纳什均衡博弈的纳什均衡v(潜在进入者进入、在位者默许)和(潜在进入者不进入、在(潜在进入者进入、在位者默许)和(潜在进入者不进入、在位者斗争)都
18、是位者斗争)都是“市场争夺战市场争夺战”博弈的纳什均衡。博弈的纳什均衡。在位者在位者斗争斗争默许默许潜在进入者潜在进入者进入进入(-10,-10)(5,5)不进入不进入(0,20)(0,15)三、无法通过三、无法通过“划横线法划横线法”找到纳什均衡的博弈找到纳什均衡的博弈v1“锤头、剪刀、布锤头、剪刀、布”博弈博弈v通过通过“划横线法划横线法”无法找到无法找到“锤头、剪刀、布锤头、剪刀、布”博弈的纳什均衡。博弈的纳什均衡。参与者参与者2锤头锤头剪刀剪刀布布参与者参与者1锤头锤头(0,0)(1,-1)(-1,1)剪刀剪刀(-1,1)(0,0)(1,-1)布布(1,-1)(-1,1)(0,0)v市
19、场中有两个厂商进行产量竞争。市场中有两个厂商进行产量竞争。v市场上该商品的总产量为:市场上该商品的总产量为:Q=q1+q2。v其中:其中:Q 为总产量,为总产量,q1 为厂商为厂商 1 的产量,的产量,q2 为厂商为厂商 2 的产量。的产量。v市场的需求函数为:市场的需求函数为:P=A-Q。v其中,其中,P 为市场价格,为市场价格,A 为外生常数。为外生常数。v厂商厂商 1 的生产成本函数为:的生产成本函数为:C(q1)=cq1。其中。其中 c 为厂商为厂商 1 的边际成本,且假设厂商的边际成本,且假设厂商 1 的生产没有固定成本。的生产没有固定成本。v类似的,厂商类似的,厂商 2 的生产成本
20、函数为:的生产成本函数为:C(q2)=cq2。v厂商厂商 1 和厂商和厂商 2 通过选择各自的最优产量达到各自利润最大化通过选择各自的最优产量达到各自利润最大化的目标。的目标。2古诺寡头博弈古诺寡头博弈v在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法在古诺寡头博弈中,由于厂商可以选择的产量有无穷多种,因此无法通过通过“划横线法划横线法”求解古诺寡头博弈的均衡。求解古诺寡头博弈的均衡。v但可以通过求解两个厂商的但可以通过求解两个厂商的“反应函数(反应函数(Reaction function)”来求解寡头博弈的均衡。来求解寡头博弈的均衡。v厂商厂商 1 在决策时,假设厂商在决策时,假
21、设厂商 2 的产量为给定的产量为给定v厂商厂商 2 在决策时,假设厂商在决策时,假设厂商 1 的产量为给定的产量为给定v根据根据 ,得到,得到v得到反应函数(得到反应函数(Reaction Function)古诺寡头博弈反应函数和均衡古诺寡头博弈反应函数和均衡v市场中有市场中有 n 个厂商进行产量竞争。个厂商进行产量竞争。v市场上该商品的总产量为:市场上该商品的总产量为:Q=q1+q2+qn。v其中:其中:Q 为总产量,为总产量,qi 为厂商为厂商 i 的产量。的产量。v市场的需求函数为:市场的需求函数为:P=A-Q。v其中,其中,P 为市场价格,为市场价格,A 为外生常数。为外生常数。v厂商
22、厂商 i 的生产成本函数为:的生产成本函数为:C(qi)=cqi。其中。其中 c 为厂商为厂商 i 的的边际成本,且假设厂商边际成本,且假设厂商 i 的生产没有固定成本。的生产没有固定成本。v市场中市场中 n 个厂商个厂商 通过选择各自的最优产量达到各自利润最大化通过选择各自的最优产量达到各自利润最大化的目标。的目标。3多厂商古诺寡头博弈多厂商古诺寡头博弈v市场中的市场中的 n 个厂商利润最大化,一阶条件得到:个厂商利润最大化,一阶条件得到:v均衡产量为:均衡产量为:v均衡价格为:均衡价格为:v可以证明,当厂商个数趋于无穷个时,市场价格趋于厂商的边可以证明,当厂商个数趋于无穷个时,市场价格趋于
23、厂商的边际成本际成本 c,即:,即:v也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋也就是说,对于寡头博弈的厂商而言,当市场中厂商的数量趋于无穷时,市场的均衡价格趋于完全竞争市场下的价格。于无穷时,市场的均衡价格趋于完全竞争市场下的价格。4伯特兰德寡头博弈伯特兰德寡头博弈v市场中有两个厂商进行价格竞争。市场中有两个厂商进行价格竞争。v厂商厂商 1 的价格为的价格为 p1。v厂商厂商 2 的价格为的价格为 p2。v厂商厂商 1 的生产成本函数为:的生产成本函数为:C(q1)=cq1。其中。其中 c 为厂商为厂商 1 的边际成本,且假设厂商的边际成本,且假设厂商 1 的生产没有固定成本。的
24、生产没有固定成本。v类似的,厂商类似的,厂商 2 的生产成本函数为:的生产成本函数为:C(q2)=cq2。v厂商厂商 1 和厂商和厂商 2 通过选择各自的最优价格达到各自利润最大化通过选择各自的最优价格达到各自利润最大化的目标。的目标。v当厂商当厂商 1 产品的价格大于厂商产品的价格大于厂商 2 产品的价格时,消费者产品的价格时,消费者会购买厂商会购买厂商 2 的产品,对厂商的产品,对厂商 1 产品的消费量为零。产品的消费量为零。v当厂商当厂商 1 产品的价格小于厂商产品的价格小于厂商 2 产品的价格时,消费者产品的价格时,消费者会购买厂商会购买厂商 1 的产品,对厂商的产品,对厂商 2 产品
25、的消费量为零。产品的消费量为零。v当厂商当厂商 1 产品的价格等于厂商产品的价格等于厂商 2 产品的价格时,消费者产品的价格时,消费者会同时消费厂商会同时消费厂商 1 和厂商和厂商 2 的产品。的产品。v因此伯特兰德寡头博弈的均衡为:因此伯特兰德寡头博弈的均衡为:v伯特兰德寡头博弈的均衡是一个纳什均衡。伯特兰德寡头博弈的均衡是一个纳什均衡。v这是因为:当厂商这是因为:当厂商 2 的价格满足的价格满足 时,时,v厂商厂商1的最优策略选择是使得自己的定价满足的最优策略选择是使得自己的定价满足v如果厂商如果厂商 1 的定价高于的定价高于 c,则厂商,则厂商 1 会失去整个市场;会失去整个市场;v如果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北京大学 博弈论 课件 完全 信息 静态 博弈 教案 资料
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内