博弈论与竞争策略xdb.pptx
《博弈论与竞争策略xdb.pptx》由会员分享,可在线阅读,更多相关《博弈论与竞争策略xdb.pptx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第七讲七讲 博弈论与竞争策略博弈论与竞争策略 第一节第一节 博弈论的基本概念博弈论的基本概念 第第二节二节 完全信息静态博弈与竞争策略完全信息静态博弈与竞争策略 第第三节三节 重复博弈和序列博弈重复博弈和序列博弈在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。70年代以来,博弈论已经发展成为现代经济
2、学的基础重要基础之一,改变了传统经济学的结构,这主要有两个方面的原因:1现实经济运行中市场是不不完完全全竞竞争争的,行为主体之间的决策具有相互影响2在信息不对称信息不对称条件下博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。第一节第一节 博弈论的基本概念博弈论的基本概念一博弈论及其特点博弈论及其特点1博弈和博弈论博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理理性性的的多个行为主体的决策和行动直接相互作用和影响时
3、,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。2特点:(1)参与者具有各自的目标:(2)参与者都是理性行为者;(3)参与者之间具有相关性;(4)事态发展的结果取决于全部参与者的共同行为;(5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。可见,博弈论是与优化论不同的决策理论。优化论是一种单单人人决决策策理理论论;博弈论所揭示的规律是一种多人决策理论多人决策理论。二博弈论的基本概念二博弈论的基本概念在博弈论中,博弈的基本要素被概括为以下概念:1)参与者Players(玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两
4、个参与者。2)策略Strategies(战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间策略空间。3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。5)均衡 Equilibrium(均势):指达到稳定的策略组合或结局。6)博弈规则:(游戏规则)例:可口可乐与百事可乐(参与者参与者)的价格决策:双方都可以保持价格不变或
5、者提高价格(策略策略)博弈的目标和得失情况体现为利润的多少(收益收益)利润的大小取决于双方的策略组合(收益函数收益函数)博弈有四种策略组合,其结局结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;博弈的稳定状态有两个:都不涨价或者都涨价(均均衡衡),均衡称为博弈的解,它是由博博弈弈规规则则(即参与者采取什么策略会取得什么结局,市场的需求弹性、交叉价格弹性等)决定的。三博弈的表述方
6、法三博弈的表述方法博弈一般用数学模型表达,分为标准和扩展模型两种。1.博弈的标准模型 包括三个要素:参与者、每个参与者可以选择的策略以及收益函数。在两个参与者的有限博弈中,标准模型可以用收收益益矩矩阵阵表示。如上例的可乐价格博弈可以表示如下:在收益矩阵中,包含了标准博弈模型的基本信息,表格中各组数字表示不同策略组合条件下的结局。在每个结局中,第一个数字代表参与者1 的收益,第二个数字代表参与者2的收益。参与者2 百事可乐 参与者2 可口可乐 不涨价 涨价 不涨价 涨价10,10 100,-30-20,30 140,35返回2.博弈的扩展模型 包括五个要素:参与者、决策时点、策略空间、信息和收益
7、函数。在简单的博弈中,扩展模型可以用博博弈弈树树表示。如上例的可乐价格博弈可表示如图下:不涨价涨价参与者1可口可乐10,10100,-30-20,30140,35不涨价涨价参与者2百事可乐不涨价涨价参与者2百事可乐博弈树一般用来分析动态博弈。在博弈过程中,从某一个决策点开始,参与者在已有行动的基础上开始选择,到博弈结束,称为“子博弈”。四博弈的分类四博弈的分类(1)合作博弈与非合作博弈 根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分。可以达成协议的为合作博弈cooperative game,合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。不能达成协议的为非合作博弈non-
8、cooperative game,非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。(2)静态博弈与动态博弈 根据参与者选择策略的关系划分。参与者同时或独立选择策略的博弈是静态博弈。参与者按照一定的次序选择策略,后选择者了解先选择者的行动,这种博弈是动态博弈。(3)完全信息博弈与不完全信息博弈 根据参与者对其他参与者的特征、策略空间、收益函数等信息的了解程度划分。全部相互了解即为完全信息博弈,否则是不完全信息博弈。第二节第二节 完全信息静态博弈静态博弈一囚徒的困境与纳什均
9、衡一囚徒的困境与纳什均衡1囚徒的困境:假设有两个嫌疑犯作案后被抓获,并在不同的房间审讯。警察告诉他们,如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年;如果其中一人坦白而另一人抵赖,坦白者释放,抵赖者判刑10年;这样,每个犯人就有两种策略,即坦白和抵赖。这个博弈的收益矩阵如下 囚徒1坦白抵赖 囚徒2坦白 抵赖-8,-8 0,-10-10,0 -1,-1在这个博弈中,(坦白,坦白)是博弈的解,即均衡结局。因为不管对方怎样行动,两个囚徒都会选择坦白。囚徒的困境说明,个人理性(最优)与集体理性(最优)可能不一致。如寡头之间的广告投入、产量控制等。囚徒困境的寓意v两个寡头选择产量的博弈v公共产品
10、的供给v冷战期间的军备竞赛v经济改革既得利益集团与改革者v土地征用制度改革2纳什均衡 在这个博弈中,出现了两个纳什均衡,参与者不能判断对方会采取什么策略,因而可能出现非均衡的结局(涨价,不涨价)和(不涨价,涨价);或者对双方不利的均衡(不涨价,不涨价)。因此,纳什均衡只说明均衡存在的可能,不能解释均衡的结果。纳什均衡是指由所有参与者的最优策略组成的策略组合。在这种情况下,没有人可以从改变策略中得到好处,因而形成了一种均衡(僵局)。帕雷托最优一种制度或者协议要能够自动实行(即得到自觉遵守),必须满足纳什均衡的条件。可以通过画圈的方法求解纳什均衡。例如,前述可乐定价博弈收益矩阵可以确定有(涨价,涨
11、价)和(不涨价,不涨价)两个纳什均衡。常见的博弈智猪博弈斗鸡博弈性别博弈1.智猪博弈q H:v 按铃控制食物供给10单位/按v谁按就有2单位的成本付出v若大猪先到,吃9单位;小猪吃1单位v若同时到,大猪吃7单位,小猪吃3单位v若小猪先到,大猪吃6单位,小猪吃4单位q纳什均衡(大猪按,小猪等)智猪博弈矩阵图 大猪按等 小猪 按 等5,1 4,49,-1 0,0现实中的智猪博弈大股东和小股东监督经理的责任大企业和小企业广告宣传富人与穷人造桥,修路“多劳不能多得”链接智猪博弈与激励对策方案一:减量方案,投食为原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将
12、也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。方案二:增量方案,投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,但竞争意识却不会很强。方案三:减量加移位方案,投食为原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。2.斗鸡博弈q现实中的斗鸡博弈v十字路口v市场容量有限的,谁先进入,谁占优v游行队伍与警察o理性/理智的假设,if not,镇压/动乱斗鸡博弈矩阵 甲进退
13、乙进 退-3,-3 10,00,10 0,0这里涉及到一个承诺的问题,即,如何作出有效的承诺,让后动者相信“承诺”而放弃竞争3.性别博弈“性别战”传统的“天仙配”“当家的”“妻管严”谁说了算,取决于什么?经济实力?文化?修养?2,10,00,01,2丈夫歌剧球赛歌剧球赛妻子实际意义:“制式博弈”标准的形成家电行业的竞争过程计算机的操作系统的统一我国奶片的行业标准的制定二支配性策略二支配性策略dominant strategy均衡均衡支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对有些参与者来说,不管对手采取什么策略,他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略(上策或
14、优势策略)。当存在支配性策略时,可以首先确定支配性策略,然后确定对手的选择,从而得出博弈的均衡解。例如,两个寡头厂商的广告博弈收益矩阵如下:参与者1可口可乐有广告无广告 参与者2 百事可乐有广告 无广告10,5 15,06,8 20,6在这个博弈中,百事可乐有一个支配性策略,即不管可口可乐是否有广告,他都会有广告。在此基础上,可口可乐必然也会有广告。博弈的结果就是(有广告,有广告)。这种均衡称为支配性策略均衡。它也是纳什均衡,但纳什均衡不一定是支配性策略。三合作的诱惑三合作的诱惑在类似囚徒的困境这样的博弈中,个体理性往往导致集体的非理性。在有多个纳什均衡的博弈中,参与者判断失误,或者某个参与者
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 竞争 策略 xdb
限制150内