博弈论的概念.doc
《博弈论的概念.doc》由会员分享,可在线阅读,更多相关《博弈论的概念.doc(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 博弈论的概念 博弈论又被称为对策论Games Theory),是研究具有斗争或竞争性 质现象的理论与方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论的开展博弈论思想古已有之,我国古代的孙子兵法就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经历上,没有向理论化开展,正式开展成一门学科那么是在20世纪初。1928年冯诺意曼证明了博弈论的根本原理,从而宣告了博弈论的正式诞生。1944年,冯诺意曼与摩根斯坦共著的划时代巨著博弈论与经济行为将二人博弈推广到n人博弈构造并将博弈论系统的应用于经济领域,从而
2、奠定了这一学科的根底与理论体系。谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文n人博弈的均衡点1950,非合作博弈1951等等,给出了纳什均衡的概念与均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈论开展起到推动作用。今天博弈论已开展成一门较完善的的学科。 博弈论的根本概念博弈要素(1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈,而多于两个局中人的博弈称为 “多人博弈。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全
3、局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,那么称为“有限博弈,否那么称为“无限博弈。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈完毕时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈完毕时每个局中人的“得失是全体局中人所取定的一组策略的函数,通常称为支付payoff函数。(4)对于博弈参与者来说,存在着一博弈结果(5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出
4、,此时我们就说,该商品的供求到达了均衡。所谓纳什均衡,它是一稳定的博弈结果。纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶概念的提出。所谓“均衡偶是在二人零与博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这
5、样,“均衡偶的明确定义为:一对策略a*(属于策略集A)与策略b*属于策略集B称之为均衡偶,对任一策略a(属于策略集A)与策略b属于策略集B,总有:偶对a, b*偶对(a*,b*)偶对a*,b。对于非零与博弈也有如下定义:一对策略a*属于策略集A与策略b*属于策略集B称为非零与博弈的均衡偶,对任一策略a(属于策略集A与策略b属于策略集B,总有:对局中人A的偶对a, b* 偶对(a*,b*);对局中人B的偶对a*,b偶对(a*,b*)。有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡
6、研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈构造里寻找比拟有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而无视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真得意的纳什均衡点。塞尔顿RSelten)在多个均衡中剔除一些按照一定规那么不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡与颤抖的手完美均衡。 博弈的类型 (1)合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈研究人们在利
7、益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。 (3)完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息;反之,那么称为不完全信息。 (4)静态博弈与动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。 财产分配问题与夏普里值Shapley value 考虑这样一个合作博弈:a、b、c、投票决定如何分配100万,他们分别拥有50、40、10的权力,规那么规定,当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢按票
8、力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0权力指数:每个决策者在决策时的权力表达在他在形成的获胜联盟中的“关键参加者的个数,这个“关键参加者的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下,参与者对联盟的边际奉献之与除以各种可能的联盟组合。 次序 abc acb bac bca cab cba 关键参加者 a c a c a b 由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/3,1/3。博弈论的意义 弈论的研究方法与其他许多利用数学工具研究社会经济现象的学科一
9、样,都是从复杂的现象中抽象出根本的元素,对这些元素构成的数学模型进展分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型与特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规那么约束下,依靠所掌握的信息,从各自选择的行为或是策略进展选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。
10、 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋 着数中理性化、逻辑化的局部,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:假设假设双方都准确地记得自己与对手的每一步棋且都是最“理性 的棋
11、手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯诺伊曼于20世纪20年代开场创立,1944年他与经济学家奥斯卡摩根斯特恩合作出版的巨著博弈论与经济行为,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零与博弈-好比两个人下棋、或是打乒乓球,一个人赢一着那么另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,参
12、与者集合(两方) ,策略集合(所有棋着) ,与盈利集合(赢子输子) ,能否且如何找到一个理论上的“解 或“平衡 ,也就是对参与双方来说都最“合理 、最优的具体策略?怎样才是“合理 ?应用传统决定论中的“最小最大 准那么,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零与博弈,都能够找到一个“最小最大解 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终到达彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这
13、个著名的最小最大定理所表达的根本“理性 思想是“抱最好的希望,做最坏的打算 。 经济学中的“智猪博弈Pigspayoffs 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有时机抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;假设是大猪踩动了踏板,那么还有时机在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车策略,也就是舒舒服服地等在食槽边;而大猪那么为一点残羹不知疲倦地奔忙
14、于踏板与食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑的现象是由于故事中的游戏规那么所导致的。规那么的核心指标是:每次落下的事物数量与踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方奉献食物
15、,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规那么的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪与大猪相当于生活在物质相对丰富的“共产主义社会,所以竞争意识却不会很强。 对于游戏规那么的设计者来说,这个规那么的本钱相当高每次提供双份的食物;而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪与大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对
16、于游戏设计者,这是一个最好的方案。本钱不高,但收获最大。 原版的“智猪博弈故事给了竞争中的弱者小猪以等待为最正确策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最正确状态。为使资源最有效配置,规那么的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车现象,就要看游戏规那么的核心指标设置是否适宜了。 比方,公司的鼓励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,本钱高不说,员工的积极性并不一定很高。这相当于“智猪博弈增量方案所描述的情形。但是如果奖励力度不大,而且见者有份不劳动的“小猪也有,一度十分努
17、力的大猪也不会有动力了-就象“智猪博弈减量方案一所描述的情形。最好的鼓励机制设计就象改变方案三-减量加移位的方法,奖励并非人人有份,而是直接针对个人如业务按比例提成,既节约了本钱对公司而言,又消除了“搭便车现象,能实现有效的鼓励。 许多人并未读过“智猪博弈的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规那么的人,必须深谙“智猪博弈指标改变的个中道理。 纳什博弈论的原理与应用 1950年与1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变
18、了人们对竞争与市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而提醒了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究根本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯诺依曼的断然否认,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。 纳什是一个非常天才的数学家,他的主要奉献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现非合作博弈的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 概念
限制150内