博弈论与经济教学课件汇总全书电子教案.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《博弈论与经济教学课件汇总全书电子教案.ppt》由会员分享,可在线阅读,更多相关《博弈论与经济教学课件汇总全书电子教案.ppt(502页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第第1章章 博弈论基本模型博弈论基本模型 什么是博弈活动什么是博弈活动 博弈活动具有以下特征:博弈活动具有以下特征: 1.有人参加。我们把参加的人称为参与人或局中人。有人参加。我们把参加的人称为参与人或局中人。 2.在每一步,局中人有明确的、可以选择的行动。在每一步,局中人有明确的、可以选择的行动。 3.有明确的行动顺序。有明确的行动顺序。 4.参与人在选择行动时有明确的信息。参与人在选择行动时有明确的信息。 5.活动结束时有明确的支付规则。活动结束时有明确的支付规则。 具有上述特征的活动称为博弈活动。具有上述特征的活动称为博弈活动。 合作博弈与非合作博弈合作博弈与非合作博弈 如果在一项活动
2、中,参与人具有合作的意向,而且合作的如果在一项活动中,参与人具有合作的意向,而且合作的行为又能得到有力的保障,则称这种博弈活动为合作博弈,行为又能得到有力的保障,则称这种博弈活动为合作博弈,否则称为非合作博弈。否则称为非合作博弈。 对于非合作博弈,从模型构建的形式上又可分为策略型博对于非合作博弈,从模型构建的形式上又可分为策略型博弈与扩展型博弈。弈与扩展型博弈。1.1 有限扩展型博弈模型有限扩展型博弈模型博弈模型的构建博弈模型的构建应用博弈论方法分析研究经济管理或其它领域中的问题,首先要构造出博弈模型来,因而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这些要素进行严格、准确的刻画后,形成
3、博弈模型。将博弈活动构造成博弈模型,需要了解以下6个方面的情况:1.参与人;2.外生事件的概率分布;3.参与人选择行动的次序;4.参与人所能选择的行动;5. 参与人在选择行动时所了解的信息。6.参与人的支付。构造博弈模型所需要的要素构造博弈模型所需要的要素1.局中人集合局中人集合 ,称 为局中人或参与人集合。 中元素称为参与人或局中人。参与人不专指人,它泛指参与博弈活动的政府、企业、地区、国家、个人等决策主体。通常用“0”表示虚拟局中人,它的行为是以确定的概率分布进行随机选择, 表示实际参与人。2.行动集合行动集合 称参与人 在博弈中所有可能选择的行动构成的集合 为局中人i的行动集合行动集合。
4、 中的元素 称为局中人i的行动行动。局中人的行动集合可能是有限集,也可能是无限集。如果博弈活动中每个局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称该博弈为有限博弈有限博弈。3.博弈树博弈树对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1所示。n, 2 , 1 , 0NNNni, 2 , 1iNiAiAia11I21221003055301011pp1 容许I01容许抵制进入进入不进不进旺盛疲软图1-1 市场进入博弈树II抵制 I抵制 4. 博弈树中终点Z下面的向量 称为支付向量支付向量,它的第 个分量表示博弈结束于Z时,局中人i所得的支付。支付可表示参与人
5、的某种收益或损失。本书中的支付指收益、效用、利润等。正式地,支付向量是终点集合Z到n维向量集合 的映射。ZzzuzuzuzURZUnn),(,),()()(,:21,),(21nuuuu,), 2 , 1(ninR 5.信息集与信息集分割信息集与信息集分割 信息集由同一个局中人、在相同的时点上的具有相同信息的决策节点组成。用 表示局中人i的第k个信息集。它满足 (1) ( 表示空集); (2)从博弈起始点到任一终点的路径至多与 交一点(描写同一信息集中的节点处于同一时点上); (3)从 中的任一节点出发,局中人i可能选择的行动集合都相同(因为局中人在同一信息集的不同节点上具有相同的信息)。 在
6、博弈树上,将属于同一信息集的节点用虚线框在一起。 称 为局中人 的信息集类信息集类(在数学上,称以集合为元素的集合为类)。 称 为信息集分割信息集分割。ikI), 2 , 1 , 0, 2 , 1 , 0(irkniikIikIikI,21iiriiiIIII,), 2 , 1 , 0(ni,210nIIIII,有限扩展型博弈模型的定义有限扩展型博弈模型的定义定义定义1.1 称称 为有限扩展型博弈模型。有限扩展型博弈模型。其中N为参与人集合,Y为博弈树,U为支付向量,I为信息集分割,q为外生事件的概率分布。完全信息博弈与不完全信息博弈完全信息博弈与不完全信息博弈如果所有的局中人对构成G的元素N
7、,Y,U,I,q都完全了解,称G为完全信完全信息博弈息博弈,否则为不完全信息博弈不完全信息博弈。静态博弈与动态博弈静态博弈与动态博弈如果所有的局中人都同时选择行动,称G为静态博弈静态博弈,否则称G为动动态博弈态博弈。静态博弈静态博弈更本质的特征是所有局中人在选择行动时不知道对手选择了什么行动。q, I ,U,Y,NG 例例1.1 考虑按以下步骤进行的博弈活动。 第1步 局中人1从字母T,H中选一个; 第2步 局中人2不知第1步的选择,再从H,T中选一字母; 第3步 局中人知道1,2两步的选择,又从T,H中选一字母; 第4步 局中人2不知第3步的选择,但知1,2两步的选择,最后从T,H中选一字母
8、,博弈结束。按照每步选择的结果,每个局中人各得一笔报酬(略)。 该博弈的局中人集合 . 该博弈的信息集合分别为 ,其中 。 2 , 1N I ,I I21I ,II ,I ,I I,I ,II ,I ,I I2524232221215141312111,23I22I12IHHHTTT图1-2HH TH TH TH THH TH TH TTHHHTTTT21I24I25I13I14I15I11I 信息集可以告诉我们以下信息集可以告诉我们以下4点点 1.在一个信息集上应由哪个参与人选择行动。 2.从一个信息集出发,局中人可能选择哪些行动。 3.局中人在一个信息集上选择行动时已知道了哪些信息。 4.
9、单点信息集表明相应的局中人完全了解博弈从开始到该信息集的博弈历程。 完美信息博弈完美信息博弈 如果G的每个信息集都是单点信息集。表明博弈的每个参与人在选择行动时对博弈到现在为止的历程都完全了解,这时称G为完美信息博弈完美信息博弈。 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈静态扩展型博弈的例子静态扩展型博弈的例子例例1.21.2 两个参与人同时从字母 T,H中选择一个,博弈结束时两个参与人各得一笔支付,该博弈的博弈树如图1-3所示。HHHTTT图1-321I11I 扩展型博弈的子博弈扩展型博弈的子博弈 扩展型博弈的子博弈大体上说是原博弈的一部分
10、,但它不能破坏原博弈的信息集。 定义定义1.2 设 为一有限扩展型博弈,从Y的决策节点h出发的子博弈子博弈 满足 (1)h是G的单点信息集; (2) N ; (3) 是Y的子树,它由h及其后的所有节点与终点构成; (4) 不能割裂G的信息集; (5)若“自然”仍属于 ,则 中“自然”的概率分布 ; (6)设Z为 的终点,支付向量 。P, I ,U,Y,NG hhhhhhPIUYNG,hNhYhGhNhGhPPhP)()(zUzUh1.2有限扩展型博弈的策略有限扩展型博弈的策略 策略的定义策略的定义 定义定义1.3 局中人 的策略集合策略集合用 表示, 中的元素 称为局中人i的策略策略。它定义为
11、局中人i的信息集类 到行动集 的映射: 策略是信息集的映射,行动是映射值。两者是不策略是信息集的映射,行动是映射值。两者是不同的概念。同的概念。ni, 2 , 1iSisiIiiiiikiiiirkniAaaISAIS, 2 , 1, 2 , 1,)(,:iSiA 例例1.3 考虑图1-1所示的扩展型博弈的策略。 策略 表明参与人2在第1个信息集 上 选择行动 ,在第2个信息集 上选择行动 。其余策略可同样理解。 容许I01容许抵制进入进入不进不进旺盛疲软图1-1 市场进入博弈树1S1112aa,2S121),(xxx,aa2221,2xaa2221,)aa (),aa (),aa (),aa
12、(2222212222212121,)a ,a (212221I22a22I21a11I21I22I 例例1.4 考虑例1.1所给出的扩展型博弈的策略。 例例1.5 考虑例1.2给出的扩展型博弈的策略。 在静态博弈模型中,局中人策略与行动等在静态博弈模型中,局中人策略与行动等同同。1Skxxxxxx),(54321,,H,T5 , 4 , 3 , 2 , 1k12SS H,TAs,H,TAs22111.3 一般扩展型博弈模型一般扩展型博弈模型构成一般扩展型博弈模型的要素构成一般扩展型博弈模型的要素(1)一个有限的局中人集合: ,其中“0”表示虚拟局中人“自然”,它以确定的概率分布进行随机选择。
13、(2)一个满足下列三条性质的行动序列集合H。H中包含一个空序列,即 ;如果局中人的有限行动序列 H,则对 正整数 ,都有 H;对于局中人的无限行动序列 ,若对任何正整数 都有 ,则 H,否则 H。称满足以上三条性质的行动序列集合H为历史集历史集。称历史集中的元素 H为博弈的一段历史一段历史。称一段历史 H为博弈的终点,如果它是无限的( )或不存在 使 H。博弈全体终点构成集合记为 Z 。(3)局中人映射 ,表示历史h之后应由局中人i选择行动。(4)定义“自然”的行动集合上的概率分布为q。N, 2 , 1 , 0NHK1()kka1()kka1()k LkaH1()kka1)(kkahK1)(k
14、kak1ka1k1kk)a (ZHh, i)h(P,NZH:PKL1)(kkaL (5)信息集分割。 对于每个局中人 ,称集合 ( 可为无穷)为 的一个信息集分割, 称为局中人的信息集,如果它满足性质 ; 只要 与 同在 内,则 。 表示局中人 在历史 之后的可能选择的行动集合。 对 , 中至多有一段历史与h相交。 (6)支付向量 支付向量是终点 到 的映射 。 其中 是当博弈结束于 ,局中人 的支付值。iN,21iiriiiIIIIir)(ihPHhiikrkI, 2 , 1,iiikrkI, 2 , 1,hhiikrkI, 2 , 1,)()(hAhA)(hAihhZ ), 2 , 1(i
15、ikrkIZnRZzzuzuzuzURZUnn),(,),(),()(,:21)(zuiz), 2 , 1(ni例例1.1的一般扩展型博弈模型的一般扩展型博弈模型1.局中人集合 .2.历史集合H= ,T,H,TT,TH,HT,HH,TTT,TTH,THT,THH,HTT,HTH,HHT,HHH,TTTT,TTTH,TTHT,TTHH,THTT,THTH,THH,THHH,HTTT,HTTH,HTHT,HTHH,HHTT,HHT,HHHT,HHHH终点集合Z=TTTT,TTTH,TTHT,TTHH,THTT,THTH,THHT,THHH,HTTT,HTTH,HTHT,HTHH,HHTT,HHTH
16、,HHHT,HHHH3.局中人映射。 , , ,4.信息集分割。 其中 , , , , .5.支付向量。一般扩展型博弈模型的策略一般扩展型博弈模型的策略和有限扩展型模型一样,一般扩展型博弈模型的策略一般扩展型博弈模型的策略也是定义为信息集类到行动集的映射。 , ,( 可为 )。一般扩展型博弈模型的子博弈一般扩展型博弈模型的子博弈一般扩展型博弈模型的子博弈子博弈是从一个单点信息集引出,由局中人映射所确定的到终点集合的子博弈,子博弈不能割裂原博弈的信息集。2 , 1N 1)(P2)H(P)T(P1)HH(P)HT(P)TH(P)TT(P)HHT(P)HTH(P)HTT(P)THH(P)THT(P)
17、TTH(P)TTT(P2)HHH(PI ,I ,I ,I ,I I1514131211111ITHI13TTI12HTI14HHI15iikiiiiAaIsAIs)(.:irkni, 2 , 1, 2 , 1irir1.4 策略型博弈模型策略型博弈模型1.4.1 策略型博弈模型的定义策略型博弈模型的定义定义策略型博弈模型,策略型博弈模型,仅需要局中人、策略、支付这三个要素。静态博弈的策略与行动是等同的静态博弈的策略与行动是等同的。策略组合策略组合称由每个局中人 的策略 所构成的向量 为一个策略组策略组合合,其中 。称n个局中人的策略集 的乘积集合 为策略组合集合策略组合集合。支付函数支付函数局
18、中人 的支付函数是定义在策略组合集合S上,取值于实数的映射。 。局中人i 的支付函数是 定义于策略组合集合上,而非 i的自身策略集 上,表明局中i人的支付不仅与自己的策略 有关,也与对手的策略组合 有关,即博弈论中局中人之间的利益是互相制约的。这是博弈论与决策理论的一个重要区别。定义定义1.5 称 为一个策略型博弈模型策略型博弈模型 iNis),(21nssssiiSs nSS,1, 2 , 1,),(211niSssssSSiininiiNSsusuRSuiii,)(,:),(iiiissuuiSisisn1n21u,u,S,S,S,NG例例1.6 囚徒困境问题囚徒困境问题这个问题可以归结为
19、下述静态信息完全的博弈模型 .其中,局中人集合 ,1代表罪犯甲,2代表罪犯乙。两个局中人具有相同的策略集合: ,其中C代表坦白,D代表抗拒的行动。对于策略组合 , ,两个局中人的支付函数如下:该问题对应的扩展型博弈模型可用图1-4示的博弈树直观给出。2121u,u,S,S,NG 2 , 1N D,CSS21),(21sss 2 , 1, iSsiiDssCsDsDsCsCssssu212121212111,8,05),(DssDsCsCsDsCssssu212121212121,8,05),( 抗拒抗拒抗拒坦白坦白坦白图1-411I5580081121I 1.4.2 二人有限策略型博弈模型二人
20、有限策略型博弈模型 二人有限策略型博弈模型二人有限策略型博弈模型 设 是一个策略型博弈模型,如果 , , , 即N是两个局中人的集合, 都是有限集,称G为二人有限策略型博弈模型二人有限策略型博弈模型。2121u,u,S,S,NG 2 , 1N ,211nS,212nS21S,S 对于二人有限策略型博弈模型,定义 , , . 称以下以向量 为元素的矩阵为G的支付支付矩阵矩阵。 二人有限策略型博弈模型可由支付矩阵完全描述二人有限策略型博弈模型可由支付矩阵完全描述),(1jiijua),(2jiijubnjmi, 2 , 1, 2 , 1),(),(),(),(),(),(),(),(),(2211
21、222222212111121211112121mnmnmmmmnnnnmnbababababababababa),(ijijba 称 为参与人1的支付矩阵, 为参与人2的支付矩阵。 二人有限策略型博弈G也可称为双矩阵博弈,双矩阵博弈,记为 囚徒困境问题是个二人有限策略型博弈,其支付矩阵为) 1, 1()0 , 8(8, 0)5, 5(DCDCB,AG mnmmnnmnaaaaaaaaaA2122221112112121mnmmnnmnbbbbbbbbbB2122221112112121 1.4.3 重复剔除被严格占优策略均衡重复剔除被严格占优策略均衡 定义定义1.6 如果对于任何策略组合 有
22、 ,则称局中人局中人i的策略的策略 严格占优策略严格占优策略 ,或 被被 严格占优。严格占优。 在博弈论中,对于参与人的一个基本理性假设是:参与人偏好更高的支付。因而不会使用被严格占优的策略。 在上述理性假设下,我们有理由将被严格占优的策略删除。用剩余的策略组合预测博弈的结果。sS),(),(iiiiiisyusxuixiyiyix 重复剔除被严格占优策略均衡重复剔除被严格占优策略均衡 一个策略本来是不被严格占优的,但经过一轮删除被严格占优的策略后,它变为被严格占优的策略了,因而我们必须在第2轮中将其删除。在有限博弈中,这样的删除被严格占优策略的过程迟早会结束。如果结束时,仅剩下一个未被删除的
23、策略组合 ,则称 为重复剔除被严格占优策略均衡重复剔除被严格占优策略均衡,称该博弈为严格占优可解严格占优可解的。我们可用重复剔除被严格占优策略均衡预测博弈的结果。在囚徒困境问题中,策略组合 是重复剔除被严格占优策略均衡。*s*s)C,C(例例1.7 伯川德价格竞争伯川德价格竞争 假设双寡头垄断市场中两个企业都可选择价格策略高、中、低三种,支付矩阵为该博弈是严格占优可解的,策略组合(低,低)为重复剔除被严格占优策略均衡。并不是每个策略型博弈都是严格占优可解的。并不是每个策略型博弈都是严格占优可解的。)4 , 4()0 , 8()0 , 8()8 , 0()5 , 5()0 ,10()8 , 0(
24、)10, 0()6 , 6(低中高低中高 例例1.8 两个土地所有者共同拥有一防洪大堤,每个人分管一段进行维护,维护成本为4。如不维护,洪水造成的损失为10。该博弈的支付矩阵为 该博弈不是严格占优可解的。 对于不是严格占优可解的博弈,将继续讨论参与人应如何选取策略 )10,10()14,10(1014)4, 4),(不维护维护不维护维护1.5 扩展型博弈模型转化为策略型博扩展型博弈模型转化为策略型博弈模型弈模型 例例1.9 考虑以下动态博弈。 第1步,局中人1从1,2中选择一数 ; 第2步,局中人2知道 的值。从1,2中选 ; 第3步,局中人1知道 的值,从1,2中选 ,博弈结束。 对于给定的
25、( )值,局中人2支付给局中人1一笔费用 : , , , , , ,xxyyzzyx,),(1zyxu2) 1 , 1 , 1 (1u5) 1 , 1 , 2(1u1)2 , 1 , 1 (1u2)2 , 1 , 2(1u3) 1 , 2 , 1 (1u2) 1 , 2 , 2(1u该动态博弈所对应的博弈树如图1-6 所示。12122211I15I14I13I122图1-6 I21I221I1121122211334455222266该动态博弈所对应的博弈树如图1-6 所示。12122211I14I13I122图1-6 I211I112112221133445522226611(1,2,2)4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 经济 教学 课件 汇总 全书 电子 教案
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内