博弈论-第二章.课件电子教案.ppt

资源ID：18288972 资源大小：67.50KB 全文页数：18页
资源格式： PPT 下载积分：8金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要8金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

博弈论-第二章.课件电子教案.ppt

第二章第二章完全信息静态博弈完全信息静态博弈本章要点什么是博弈的基本式。如何将一个博弈用基本式加以概括。什么是纳什均衡。纯策略和混合策略纳什均衡的证明。一、博弈的基本式首先我们需要明确什么是完全信息和静态博弈，完全信息是指每个参与者的收益函数都是公共信息，而静态博弈则指每个参与者都同时行动，随后博弈结束。理解同时行动的关键在于每一个参与者在行动时并不了解其他参与者的行动。完全信息静态博弈是最简单的博弈。通常描述它只需要一些基本的要素就可以了。定义2.1 博弈表达的基本式（或策略式）由博弈的参与者N，策略空间S和收益函数u三个要素组成，即G = N, S, u。这里需要注意的是，完全信息静态博弈在多数情况下，策略就等同于行动，所以G= A，u。但严格来讲，策略并不是行动。我们可以通过一个例子来加以说明。例1 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。守方(0,2)(1,1)(2,0)攻方(0,2)失败，成功成功，失败成功，失败(1,1)成功，失败失败，成功成功，失败(2,0)成功，失败成功，失败失败，成功二、纳什均衡有些策略式博弈性态非常好，不需要所谓的均衡概念就能找到博弈的均衡解，例如利用博弈参与者的理性这一假设就可以找出甚至是唯一的均衡。这里介绍几个重要的概念：严格优策略，严格劣策略，优策略，劣策略，其基本的方法就是重复剔除严格劣策略，这种思路又被称为博弈的可理性化。但是，对于更一般的博弈，利用可理性化导致的结果可能是所有博弈组合都无法剔除，从而导致所有组合都可能是均衡这样的状态。严格优策略通俗地说就是在任何情况下，该策略带给参与者的收益都要严格大于其它任意策略。理解严格优策略的关键在于两个任意：给定对手任意的策略和自己任意的策略。如果严格优策略存在，那么它必然是唯一的。这体现在命题2.1中。相应地，我们可以定义严格劣策略。严格劣策略是指存在某个策略无论在任何情况下，该策略带个参与者的收益都要严格大于另一个策略。由此，可以看出严格优策略和严格劣策略的差异。严格优策略是全局性的，而严格劣策略只是相对于另一个策略而言。因而严格劣策略的要求要比严格优策略要松，运用重复剔出严格劣策略（如果存在的话）通常都能够确定博弈的均衡。如果放宽要求，可以相应地定义优策略和劣策略。优策略的缺点是均衡不唯一，而劣策略却有可能将均衡剔出，因而重复剔出只能运用到严格劣策略。通常，并不是所有博弈都存在劣策略，那么在这种情况下，博弈还存在均衡吗？纳什均衡：纳什均衡：纳什均衡通俗地说就是一个策略组合，其具有这样一个特性，即没有任何一个参与者有动机单方面改变策略单边背离。纳什均衡与严格优策略、严格劣策略的关系，体现在命题2.2和命题2.3上。纳什均衡同样存在不合理的地方，例如当参与者的人数2时，一个纳什均衡（策略组合）虽然不存在单边背离，但有可能存在多边背离。所谓多边背离就是2人或2人以上的参与者同时背离纳什均衡。为了克服这个缺点，理论界进行了一系列的努力，但都未能动摇纳什均衡的地位。我们现在就举例说明。例双边背离与纳什均衡1,1,2_ ,0, _0, _, _2, 2,1_, _, 1. 2 2 左右左右上下1 3 高低为了加深理解，我们来看一些经典例子。见书43页50页。通过这些例子，要求：1、掌握如果概括博弈的方法基本式，2、如何找纳什均衡。三、最优反应函数最优反应函数是更为一般的寻找纳什均衡的通用方法。最优反应函数通俗讲就是描述了当给定对手的某个策略时，我最优的策略是什么？数学一点的话讲，就是一个函数（对应），其自变量为其它对手的策略，而应变量则为自己的策略。最优反应函数不仅适用于离散策略，而且特别适用于连续策略。如果找到了所有参与者的最优反应函数，如果我们把所有参与者的最优反应函数看作是一个大的“函数”，那么它的不动点，就是纳什均衡。对称博弈和对称均衡能够大大节省工作量，这也是博弈论中所举例子通常为对称博弈的原因。对称博弈通俗说就是代表参与者身份的下标，在分析中可以省略掉而没有关系。四、混合策略博弈论里面最根本的问题是什么？就是均衡的存在性。如果均衡不存在，所有的工作都成了无用功，之所以引入混合策略，意义就在这里，因为如果仅仅限制在纯策略的范围内讨论博弈的话，均衡有可能是不存在的。混合策略通俗地说就是随机选择纯策略。在混合策略条件下，偏好实质上变成了v-N-M偏好，除了满足非对称性和负传递性外，还需满足替代公理和阿基米德公理。伯努利收益函数满足线性变换。我们知道，一个严格劣策略肯定是一个从来都不会选择的策略，在混合策略下，从来都不选择的策略同样是严格劣策略。但限制在纯策略下，这个逆命题却不成立。一个纯策略组合如果它是一个纳什均衡，那么在任何情况下，它仍是一个纳什均衡，这由命题2.6保证。注意命题2.7和命题2.8，它们可以大大简化我们的分析。五、纳什定理及其证明纳什定理1 如果策略式博弈G是有限的，那么一定存在纳什均衡。纳什定理2 如果策略式博弈G中参与者的策略空间是凸紧集，收益函数是连续拟凹函数，那么一定存在一个纯策略纳什均衡。纳什定理3 如果策略式博弈G中参与者的策略空间是紧集，收益函数是连续的，那么一定存在（可能是混合的）纳什均衡。纳什定理得证明关键是弄清楚几个关键概念：上半连续、凸集、紧集、不动点角谷不动点定理

注意事项

本文（博弈论-第二章.课件电子教案.ppt）为本站会员（知****量）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。