欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    决策理论与方法.docx

    • 资源ID:60295945       资源大小:21KB        全文页数:12页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    决策理论与方法.docx

    其次节 决策分析的分类及其基本原那么其次节 决策分析的分类 及其基本原那么 第三节 决策分析的步骤与追踪决策 第三节 决策分 析的步骤与追踪决策 第三节 决策分析的步骤与追踪决策 第三节 决策分析的步骤与追踪决策 第四节 决策分析的定性与定量方法概 述本章小结决策分析是人们为了实现某一特定目标,依据主客观条件的可能 性,提出各种可行方案,采纳科学的方法对各方案进行比拟、分析和 评价,依据决策准那么,从中筛选出最满足的方案,并加以实施的过程。 它包括决策者、决策目标、决策方案、自然状态、决策结果和决策准 那么等几个基本要素。本章结合其要素对决策分析从不同角度进行了较 为具体的分类。决策分析是一个包括分析问题、确定目标、拟定方案、评价 方案、实施方案直至目标实现的系统过程。在决策分析的过程中,我 们应遵循如下基本原那么:信息准全原那么、效益原那么、系统原那么、科学 原那么、可行原那么、选优原那么、行动原那么、反响原那么等。在方案实施的过程中,当主客观状况发生重大变化或原决策方 案存在重大失误时,要进行追踪决策。要做好追踪决策应把握其基本 特征,如回溯分析、非零起点、双重优化、心理效应等。在决策分析的过程中,我们应采纳定性分析与定量分析相结 合的综合决策方法。这种方法对能够量化的指标建立起精确的数学模 型,而且同时考虑不能量化的因素,是一种切合实际的较优的决策分 析方法。其次节 完全信息静态博弈一、博弈的标准式表述 定 人类型的概率推断; (2)给定该信息集上的信念和其他局中人 的后续策略,局中人的后续策略必需是最优的; (3)局中人依 据贝叶斯法那么和均衡策略修正后验信念。 定义7. 5完善贝叶 斯均衡是一种策略组合 与一种后验概 率组合 ,满足:对于全部的局中人i,在每个信息集 h, ; 由先验概 率 、所观测的和最优策略 通过贝叶斯法那么形 成。第五节 不完全信息动态博弈 四、举例(一)2X2声明博弈 2X2声明博弈中声明能有效传递信息的几个必要条件: 1不 同类型的声明方必需偏好行为方的不同行为。 2对应声明方的 不同类型,行为方必需偏好不同的行为。 3行为方的偏好必需与声明方的偏好具有全都性。(二)离散型声明博弈模型 (1) 自然抽取声明方的类型,抽取的方法是从类型集合 中以概率分布随机抽取,其中。 (2)声明方了解到自己的 以后,从 中选择,作为自己声明的类型。当然可以与相同说真话,也可以与 不同说假话。(3)行 为方在听到声明力的声明 后,在可选择的行为集合 中选择行为 。(4)声明方的得益为,行为方的得益为。第四节DEA方法2.生产可能集 生产可能集定义为全部可能的生产活动构成的集合,记作。由于()是决策单元j的生产活动,于是有 在 模型中,生 产可能集应当满足下面的四条公理。 公理5.1 (凸性)对于任意,以及任意,均有 即是说,假如 ,分别以,()加权和作为投入量,那么,以同样的加权和作为产出量。公理5. 2(锥性)对于任意,任意数 ,均有 即是说,假如以x的 倍作为投入量,那么产出 量y是的同样倍数。公理5. 3(无效性)对于任意,(1)假设有 ,那么均有;(2)假设有 ,那么均有 。即是说,在原生产活动中,单方面的增加投入量或者削减产出量,生 产活动总是可能的。公理5. 4 (最小性)生产可能集T是满足公理 14的全部集合的交集。由n个决策单元()的生产活动所描述的生产可能集,满足公理广4是唯一确定的。这个生 产可能集可以表示为(5-30) 第四节DEA方法(二)DEA有效性的经济意义用线性规划模型()评价决策单元 的DEA有 效性,模型 ()由于,即()满足条件 为了清晰起见,考虑不含松弛变量的线性规划模型 ()(5-31) 第四节DEA方法 线性规划模型()表示,在生产 可能集内,当产出 保持不变的状况下,尽量将投入量 按同一比例 削减,假如投入量 不能按同一比例削减,即模型()最优 值,在单投入和单产出的状况下,决策单元 同时技术有效和规模有效。假如投入量 能按同一比例削减,模型()最优 值,决策单元不是技术有效和规模有效。 设模型()的最优解为。(1) 决策单元 为DEA有效,其经济意义是决策单元 的生产活动()同时为技术有效和规模有效。2者至少有某个,但至少有某个义7.1在一个n人博弈的标准式表述中,参加者的策略空间分别 为,收益函数分别为那么表示此博弈。 二、纳什均衡 定义7.2在博弈 中,假如策略组合中任一博弈方i的策略都是对其余博弈方的策略组合的最正确对策,也即:对任意都成立,那么称为G的一个“纳什均衡”。纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每 个博弈方对于对手的策略有唯一的最正确反响,即 为严格纳什均衡, 当且仅当对全部i,全部其他 ,均有: 三、两人有限零 和博弈(一)两人有限零和博弈模型两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一 局势中两个局中人得失之和总是等于零。其次节完全信息静态博 弈假如我们用和表示两人有限零和博弈的两个局中人,并设 他们的策略集分别为,。局中人的支付矩阵可记作:依据局中人 的支付矩阵A ,结合博弈的一般式表 述,我们可将这种博弈记作。(二)最优纯策略与纳什均衡定义7. 3对于博弈,假如 那么称分别为局中人 和 的最优纯策略,称局势()为博弈G的鞍点,v称博弈的博弈值。不难验证鞍点()是博弈的纳什均衡,鞍点又称纯策略纳什均衡。两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素 ,使对于一切,总有:其次节 完全信息静态博弈(三)最优混合策略与纳什均衡 局中人只能以 肯定的概率在其策略集中随机选择每个策略,这种在纯策略空间上的 概率分布为混合策略。设博弈,令分别为局中人和在各自的策略集和 中选择策略和 的概 率,那么称 分别为局中人和 的一个混合策略。称 为局中人的期望获得, 为的期望获得,而()为博弈的混合局势。又记 分别为局中人和 的混合策略集合。定义7.4假如 那么称 为局中人和 的最优混合策略,称 ( )为G的最优混合局势,称为博弈方的期望所得。最优混合局势构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,那么它的期望所得将不会优于最优混合局势下的所得。 其次节完全信息静态博弈(四)最优混合策略的求解方法 博 弈有混合意义下的解的充要条件是:存在满足以下两个不等式组:(1) (2) 为了求解上述不等式组, 可将它们变为线性规划而求出博弈G的最优混合策略。不妨设(否那么令,那么 肯定可大于零)。令 ,那么不等式组(1)等价于下面的线形规划:(3)同理,令,问题(2)就变 为线形规划(4): (4)其次节 完全信息静态博弈四、应用举例图 7-4市场进入阻挠博弈例7-3市场进入阻扰博弈。一种市场 上存在一个垄断企业,另一个企业盼望进入这一市场,垄断者为了保持自己的地位需要对进入者进行阻挠。这种博弈中,进入者有两种策 略可以选择:“进入”与“不进入”;垄断者也有两种策略:“容忍” 与“还击”。他们的支付函数用以下双变量矩阵表示(见图7-4)o 例7-4产量决策的古诺模型。古诺模型是博弈论中最经典的例子。 古诺首先提出了这一模型。由于他采纳了分析企业各自的最优反响函 数从而形成均衡的思路,与纳什均衡特别相像,因此纳什均衡也称古 诺一纳什均衡。它描述的是所谓厂商进行数量竞争的形势,以下是最 常见的一种较为简化的版本。生产同质产品的两个企业同时选择各自的产量,市场需求打算价格。单位本钱均为常数c。求解其中的纳什均衡。例7-5公共地悲剧模型。假设有n个人共同拥有的一个公共牧场,每个人要打算自己放牧羊的数目,总的羊数因 此为。购买和照看1只羊的本钱为常数co设每只羊的价值为 ,随着羊的增加,草地会越来越拥挤,食物也会更紧急, 因此会造成羊的价值下降,另一方面,羊的供应增加也会造成羊的价 值下降,求此博弈中的纳什均衡。第三节 完全信息动态博弈一、 博弈的扩展式表述在动态博弈中,参加人的行动有先后挨次,且后行动者在自己行动之前能观测到先行动者的行动且对各博弈 方的策略空间及支付有充分的了解,我们称这种博弈为完全信息动态 博弈。动态博弈有不同与静态博弈的特征,习惯于用扩展式来描述和 分析动态博弈。 博弈的扩展式表述包括以下要素:(1)参加人集 合;(2)行动次序,即参加人参加行动的次序;(3)收益,即参加人所实行行动的函数;(4)行动,即轮到次序的参加人的选择; (5)信息集,它表示参加人在每次行动时所知道的信息;(6)每 一个外生大事的概率分布。二、多阶段可观看行动博弈与子博弈完 善纳什均衡 多阶段可观看行动博弈,这种博弈有着多个“阶段”, 通常记为k,行动的历史通常记为,从而 (1)在每一个阶段 k,每一个参加人都知道全部行为状况,包括自然的行为以及过去各阶 段全部参加人的行为;(2)在任一给定阶段中,每一个参加人最多只能行动一次;(3)阶段k的信息集不会供应有关这一阶段的任何信息。由于这种博弈存在多个阶段,它与只有一个阶段的完全信息博弈有着本质的区分,因此假如我们仍用纳什均衡思 想分析这种博弈问题就难免存在局限性。泽尔滕(Selten, 1965)提 出了子博弈完善纳什均衡的思想。泽尔滕子博弈完善纳什均衡是指在一个多阶段可观看的博弈中,由各博弈方的策略构成的一个策略 组合,这个策略组合满足在整个动态博弈及它的全部子博弈中都构成 纳什均衡。第三节完全信息动态博弈三、完善信息博弈与逆向归 纳法在多阶段可观看行动博弈中,假如我们对条件(2)稍加限制,即在任一给定阶段中,每一个参加人最多只能行动一次而且只有 一个参加人实行行动,就得到完善信息博弈。由于多阶段可观看行动博弈中,引入了子博弈完善纳什均衡的概念,借助这种概 念的思想,多阶段可观看行动博弈通常采纳逆向归纳法。“逆向归纳 法”这一思路是通过逆向归纳的方法,先解决参加人在面临任何可能 状况下的最终行为策略,然后逐步向前推导计算前一步最优选择。逆向归纳法可以在任何完善信息下的多阶段博弈中应用,这一方法从 最终阶段k在每一历史状况 下最优选择开头,即在给定历史状况 条件下,通过最大化参加人在面临历史状况条件的收益确定其最优 行动,从而向前推算到阶段kT,并确定这一阶段中实行行动的参加 人的最优行为,只要给定阶段中实行行动的参加人在历史状况下将 实行我们之前推导出来的最优行动即可。用这一方法不断地向前推算 下去,直至初始阶段,这样我们就可以建立一个策略组合。第四节 不 完全信息静态博弈一、概念假如在一个博弈中,某些参加人不知 道其他参加人的收益,我们就说这个博弈是不完全信息博弈。海萨尼(Harsanyi, 1967 1968)首先给出了一种模拟和处理这一类 不完全信息博弈的方法,即引入一个虚拟参加人一一“自然”,“自然” 首先选择参加人1的类型(这里是他的本钱)。在这个转换博弈中, 参加人2关于参加人1本钱的不完全信息就变成了关于“自然”的行 动的不完全信息,从而这个转换博弈可以用标准的技术来分析。从不完全信息博弈到不完善信息博弈的转换如图7-3所示,这个图是 首先由海萨尼给出的。N代表“自然”,“自然”选择参加人1的类型。 这里有一个标准假设,即全部参加人对自然行动的概率分布具有全都 的推断。一旦采纳这一假设,我们就得到一个标准博弈,从而可以使 用纳什均衡的概念。海萨尼的贝叶斯均衡(或贝叶斯纳什均衡)正是 指不完善信息博弈的纳什均衡。二、策略和类型参加人的“类型”一一他的私人信息一一就是他的本钱。在通常状况下,一个 参加人的类型可能包括与其决策相关的任何私人信息。参加人的收益 函数就相当于它的类型。 假如参加人的类型过于简单,模 型就可能很难处理,在实际运用中,通常假定参加人关于对手的推断 完全由他自己的收益函数打算。 海萨尼考虑了更一般的情形。 假定参加人的类型 取自某一客观概率分布 ,这里 属于某一空间 。简洁起见,假定 存在有限个元素。只能被参 加人i观看到。令 代表给定 是参加人i关于其他参加人 类型 的条件概率。假定对于每一 个 ,边际分布 是严格正的。第四节 不完全信息静态博弈 我们通常把博弈的外生因素如策略空间、收益函数、可能类型、先验 分布等视为共同学问。一般来说,这些策略空间都比拟抽象,有些还 包括如扩展式博弈中的相机行动策略。但在这里,为简洁起见,我们 假定策略空间Si是参加人i的(非相机)行动集。 可以用 代表类型为 的参加人i的策略选择(可能是混合策略)。假如参加 人i知道其他参加人的策略 是其相应类型的函数,参加人 1就可以用条件概率 来计算对应于每一个选择的期望效用 从而找出最优反响策略 。三、贝叶斯均衡 定义7.4在 一个不完全信息博弈中,假如每一参加人i的类型 有限;且参加人 类型的先验分布为p,相应纯策略空间为,那么该博弈的一个贝叶 斯均衡是其“绽开博弈”的一个纳什均衡,在这个“绽开博弈”中, 每一个参加人i的纯策略空间是由从到的映射构成的集合 。 给定策略组合 ,和 ,令 代表当参加人i选 择 而其他人选择,且令代表策略组合在 的值。那么策略组合 是一个(纯策略)贝叶斯均衡,假如对于每一个参 加人i均有 第四节 不完全信息静态博弈四、贝叶斯均衡的举例 例7-8不完全信息下的古诺模型。考虑双寡头垄断古诺模型(产量 竞争)。假定企业的利润,这里是线性需求函数的截距与企业i的不变单位本钱之差,是企业i选择的产量 。企业1的类型 是共同学问(即企业2完全知道关于 企业1的信息,或者说企业1只有一种可能类型)。但企业2拥有关 于其单位本钱的私人信息。企业1认为的概率是, 的概率也是,而且企业1的推断是共同学问。这样,企业2有两种可 能类型,我们分别将其成为“低本钱型”()和“高本钱型”()O两个企业同时选择产量。下面来看这个博弈的纯策略均衡。即企业1的产量为,企业2在 时产量为 ,在 时的产量为 。企业2的均衡产量必需满足 企业1不知道企业2是 那种类型,因此他的收益只能是对企业2的类型取期望:将 和代入中,我们得到贝叶斯均衡解为()(事实上,这也是惟一的均衡)。第五节不完全信息动态博弈一、不完全信息动态博弈问题信号博弈的基本特征是博弈方分为信号发出方和信号接受方两类,先行 为的信号发出方的行为对后行为的信号接受方来说具有传递信息的 作用。信号博弈其实是一类具有信息传递机制的动态贝叶斯博弈的总 称。很多博弈或信息经济学问题都可以归结为信号博弈。一个信号 博弈可表示为: 1博弈方0以概率 为信号发出方S选择类型;2发出方S选择行为型;2发出方S选择行为3接收方R看到 后选择行为 ;4双方得益和都取决于和。完善贝叶斯均衡的条件是:(1)接收方R在观看到发出方的信号 后,必需有关于发出方的类型推断,即发出方选择行为 时,发出方S是类型 的后验概率:(2)对于发出方给出的信号 和对发出方类型推断即后验概率,接收方R选择的行动 必需是接收方收益最大,即(3)给定R的策略 时,S的选择 必需使S的得益最大, 即是最大化问题的解。满足上述要求的双方策略和接收方推断构成信号博弈的完善贝叶斯均衡。第五节不完全信 息动态博弈二、类型和海萨尼转换 静态贝叶斯博弈中处理不完 全信息的方法是将博弈方得益的不同可能理解为博弈方有不同的类 型,并引进一个为博弈方选择类型的虚拟博弈方,从而把不完全信息 博弈转化成完全但不完善信息动态博弈,这样的处理方法称为海萨尼 转换。这种处理方法同样适用于动态贝叶斯博弈,二者的差异是动态 贝叶斯博弈转化的不是两阶段有同时选择的不完善信息动态博弈,而 是更一般的不完善信息动态博弈。既然通过海萨尼转换可以很简洁地将动态贝叶斯博弈转化为完全但不完善信息动态博奔,那么动 态贝叶斯博弈分析就可以主要采用贝叶斯均衡、合并均衡和分开均衡 等概念和相应的分析方法。三、完善贝叶斯均衡完善贝叶斯均衡要求:(1)在每个信息集上,局中人必需有一个定义在属于该信息集的全部节点上的概率分布,这就是局中人的信念,信息集包 含了局中人类型的信息,这一信念也相当于在该信息集上对其他局中

    注意事项

    本文(决策理论与方法.docx)为本站会员(太**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开