欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    决策理论与方法第三章效用函数.pptx

    • 资源ID:75311936       资源大小:365.51KB        全文页数:28页
    • 资源格式: PPTX        下载积分:9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    决策理论与方法第三章效用函数.pptx

    第三章 效用函数 第一节效用的定义和公理系统一、引言一、引言为什么要引入效用 决策问题的特点:自然状态不确定以概率表示;后果价值待定:以效用度量。1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边际价值问题。第一页,编辑于星期五:三点 五分。例2:2023/3/3 4:23礼品礼品a1抽奖抽奖a21.00.50.510万元25万元0元在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望收益大在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不同的情境下选但风险也大!不同的决策人有不同的选择,相同的决策人在不同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人的实际价值,以便反择也不同。那么在决策中如何描述或表达后果对决策人的实际价值,以便反映决策人心目中对各种后果的映决策人心目中对各种后果的偏好次序偏好次序呢?呢?第二页,编辑于星期五:三点 五分。*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。*除风险偏好之外,还有时间偏好。而效用(Utility)就是偏好的量化,是数(实值函数).Daniel Bernoulli 在1738年指出:若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行动。决策的目标就是使期望效用极大化。第三页,编辑于星期五:三点 五分。二、效用基本概念及符号严格序:ab表示a优于b。满足传递性和非对称性。无差异:ab表示a与b无差异。满足自反性、对称性和传递性。弱序:ab表示a不劣于b。满足可比性、传递性、与无差异的一致性和严格优于的一致性。展望(prospect)(可能的前景):各种后果(r种)及后果出现的概率的组合,记为:Pj=,(j=1,2,m;m为行动的可能种数)2023/3/3 4:23第四页,编辑于星期五:三点 五分。复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动aj的概率为qj。则决策的展望就是一种复合展望,记为P=。所有展望(包括简单展望和复合展望)构成展望空间。2023/3/3 4:23第五页,编辑于星期五:三点 五分。抽奖(lottery)与确定当量 若 (;)则称 确定性后果 为抽奖的确定当量第六页,编辑于星期五:三点 五分。效用的定义若展望空间上的实值函数u对于展望空间P的任意两个展望P1、P2,有P1P2 当且仅当 u(P1)u(P2),则称u为效用函数第七页,编辑于星期五:三点 五分。三、效用存在性公理(理性行为公理)连通性:任意两个展望的优劣都是可比的传递性:展望的优劣满足传递性复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系偏好的有界性:展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。理性行为公理认为合乎理性的决策人在进行价值判断时一定能满足这些公理。(实际决策中是否存在某种悖论呢?)2023/3/3 4:23第八页,编辑于星期五:三点 五分。Allais悖论2023/3/3 4:23抽奖抽奖a1抽奖抽奖a21.00.890.0150万元50万元0元0.10250万元抽奖抽奖a1抽奖抽奖a21.00.890.0150万元50万元0元0.10250万元决策A决策A抽奖抽奖b1抽奖抽奖b20.110.9050万元0元0.10250万元决策B实际上决策实际上决策B是在决策是在决策A的基础上同时减去了的基础上同时减去了89%的的机会获得机会获得50万元,万元,复合保序性没有得到满足复合保序性没有得到满足0万元0.89第九页,编辑于星期五:三点 五分。第十页,编辑于星期五:三点 五分。效用的公理化定义:在上述公理系统中,若展望空间上存在实值函数u,有:对展望空间中的任意展望P1、P2,P1P2 当且仅当 u(P1)u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(复合展望的效用等于展望效用的复合)对满足上述条件的实值函数u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,cR1,b0。(任意两个决策人的效用是线性相关的)则效用函数u(P)为(基数)效用函数2023/3/3 4:23第十一页,编辑于星期五:三点 五分。四、效用函数基数性和序数性前述定义的效用是一种基数效用,不仅能够反映决策者的偏好次序,还能够反映决策者的偏好强度。但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介绍。Hicks对效用函数的基数性和序数性的比喻:如果知道两个人的身高,那么我们可以把高个儿排在第一位;如果不知道他俩的身高也没关系,让他们比一下就可以了。2023/3/3 4:23第十二页,编辑于星期五:三点 五分。第二节效用函数的构造一、估计效用函数值的方法概率当量法(Von Neumann,Morgenstern,N-M法):设决策系统的自然状态集=1,n、行动集A=a1,am、后果集C=cij=c(ai,j),最优后果为c*=max cij,最劣后果为c0=min cij。则对于任意后果cij的效用值u(cij),可按以下步骤获得:设u(c*)=1,u(c0)=0;建立简单展望,p可调反复向决策人提问,改变可调概率p,使得当p=pij时得到如下的无差异关系:cij测得后果cij的效用值为:u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij2023/3/3 4:23第十三页,编辑于星期五:三点 五分。确定当量法(修正N-M法):设u(c*)=1,u(c0)=0;建立简单展望,p为0-1间的给定值,如p=0.5反复向决策人提问,改变cij得到如下的无差异关系:cij测得后果cij的效用值为:u(cij)=p*u(c*)+(1-p)*u(c0)=pij增益当量法:已知u(cij)和u(c0),确定u(c*)的方法损失当量法:已知u(cij)和u(c*),确定u(c0)的方法2023/3/3 4:23第十四页,编辑于星期五:三点 五分。如何选择估计方法使用确定当量法时决策人对最优后果(增益)的保守性和对损失的冒险性都比概率当量法严重(Hershey,1982)采用增益当量法与损失当量法时产生的误差也比用概率当量法大尽可能使用概率当量法第十五页,编辑于星期五:三点 五分。后果为离散型随机变量时,后果集中元素为有限个,构造后果集上的效用函数有两个方面的内容,一是确定各后果之间的优先顺序,二是确定后果之间的优先程度。步骤:二、离散型后果的效用设定第十六页,编辑于星期五:三点 五分。例:看球的效用函数构造(不考虑经济成本)1.构建问题的决策树,根据一般偏好,四种后果的优劣是C2C3C4C1;2.令u(C1)=0,u(C2)=1;3.询问1:“下雨看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如:0.3,则u(C3)=0.7)4.询问2:“天晴看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如:0.6,则u(C4)=0.4)5.一致性检验:用C3,C4加上C1(或C2)进行校验,直至一致性得到满足。2023/3/3 4:23现场现场看球看球a1电视电视看球看球a2C4:天晴看电视天晴看电视C3:下雨没被淋下雨没被淋C2:天晴未被淋天晴未被淋C1:下雨被淋下雨被淋第十七页,编辑于星期五:三点 五分。三、连续型后果效用函数的构造若后果是连续型,则可通过分析u(c)的若干特征值,求出特征点的效用后再连成光滑曲线。例:试作出每天投入学习的时间t对应的效用曲线。分析特征点:u(t=0)=0;u(tTM)=0(TM=?);状态导入期(0t0),效用增加较慢;状态稳定期(t0t1),效用与投入学习的时间基本成比例关系;效率下降,效用增加期(t1tm),效用是投入学习的时间的单调增函数,但增长率小于状态稳定期且随着时间的增加越来越小,最终达到零(t=tm),此时效用达到最大;当投入的学习时间大于tm时,将会得不偿失,学习效率急剧降低,效用减少。2023/3/3 4:23第十八页,编辑于星期五:三点 五分。2023/3/3 4:23t0t1tmtM024U(t)Umaxt第十九页,编辑于星期五:三点 五分。四、效用曲线的解析函数近似适用于规范化的效用曲线规范化的效用函数是指0 x 1,且u(0)=0,u(1)=1的效用函数幂函数对数函数第二十页,编辑于星期五:三点 五分。第三节风险与效用一、风险的概念风险:遇到破坏或损失的机会或危险。“风险”:以打鱼捕捞为生的渔民们在长期的捕捞实践中,深深的体会到“风”给他们带来的无法预测无法确定的危险,他们认识到,在出海捕捞打鱼的生活中,“风”即意味着“险”,因此有了“风险”一词的由来。风险包含两个方面的内容:一是后果的损失严重程度;二是损失出现的可能性大小。参考:http:/ 4:23第二十一页,编辑于星期五:三点 五分。2023/3/3 4:23二、风险的度量方差:设某决策方案a的后果为收益y,y的概率密度函数为f(y),期望值为E(y),则方差可用来度量风险,方差越大风险越大。协方差:若期望收益为决策人设定的目标收益c,则可用协方差度量风险。临界概率:小于目标收益的概率。第二十二页,编辑于星期五:三点 五分。三、效用包含的内容1、对风险的一种态度。2023/3/3 4:23U(t)Umax=1C(万元)风险厌恶型风险厌恶型风险中立型风险中立型风险追求型风险追求型0.50912.51425风险酬金风险酬金k第二十三页,编辑于星期五:三点 五分。2、对后果的强度偏好第二十四页,编辑于星期五:三点 五分。3、可测价值函数第二十五页,编辑于星期五:三点 五分。四、相对风险态度1、效用函数反映的风险的局部测度效用函数与决策人风险的态度关系为:第二十六页,编辑于星期五:三点 五分。2、可测价值函数反映的偏好强度的局部测度把决策人的可测价值函数所反映的在x处的偏好强度即边际价值记作m(x),即:m(x)0时,可测价值函数v在x处凸,边际价值递增。第二十七页,编辑于星期五:三点 五分。3、决策人真正的风险态度从决策人的效用函数在x处的风险测度r(x)中扣除可测价值函数在x处的边际价值m(x),就可以得到决策人在x处的真实的风险态度(称为相对风险态度),即:第二十八页,编辑于星期五:三点 五分。

    注意事项

    本文(决策理论与方法第三章效用函数.pptx)为本站会员(知****量)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开