欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    效用函数-哈尔滨工业大学.docx

    • 资源ID:4898645       资源大小:302.43KB        全文页数:11页
    • 资源格式: DOCX        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    效用函数-哈尔滨工业大学.docx

    第三章 效用函数§31 效用的定义和公理系统一、引言·为什么要引入效用 决策问题的特点:自然状态不确定以主观概率表示; 后果价值待定以效用度量。1. 无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;2. 即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边际价值问题。例二: 上图作为商业、经营中实际问题的数学模型有普遍意义。有人认为打赌不如礼品,即 *由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便反 映决策人偏好次序(preference order)的问题 *偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。如工资/工作时间权衡,年龄对带伞与否的影响。 * 除风险偏好之外,还有时间偏好。i. 折扣率;ii. 其他。 而效用(Utility)就是偏好的量化,是数(实值函数)。Daniel Bernoulli 在1738年指出: “若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择各种可能后果中偏好期望值最高的行动。” 二、效用的定义1.符号 i. afb (即aPb)读作“a优于b”(a is preferred to b)。f:严格序 ab (即aRb) “a不劣于b”。:弱序 ab (即aIb) “a无差别于b”(I: indifference)。:无差异 ii. 展望 (prospect): 或称“预期”,可能的前景即各种后果及后果出现概率的组合 P=( ) 既考虑各种后果 (consequence)又考虑了各种后果的概率 (probability or likelihood) 分布复合展望 所有P的集合记作p iii. 抽奖 (lottery) 与确定当量(certainty equivalent) 抽奖L2=< ; >。若 L2则称 确定性后果 为抽奖 L2 的确定当量2. 效用的定义(A) 在集合p上的实值函数u,若它和p上的优先关系一致,即: 若 p , 当且仅当 u()u() 则称u为效用函数效用函数定义在展望集上,而非后果集上。三、效用存在性公理(理性行为公理) Von Neumann-Morgenstern, 1944·公理1 连通性 (Connectivity)又称可比性 p, 则 or or ·公理2 传递性 (Transitivity) p, 若, 则 ·公理3 替代性公理 ( 加等量时优先关系不变) 若p, 且 0 < a < 1 则 对任何p ,必有 a+(1-a)a+(1-a)或者表达成:,a>b 则 a+(1-a)b+(1-b) 即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。·公理4 连续性公理 - 偏好的有界性若 则 存在 0<a<1, 0<b<1, a>b使 a+(1-a)b+(1-b) 由 a+(1-a) 可知 不是无穷劣,即 u()>-¥ 由 b+(1-b) 可知 不是无穷优, 即 u()< ¥即使是死亡,亦不至于无穷劣例:i, 过马路 若死亡为无穷劣,则不能过马路 ii, 狂犬病疫苗 上述公理看来是合乎理性的,事实上并不尽然.例:Allais 悖论(Paradox 例如,1953年Allais在一次学术会议上提出如下问题,请效用理论权威Savage回答Savage的回答是A组宁择i, B组宁择ii,Allais指出:B组的i, ii, 均以0.89的$500,000 取代0.89的 $0,即与A组的i, ii相对应,照公理3、A、B两组中i,ii,的优先关系应当不变。Savage当时语塞。·效用的公理化定义 在上述公理系统中,若p上存在实值函数u,使i. f 当且仅当 u() u() ii. u(, ; 1-, )= u() +(1-)u()线性性iii. 对满足上述条件的、, 必有 () =b( )+c , 其中 b, c , b0则u(P)称为(基数)效用函数*关于线性:将ii. u(, ; 1-, )= u() +(1-)u() 推广到一般,若p ;0 , i=1,2,m; =1; 则 u( )= u()四、基数效用与序数效用 (Cardinal & Ordinal Utility)基数:实数:2,2.01, 100序数:第1,2,·区别:1. 基数效用定义在展望集p上(考虑后果及其概率分布), 是实数;序数效用定义在后果集C上,不涉及概率,可以是自然数2. 基数效用反映偏好强度:(正线性变换下唯一)原数列可变换为: b+c, 2b+c, 3b+c, b+c; 其中 b, c , b0.而序数效用不反映偏好强度,(保序变换下唯一), 原序数列可变换为 16,9,4,1;或 8,6,4,2,或10,7,6,1等.·序数效用的存在性公理1.连通性(可比)2.传递性3.连续性:对任何确定的后果x,优势集与劣势集均为闭集。(教材:P29 §3.1)§3.2 效用函数的构造一、离散型的概率分布后果元素有限·各后果效用设定的步骤 NM法(von Neumann-Morgenstern),也称概率当量法 由公理4: 若ff ,则可找到 0<<1, 使+(1-)第一步: 选定 , Î C , 使f 令 u()=0, u()=1 所选择的 、 应使比较易于进行.第二步:对ff ,求(0<<1), 使+(1-) 则 u()=u(+(1-)= u()+(1-)u() u()=第三步:若pp, 求(0<<1), 使+(1-) 则u()=u(+(1-)=u()+(1-)u() u()=/(-1)第四步:若 ff, 求(0<<1), 使+(1-) 则u()=u(+(1-)= u() u()=1/第五步:一致性校验 设 ff 且 , 已知,(ffff) 由 +(1-) 求得u() 若 u() 与已知的 u() 不符,则反复进行二、三、四步,直到一致性校验通过.例 设 fff一、u()=0, u()=1二、0.7+0.3 u()=0.7三、0.4+0.6 u ()=0.4校验 设0.4+0.6 u()=0.640.7 重复二、三、若u () 不变 u ()=0.5 则通过校验.二、连续型后果集·当C为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线例1.每天学习时间的效用曲线 在1012小时日 处 效用最大 8小时日处效率最高(效用小时) ·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于0,1§3.3 风险与效用一、效用函数包含的内容1.对风险的态度 风险厌恶(Risk Aversion) 风险中立(Risk Neutrality) 风险追求(Risk Proneness/Seeking) 即有冒险倾向 以上是初期对风险的解释(Pratt C.,1964)2.对后果的偏好强度 钱的边缘价值:设某人现有积蓄为0,增加1000地的作用(价值)与有了1000元后再加1500元相等,则此人的财富的价值函数是凹函数。 若他认为1000元(0.5,0; 0.5,2500), 则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。3.效用表示时间偏好十分复杂,我们在第八章再介绍。二、可测价值函数 确定性后果偏好强度的量化定义: 在后果空间X上的实值函数v,对, x, y, zX有i, (®x) f (y®z)当且仅当()-(x)(y)-(z), 且ii, 对正线性变换是唯一确定的。 则称为可测价值函数说明:i,(®x) f (y®z)表示,x之间偏好强度之差超过y, z之间偏好强度之差, ii. 由定义之ii,可测价值函数具有基数性质但与基数效用不同:VF不反映决策人的风险态度。 iii. 它定在后果空间上,能起序数效用的作用但又与OUF不同:能反映后果的偏好强度.三、相对风险态度 设 效用函数u和可测价值函数v在X上都是单调递增,且连续二次可微。1.风险的局部测度 ì > 0 u在x 处凹, 风险厌恶 r(x)=-u”(x)/u(x) í = 0 u在x 处线性, 风险中立 î < 0 u在x 处凸, 风险追求2.偏好强度的局部测度 >0 在x处有递减的边际价值 m(x)=-v”(x)/v(x)= 0 在x处有不变的边际价值 <0 在x处有递增的边际价值3.真正的(相对)风险态度的定义 若m(x)r(x)称为在X'区内相对风险厌恶 m(x)=r(x)称为在X'内相对风险中立 m(x) >r(x)称为在X'内相对风险追求四、风险酬金 k=E(x)-S 这是决策人为了避免风险而愿意损失的金额 五、货币的效用1. 性质 i. 单调递增:愈多愈好 有界:全世界财富总量不足$, u()与u()几乎无差异 ii. x较小(相对于决策人资产而言)时, u(x)近乎线性 iii. x>0时u(x)通常是凹的 递减的边际价值 风险厌恶 x>0与x<0的形状不同, 负债较多有追求风险的倾向.2. 钱的效用曲线的构成 设某人现有1000元存款(某商店有资产10万,企业有1000万等等) i. NM法(见§3.2) 利用 +(1-) ii. 修正的NM法 利用 0.5+0.5 例: 设u(0)=0, u(1000)=1 有3000.5<0>+0.5<1000> u(300)=0.5 又1250.5<0>+0.5<300> u(125)=0.25 5500.5<300>+0.5<1000> u(550)=0.75 由00.5<a>+0.5<500> 设 a=-250 则u(-250)=-u(500)=-0.72 -2500.5<b>+0.5<0>原因:i,价值函数是S型 ii,在一定范围内相对风险态度不变 iii,负债到一定程度以上有冒险倾向 Friedmann-Savage 效用曲线(1948): §3.4 损失、风险和贝叶斯风险一、损失函数L 有些文献采用损失函数进行分析 u(c)=u(,a) l(,a)=-u(,a) 则损失函数与效用作用相同 为了使损失值非负,可取 l(,a)= u(,a)-u(,a) 二、风险函数 自然状态集 -参数空间 行动集 A -决策空间 观察值集 X -测度空间 决策规则 :xa , , 为策略空间 损失l(,a)=l(,(x) 由于X是随机变量,对给定的,采用决策规则时定义风险函数 R(,)= l(,(x) =l(,(x) f (x |) dx 或 l(,(x) p (x |)三、贝叶斯风险r(,) = E R(,)含义:的先验分布为,决策规则为时风险函数的期望值叫贝叶斯风险即: r(,)= R(,) = l(,(x) f (x |) dx () d 或 l(,(x) p (x |)()3- 11

    注意事项

    本文(效用函数-哈尔滨工业大学.docx)为本站会员(修****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开