第二讲效用函数PPT讲稿.ppt
《第二讲效用函数PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第二讲效用函数PPT讲稿.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二讲效用函数第1页,共59页,编辑于2022年,星期二对效用的理解对效用的理解:最好吃的东西最好吃的东西兔子和猫争论,世界上什么东西最好吃。兔子和猫争论,世界上什么东西最好吃。兔子说,兔子说,“世界上萝卜最好吃。萝卜又甜又脆又解渴,我一想起萝卜就世界上萝卜最好吃。萝卜又甜又脆又解渴,我一想起萝卜就要流口水。要流口水。”猫不同意,说,猫不同意,说,“世界上最好吃的东西是老鼠。老鼠的肉非常嫩,嚼世界上最好吃的东西是老鼠。老鼠的肉非常嫩,嚼起来又酥又松,味道美极了!起来又酥又松,味道美极了!”兔子和猫争论不休、相持不下,跑去请猴子评理。兔子和猫争论不休、相持不下,跑去请猴子评理。猴子听了,不由得大
2、笑起来:猴子听了,不由得大笑起来:“瞧你们这两个傻瓜蛋,连这点儿常识瞧你们这两个傻瓜蛋,连这点儿常识都不懂!世界上最好吃的东西是什么?是桃子!桃子不但美味可口,都不懂!世界上最好吃的东西是什么?是桃子!桃子不但美味可口,而且长得漂亮。我每天做梦都梦见吃桃子。而且长得漂亮。我每天做梦都梦见吃桃子。”兔子和猫听了,全都直摇头。那么,世界上到底什么东西最好吃?兔子和猫听了,全都直摇头。那么,世界上到底什么东西最好吃?以上的故事说明效用完全是个人的心理感觉。以上的故事说明效用完全是个人的心理感觉。不同的偏好决定了对同一种商品效用大小的不同评价。不同的偏好决定了对同一种商品效用大小的不同评价。第2页,共
3、59页,编辑于2022年,星期二圣彼得堡悖论(St.Petersburg Paradox/game)圣彼得堡悖论是数学家丹尼尔圣彼得堡悖论是数学家丹尼尔伯努利(伯努利(Daniel Bernoulli)的表兄尼古拉)的表兄尼古拉伯努利伯努利(Nicolaus Bernoulli)在在1738提出的一个概率期望值悖论,它来自于提出的一个概率期望值悖论,它来自于一种掷币游戏,即圣彼得堡游戏一种掷币游戏,即圣彼得堡游戏(表表1)。问题:你愿意花问题:你愿意花100元来参加一次圣彼得堡游戏吗?元来参加一次圣彼得堡游戏吗?第3页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理问题:问题
4、:某公司拟推出一种新产品,经预测该产品在某公司拟推出一种新产品,经预测该产品在市场看好的情况下,可以获利市场看好的情况下,可以获利10万;在市场万;在市场前景较差时,将亏损前景较差时,将亏损1万元。市场看好和较万元。市场看好和较差的概率分别为差的概率分别为0.6和和0.4,是否推出该新产,是否推出该新产品?品?若另有一产品可稳获利若另有一产品可稳获利2万元,推出哪种产万元,推出哪种产品更好?品更好?这是一个这是一个随机决策随机决策问题。问题。第4页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理在随机决策中,决策系统中的决策方案均是在随机决策中,决策系统中的决策方案均是在状态
5、空间背景中加以比较,并按照某种规在状态空间背景中加以比较,并按照某种规则,选出决策者最满意的行动方案。则,选出决策者最满意的行动方案。在本章中,我们用在本章中,我们用事态体事态体表示在随机性状态表示在随机性状态空间中的行动方案,方案的比较表示为事态空间中的行动方案,方案的比较表示为事态体的比较,并引入体的比较,并引入效用效用的概念,用以衡量事的概念,用以衡量事态体(行动方案)的优劣。态体(行动方案)的优劣。第5页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理2.1.1事态体及其关系事态体及其关系 1事态体的概念事态体的概念 定义定义2.1 具有两种或两种以上有限个可能结果的
6、方案具有两种或两种以上有限个可能结果的方案(或事情),称为事态体。(或事情),称为事态体。事态体中各可能结果出现的概率是已知的。事态体中各可能结果出现的概率是已知的。事态体即随机性状态空间中的行动方案。事态体即随机性状态空间中的行动方案。第6页,共59页,编辑于2022年,星期二1事态体的概念事态体的概念设某事态体的设某事态体的n个可能结果为:个可能结果为:o1,o2,on各结果出现的概率是相应为:各结果出现的概率是相应为:p1,p2,pn 则该事态体记为:则该事态体记为:T(p1,o1;p2,o2;pn,on)特别当特别当n 2时,称时,称 T为简单事态体,此时为简单事态体,此时 T(p,o
7、1;1p,o2)第7页,共59页,编辑于2022年,星期二1事态体的概念事态体的概念事态体可以用树形图表示如下:事态体可以用树形图表示如下:Tp1p2pno1o2on当当n 2时:时:pT1-po1o2第8页,共59页,编辑于2022年,星期二事态体集合事态体集合 的性质的性质在凸线性组合下,在凸线性组合下,是闭集。即:是闭集。即:若若T1,T2,则当,则当0 1时,有时,有 T1(1)T2 两个事态体的凸线性组合仍是一个事态体。两个事态体的凸线性组合仍是一个事态体。T(0,o1;0,o2;1,oj;0,on)称称T为为退化事态体。退化事态体。退化事态体仍属于事态体集合。退化事态体仍属于事态体
8、集合。第9页,共59页,编辑于2022年,星期二2事态体的比较事态体的比较定义定义2.2设设o1,o2是事态体是事态体T的任意两个结果值,根据的任意两个结果值,根据决策目标和决策者偏好,决策目标和决策者偏好,o1和和o2有如下关系:有如下关系:若偏好结果值若偏好结果值o1,则称,则称o1优于优于o2,记作,记作o1o2;反之,称;反之,称o1劣于劣于o2,记作,记作o1 o2。若对结果值若对结果值o1,o2无所偏好,则称无所偏好,则称o1无差异无差异于于o2,记作,记作o1 o2。若不偏好结果值若不偏好结果值o1,则称,则称o1不优于不优于o2,记作,记作 o1 o2;反之,称;反之,称o1不
9、劣于不劣于o2,记作,记作o1 o2。第10页,共59页,编辑于2022年,星期二2事态体的比较事态体的比较定义定义 2.3 设两个简单事态体设两个简单事态体 T1,T2具有相同的结果值具有相同的结果值 o1,o2,即,即:T1(p1,o1;1p1,o2)T2(p2,o1;1p2,o2)并假定并假定o1o2,则:,则:若若p1p2,称事态体,称事态体T1无差异于无差异于T2,记作,记作T1T2。若若p1p2,称事态体,称事态体T1优于优于T2,记作记作T1T2;反之,称事态体反之,称事态体T1劣劣于于T2,记作,记作T1 T2。第11页,共59页,编辑于2022年,星期二2事态体的比较事态体的
10、比较定义定义 2.4 设两个简单事态体设两个简单事态体 T1,T2仅具有一个相同结仅具有一个相同结果值,另一个结果值不相同,即果值,另一个结果值不相同,即:T1(p1,o1;1p1,o0)T2(p2,o2;1p2,o0)且且o2 o1 o0,若若p1p2,则事态体,则事态体T2优于优于T1,记作,记作T2T1。若若T1T2,则必有,则必有p1p2。第12页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理2.1.2理性行为公理理性行为公理 公理公理2.l(连通性(连通性,可比性),可比性)事态体集合事态体集合上事态体的优劣关系是连通的。上事态体的优劣关系是连通的。即若即若T1,
11、T2 则或者则或者T1T2,或者或者T2T1,或者,或者T1T2,三者必居其一。三者必居其一。表示任意两个事态体都是可以比较其优劣的!表示任意两个事态体都是可以比较其优劣的!第13页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理2.1.2理性行为公理理性行为公理 公理公理2.2(传递性传递性)事态体集合事态体集合上事态体的优劣关系是传递的。上事态体的优劣关系是传递的。即若即若T1、T2、T3,且,且T1T2,T2T3,则必有,则必有T1T3。表示任意多个事态体的优劣是可以排序的表示任意多个事态体的优劣是可以排序的(若有些事态体无差异,可排在同一位置。)(若有些事态体无差异,
12、可排在同一位置。)满足公理满足公理2.1和公理和公理2.2的的事态体集合称为全序集。事态体集合称为全序集。第14页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理2.1.2理性行为公理理性行为公理 公理公理2.3(复合保序性,替代性复合保序性,替代性)若若T1,T2,Q,且,且0p1,则,则T1T2 当且仅当当且仅当 pT1(1p)Q pT2(1p)Q。表示任意事态体的优劣关系是可以复合的,表示任意事态体的优劣关系是可以复合的,复合后的事态体保持原有的优劣关系不变。复合后的事态体保持原有的优劣关系不变。第15页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理
13、2.1.2理性行为公理理性行为公理 公理公理2.4(相对有序性,连续性,偏好的有界相对有序性,连续性,偏好的有界性性)若若T1,T2,T3,且,且T1T2 T3 则存在数则存在数 p,q,0pl,0q1,使得:,使得:pT1(1p)T3 T2 qT1(1q)T3 表示任意事态体都不是无限优,也不是无限表示任意事态体都不是无限优,也不是无限劣。劣。第16页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理2.1.3事态体的基本性质事态体的基本性质 性质性质2.1设事态体设事态体 T1(p,o1;1p,o0)T2(x,o2;1x,o0)且且 o1o0,o2o0,若,若o2o1 则存
14、在则存在x=pp使得使得 T1T2 称称x为为可调概率值可调概率值。第17页,共59页,编辑于2022年,星期二2.1理性行为公理理性行为公理2.1.3事态体的基本性质事态体的基本性质 性质性质2.2(确定当量和无差异概率)(确定当量和无差异概率)设事态体设事态体T(x,o1;1x,o2)且)且o1o2。则对于满足优劣关系则对于满足优劣关系o1o o2的任意结果的任意结果值值o,必存在,必存在xp(0pl),使得),使得T(p,o1;1p,o2)o称结果值称结果值o为事态体为事态体T的的确定当量确定当量,称,称p为为o关于关于o1与与o2的的无差异概率无差异概率。第18页,共59页,编辑于20
15、22年,星期二2.1.3事态体的基本性质事态体的基本性质性质性质2.3任一事态体无差异于一个简单事态体。任一事态体无差异于一个简单事态体。设有事态体设有事态体T(p1,o1;p2,o2;pn,on)则必存在一个简单事态体则必存在一个简单事态体T(p,o*;1p,o0)T其中:其中:o*max o1,o2,on o0 min o1,o2,on 且:且:这里,这里,qj(j=1,2,n)为为oj关于关于o*与与o0的无差异概率。的无差异概率。第19页,共59页,编辑于2022年,星期二2.1.3事态体的基本性质事态体的基本性质根据性质根据性质2.3比较一般事态体之间的优劣关系,可以转化为比比较一般
16、事态体之间的优劣关系,可以转化为比较简单事态体之间的优劣关系较简单事态体之间的优劣关系(将问题简化)(将问题简化)得到事态体之间两两的优劣或无差异关系后,再得到事态体之间两两的优劣或无差异关系后,再根据公理根据公理2.2(传递性)即可得到所讨论事态体的(传递性)即可得到所讨论事态体的排序。排序。第20页,共59页,编辑于2022年,星期二2.2 效用函数的定义和构造效用函数的定义和构造设有决策系统,在离散情况下,结果值可以设有决策系统,在离散情况下,结果值可以表示为决策矩阵:表示为决策矩阵:第21页,共59页,编辑于2022年,星期二2.2 效用函数的定义和构造效用函数的定义和构造矩阵矩阵O的
17、第的第i行表示第行表示第i个可行方案的个可行方案的n个可能个可能结果值,即事态体结果值,即事态体Ti(p1,oi1;p2,oi2;pn,oin)(i=1,2,m)决策就是要对这决策就是要对这 m个事态体进行排序。个事态体进行排序。由第一节中的性质由第一节中的性质2.3知,存在简单事态体知,存在简单事态体T,使得,使得Ti(pi,o*;1pi,o0)Ti问题又化为对这问题又化为对这m个简单事态体个简单事态体Ti进行排序。进行排序。第22页,共59页,编辑于2022年,星期二2.2 效用函数的定义和构造效用函数的定义和构造 Ti(pi,o*;1pi,o0)Ti注意到这注意到这m个简单事态体个简单事
18、态体Ti具有相同的结果具有相同的结果值值o*、o0,根据定义,根据定义2.3,其优劣关系可以,其优劣关系可以由比较由比较pi的大小决定。的大小决定。根据性质根据性质2.3qjj是结果值是结果值oij关于关于o*与与o0的的无差异概率无差异概率。其中:其中:o*o0 第23页,共59页,编辑于2022年,星期二2.2 效用函数的定义和构造效用函数的定义和构造2.2.1 效用和效用函数的概念效用和效用函数的概念1.效用的概念效用的概念定义定义2.5设决策问题的各可行方案有多种可能的结设决策问题的各可行方案有多种可能的结果值果值o,依据决策者的主观愿望和价值倾向,依据决策者的主观愿望和价值倾向,每个
19、结果值对决策者均有不同的价值和作每个结果值对决策者均有不同的价值和作用。用。反映结果值反映结果值o对决策者的价值和作用大对决策者的价值和作用大小的量值称为效用。小的量值称为效用。第24页,共59页,编辑于2022年,星期二2.2 效用函数的定义和构造效用函数的定义和构造2.2.1 效用和效用函数的概念效用和效用函数的概念2.效用函数的概念效用函数的概念定义定义2.6若在事态体集合若在事态体集合上存在实值函数上存在实值函数u,有:,有:(1)对任意的对任意的T1、T2,T1T2 当且仅当当且仅当u(T1)u(T2)(2)对任意的对任意的T1、T2,且且0 1,有,有u T1(1)T2=u(T1)
20、(1)u(T2)则称则称u(T)为定义在为定义在上的效用函数。上的效用函数。第25页,共59页,编辑于2022年,星期二2.2.1 效用和效用函数的概念效用和效用函数的概念3.估计效用函数的方法估计效用函数的方法(1)标准效用测定法)标准效用测定法(概率当量法,概率当量法,VM法法)思路思路:对于给定的结果值,测定其效用值。:对于给定的结果值,测定其效用值。设有决策系统(设有决策系统(,A,F),其结果值集),其结果值集合为:合为:O(o1,o2,on)记:记:o*max o1,o2,on o0 min o1,o2,on 对于每一个结果值对于每一个结果值oj都存在一个概率值都存在一个概率值pj
21、,使得使得oj(pj,o*;1pj,o0)pj就可以作为就可以作为结果值结果值oj的效用值。的效用值。第26页,共59页,编辑于2022年,星期二2.2.1 效用和效用函数的概念效用和效用函数的概念(1)标准效用测定法)标准效用测定法(概率当量法,概率当量法,VM法法)步骤步骤设设 u(o*)=1,u(o0)=0;建立简单事态体(建立简单事态体(x,o*;1-x,o0),其中),其中x称为可调概率;称为可调概率;通过反复提问,不断改变可调概率值通过反复提问,不断改变可调概率值x,让,让决策者权衡比较,直至当决策者权衡比较,直至当x=pj时时 oj(pj,o*;1pj,o0)测得结果值测得结果值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 效用 函数 PPT 讲稿
限制150内