chap3 决策理论.ppt
《chap3 决策理论.ppt》由会员分享,可在线阅读,更多相关《chap3 决策理论.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Chap3 决策的基本理论决策的基本理论n n决决策策科科学学与与艺艺术术1 决策系统一、系统输入与输出一、系统输入与输出系统系统系统系统(决策研(决策研 究对象)究对象)系统的输入系统的输入系统的输入系统的输入系统的输出系统的输出系统的输出系统的输出可控可控可控可控决策变量(其取值称方案)决策变量(其取值称方案)决策变量(其取值称方案)决策变量(其取值称方案)不可控不可控不可控不可控自然状态变量(其取值称状态)自然状态变量(其取值称状态)自然状态变量(其取值称状态)自然状态变量(其取值称状态)【输入的取值输入的取值输入的取值输入的取值方案和状态的各种组合方案和状态的各种组合方案和状态的各种组
2、合方案和状态的各种组合后果后果后果后果】【输入(后果)的函数输入(后果)的函数输入(后果)的函数输入(后果)的函数】目标函数(益损函数):由决策目标决定目标函数(益损函数):由决策目标决定目标函数(益损函数):由决策目标决定目标函数(益损函数):由决策目标决定约束函数:用来规定方案的可行性约束函数:用来规定方案的可行性约束函数:用来规定方案的可行性约束函数:用来规定方案的可行性二、决策系统的概念结构图二、决策系统的概念结构图 以单决策变量、单状态变量、单决策主体的离以单决策变量、单状态变量、单决策主体的离散型决策为例。散型决策为例。决策变量决策变量决策变量决策变量x x约束条件约束条件约束条件
3、约束条件(l+kl+k)个个个个其它约束其它约束其它约束其它约束k k个个个个目标函数目标函数目标函数目标函数f f(mm个)个)个)个)决策系统决策系统决策系统决策系统S S自然状态变量自然状态变量自然状态变量自然状态变量环境系统环境系统SeSe约束函数约束函数约束函数约束函数v v(l l个)个)个)个)效用函数效用函数效用函数效用函数u u最优(满意)方案最优(满意)方案最优(满意)方案最优(满意)方案决策决策决策决策决策规则决策规则决策目标决策目标决策者决策者决策者决策者r r个可行个可行方案方案rqrq个个后果后果rqmrqm个个目标函数值目标函数值rqmrqm个个效用函数值效用函数
4、值rqlrql个约束函数值个约束函数值q q个状态个状态m m个个目标函数目标函数目标函数目标函数S(S(人人人人)自然状态:自然状态:SeSe(天气天气)效用函数效用函数效用函数效用函数u u决策规则决策规则目标:舒适目标:舒适方案方案带伞带伞不带伞不带伞2222个个后果后果下雨下雨不下雨不下雨出门者偏好出门者偏好决策决策决策决策例:带伞问题决策例:带伞问题决策2 决策问题的模型描述一、决策系统的结构模型一、决策系统的结构模型1.决策系统的机理结构模型决策系统的机理结构模型 了解系统的运行机理了解系统的运行机理2.目标函数和约束函数的确定目标函数和约束函数的确定3.决策变量和自然状态变量的确
5、定决策变量和自然状态变量的确定4.决策系统的变量结构模型决策系统的变量结构模型速生林木材剩余物制浆机械加工木浆造纸绿色消费废弃物n进口废纸浆、进口木浆进口废纸废弃物处理剩余物绿色消费废弃物碱、水回收处理废水资源再利用农田灌溉废液高压蒸汽燃烧苛化发电、供热污泥高强度包装板有机肥料CO2n n林林纸纸一一体体化化创创新新模模式式的的循循环环经经济济机机理理模模型型 BackBack2.目标函数和约束函数的确定目标函数和约束函数的确定n n广义上,有些约束函数和目标函数并无本质区别,都广义上,有些约束函数和目标函数并无本质区别,都广义上,有些约束函数和目标函数并无本质区别,都广义上,有些约束函数和目
6、标函数并无本质区别,都由决策目标派生而来。例如由决策目标派生而来。例如由决策目标派生而来。例如由决策目标派生而来。例如“成本函数成本函数成本函数成本函数”:作为目标函数,在方案第二轮筛选(需求最优方案)时,作为目标函数,在方案第二轮筛选(需求最优方案)时,作为目标函数,在方案第二轮筛选(需求最优方案)时,作为目标函数,在方案第二轮筛选(需求最优方案)时,寻求成本最低方案;寻求成本最低方案;寻求成本最低方案;寻求成本最低方案;作为约束函数,在方案第一轮筛选(需求可行方案)时,作为约束函数,在方案第一轮筛选(需求可行方案)时,作为约束函数,在方案第一轮筛选(需求可行方案)时,作为约束函数,在方案第
7、一轮筛选(需求可行方案)时,将成本高于某一约束界限值的方案舍弃。将成本高于某一约束界限值的方案舍弃。将成本高于某一约束界限值的方案舍弃。将成本高于某一约束界限值的方案舍弃。思考:如何确定目标函数和约束函数?一般而言:一般而言:n目标函数是决策者需要追求并努力使其达到目标函数是决策者需要追求并努力使其达到最优的变量,如销售量、利润、工期、质量等。最优的变量,如销售量、利润、工期、质量等。n约束函数是决策者希望确保并用以实现决策方案约束函数是决策者希望确保并用以实现决策方案的基本条件(如资金、劳动力、产能、原料供应等)的基本条件(如资金、劳动力、产能、原料供应等)或不希望违反的制约因素(如环保、政
8、策、法律)或不希望违反的制约因素(如环保、政策、法律)即在于决策者是追求即在于决策者是追求即在于决策者是追求即在于决策者是追求“最优最优最优最优”,还是必须,还是必须,还是必须,还是必须“达标达标达标达标”。3.决策变量和自然状态变量的确定决策变量和自然状态变量的确定n n决策变量是实现决策目标的手段和途径。n n决策变量的确定一般没有固定方法,经验和创造性思维很重要。n n一些分析工具有益于决策变量的确定,如决策系统的输入体系结构(与输出体系类似);目标手段链等。4.决策系统的变量结构模型决策系统的变量结构模型n n将决策系统的输入变量、输出变量体系间的关联画在一张图上,即形成决策系统的变量
9、结构模型。决策变量决策变量x x1 1决策变量决策变量x x2 2决策变量决策变量x x3 3决策变量决策变量x x4 4状态变量状态变量 1 1状态变量状态变量 2 2状态变量状态变量 3 3目标函数目标函数f f1 1目标函数目标函数f f2 2约束函数约束函数v v1 1约束函数约束函数v v2 2约束函数约束函数v v3 3输入变量输入变量关联关联输出变量输出变量n n决策系统的变量结构模型决策系统的变量结构模型决策系统的变量结构模型决策系统的变量结构模型二、决策系统模型 描述了系统的输出和输描述了系统的输出和输入之间的函数关系,包括目标入之间的函数关系,包括目标函数(或效用函数)模型
10、和约函数(或效用函数)模型和约束函数模型。束函数模型。1.目标函数模型一般形式:n nfi=fi(x,),i=1,m fi第i个目标函数;i=1,mn nx=x1,x2,xnT决策变量向量 xi第i个决策变量,i=1,nn n=1,2,pT自然状态变量向量 i第i个自然状态变量,i=1,p2.约束函数模型 一般形式:n nvi i=vi i(x,(x,),i),i=1,=1,l l vi i第第i i个约束函数个约束函数3.效用函数模型n nui i=ui i(x,(x,),i),i=1,=1,m m ui i第第i i个效用函数(效用函数总是越大个效用函数(效用函数总是越大越好。)越好。)F
11、思考:效用函数总是越大越好。目标函数是否也如此?n目标函数有可能越大越好,如利润;目标函数有可能越大越好,如利润;n目标函数有可能越小越好,如成本;目标函数有可能越小越好,如成本;n目标函数有可能越接近某一定值越好,目标函数有可能越接近某一定值越好,例如:例如:按法正林思想,幼龄林、中龄林、按法正林思想,幼龄林、中龄林、近成熟林的面积比以各近成熟林的面积比以各1/3为佳;蓄积比以为佳;蓄积比以1:3:6为佳。为佳。三、决策模型n决策模型由决策目标模型和决策约束模型两部分组成。决策模型由决策目标模型和决策约束模型两部分组成。n决策模型的一般形式(以单目标决策模型为例):决策模型的一般形式(以单目
12、标决策模型为例):s.t.上式中:求取使目标函数到达最大值的求取使目标函数到达最大值的 决策向量决策向量X的值。的值。第第i个约束函数的约束界限值。个约束函数的约束界限值。F满足所有约束条件的方案成为可行方案;所有满足所有约束条件的方案成为可行方案;所有可行方案的集合称为决策变量的可行域。可行方案的集合称为决策变量的可行域。决策变量的可行域表示为:决策变量的可行域表示为:X x|vi(x)(或,或,)i i,i=,i=1 1,l l,x xX。n类似地,多目标决策模型的一般形式为:类似地,多目标决策模型的一般形式为:s.t.i=i=1 1,l,ln离散型决策模型n对于离散型决策问题,决策模型难
13、以对于离散型决策问题,决策模型难以表示成解析形式,只能以各变量和函数表示成解析形式,只能以各变量和函数的离散值的集合、矩阵、表格或图形等的离散值的集合、矩阵、表格或图形等形式给出。形式给出。例如:离散型决策模型的矩阵形式X=x(1),x(2),x(r)T=(1),(2),(q)TP=p(1),p(2),p(q)TU 式中,X决策变量x的可行方案向量;自然状态变量的状态向量;P自然状态变量的概率分布向量;U效用矩阵再如:离散型决策模型的决策表形式 自然状态 及其概率3 主观概率 决策后果的两个基本特征产生了决策的决策后果的两个基本特征产生了决策的两个基本问题:两个基本问题:n n后果的不确定性后
14、果的不确定性主观概率主观概率n n后果的效用性后果的效用性 效用函数效用函数一、主观概率概念1.1.客观概率客观概率2.主观概率二、主观概率的估计方法1.1.逻辑推理法逻辑推理法逻辑推理法逻辑推理法 例如,每一张彩票中奖的概率例如,每一张彩票中奖的概率P=P=m/nm/n(n n为本期彩为本期彩票销量,票销量,mm为本期彩票中奖总数)为本期彩票中奖总数)2.2.利用过去、现在的数据资料估计(频度估算)利用过去、现在的数据资料估计(频度估算)利用过去、现在的数据资料估计(频度估算)利用过去、现在的数据资料估计(频度估算)例如,某商场根据例如,某商场根据A A商品过去商品过去3030天的日销售记录
15、统计,天的日销售记录统计,计算各销量区间的发生频度,由此预计下月该产品某计算各销量区间的发生频度,由此预计下月该产品某销量区间的概率。销量区间的概率。3.3.概率分布模型法概率分布模型法概率分布模型法概率分布模型法 根据某随机变量的理论概率分布模型,由已知数据根据某随机变量的理论概率分布模型,由已知数据确定模型参数,由此预测该随机变量的概率分布。确定模型参数,由此预测该随机变量的概率分布。4.4.市场调查法市场调查法市场调查法市场调查法5.5.专家调查法(经验估计法)专家调查法(经验估计法)专家调查法(经验估计法)专家调查法(经验估计法)6.后验估计法后验估计法n用已发生的随机试验的信息修正原
16、先得到用已发生的随机试验的信息修正原先得到的主观概率,得到新的主观概率。的主观概率,得到新的主观概率。n该方法的使用前提:能够得到后验信息。该方法的使用前提:能够得到后验信息。4 决策的效用理论一、效用函数一、效用函数一、效用函数一、效用函数1.1.效用函数是后果的实值函数效用函数是后果的实值函数效用函数是后果的实值函数效用函数是后果的实值函数 单目标决策问题的效用函数可表示为:单目标决策问题的效用函数可表示为:单目标决策问题的效用函数可表示为:单目标决策问题的效用函数可表示为:u=u=u(cu(c)=)=uc(x,uc(x,)=)=u(x,u(x,)式中式中,c c=c(x,c(x,)后果,
17、由决策变量和自然状态变后果,由决策变量和自然状态变量决定。其矩阵形式如下:量决定。其矩阵形式如下:c c=c(x,c(x,)效用函数和后果的关系效用函数和后果的关系1 1)若决策者认为后果)若决策者认为后果c c(i i1 1,i i2 2)优于后果优于后果c c(j j1 1,j j2 2),),记作:记作:c c(i i1 1,i i2 2)c c(j j1 1,j j2 2)则则 u u(i i1 1,i i2 2)u u(j j1 1,j j2 2)2 2)若决策者认为后果)若决策者认为后果c c(i i1 1,i i2 2)劣于后果劣于后果c c(j j1 1,j j2 2),),记
18、作:记作:c c(i i1 1,i i2 2)c c(j j1 1,j j2 2)则则 u u(i i1 1,i i2 2)u u(j j1 1,j j2 2)3 3)若决策者认为后果)若决策者认为后果c c(i i1 1,i i2 2)无异于后果无异于后果c c(j j1 1,j j2 2),),记作:记作:c c(i i1 1,i i2 2)c c(j j1 1,j j2 2)则则 u u(i i1 1,i i2 2)u u(j j1 1,j j2 2)2.效用函数效用函数u是后果优劣的一种度量,掺和着决策是后果优劣的一种度量,掺和着决策者的偏好和对风险的态度。者的偏好和对风险的态度。甲属
19、于中间型决策者;乙属于保守型决策者;丙属于冒险型决策者。二、效用函数的类型二、效用函数的类型冲动型冲动型冲动型冲动型超脱型超脱型超脱型超脱型三、期望效用函数及其决策规则1.概念 后果效用值只反映了后果的优劣而不能反映方后果效用值只反映了后果的优劣而不能反映方后果效用值只反映了后果的优劣而不能反映方后果效用值只反映了后果的优劣而不能反映方案的优劣(例如单目标、单变量的效用矩阵中,案的优劣(例如单目标、单变量的效用矩阵中,案的优劣(例如单目标、单变量的效用矩阵中,案的优劣(例如单目标、单变量的效用矩阵中,每个方案每个方案每个方案每个方案x xi i都有都有都有都有q q个效用值来描述其优劣)。个效
20、用值来描述其优劣)。个效用值来描述其优劣)。个效用值来描述其优劣)。因此方案之间的优劣无法直观地比较。需因此方案之间的优劣无法直观地比较。需因此方案之间的优劣无法直观地比较。需因此方案之间的优劣无法直观地比较。需要对其求数学期望。要对其求数学期望。要对其求数学期望。要对其求数学期望。即即即即 u(xu(x)=)=E E u(xu(x,)2.基于期望效用函数的风险型决策规则n n贝努利原理:期望效用值最大者为最优贝努利原理:期望效用值最大者为最优方案。方案。n n对决策者进行询问,如心理测试法对决策者进行询问,如心理测试法对决策者进行询问,如心理测试法对决策者进行询问,如心理测试法标标标标准测定
21、法。准测定法。准测定法。准测定法。n n原理:采用问答方式,了解决策者对随机原理:采用问答方式,了解决策者对随机原理:采用问答方式,了解决策者对随机原理:采用问答方式,了解决策者对随机事件与确定型事件在效用值上的等价关系,事件与确定型事件在效用值上的等价关系,事件与确定型事件在效用值上的等价关系,事件与确定型事件在效用值上的等价关系,通过损益值及其对应的效用值得出相应坐通过损益值及其对应的效用值得出相应坐通过损益值及其对应的效用值得出相应坐通过损益值及其对应的效用值得出相应坐标点,以光滑曲线连接起来,得到该决策标点,以光滑曲线连接起来,得到该决策标点,以光滑曲线连接起来,得到该决策标点,以光滑
22、曲线连接起来,得到该决策者的效用曲线。者的效用曲线。者的效用曲线。者的效用曲线。四、效用函数的构造四、效用函数的构造具体做法:n n对于特定的决策者,在不同的对于特定的决策者,在不同的5 5个事件中(个事件中(A A、B B、C C、D D、E E)确定其)确定其“最满足最满足”和和“最厌恶最厌恶”的事件(例如的事件(例如A A最满足,最满足,E E最厌恶),令最满足事件的效用为最厌恶),令最满足事件的效用为1 1,最,最厌恶事件的效用为厌恶事件的效用为0u(A)=1,u(E)=00u(A)=1,u(E)=0。若要测定若要测定u(Bu(B),则提问:,则提问:“有方案有方案a a1 1,a,a
23、2 2,:,:a a1 1可以可以P P的概率获得的概率获得A A和(和(1 1P P)的概率获得)的概率获得E E;a a2 2有有1 1概率获得概率获得B B。你认为你认为P P?时,方案?时,方案a a1 1与与a a2 2等效?等效?”此时,有此时,有P*u(A)+(1-P)*P*u(A)+(1-P)*u(Eu(E)=)=u(Bu(B)5 多目标决策理论多目标决策理论一、多目标决策问题及其模型一、多目标决策问题及其模型uu1.多目标决策问题:多目标决策问题:选择一个最优的可行方案,以满足若干个选择一个最优的可行方案,以满足若干个目标目标f1,f2,fm的要求。的要求。2.多目标决策问题
24、的数学模型 或或s.t.vi(x)(或=,)i,i=1,.,l 表示形式:表示形式:上式中:xx1,xn T n维欧几里得空间R n(称作决策空间决策空间)中的决策向量;xi 第i个决策变量,i=1,.,n;X 决策空间可行域;X 决策空间值域;f(x)=f1(x),f2(x),.,fm(x)T m维欧几里得空间Rm(称作目标空间目标空间)中的目标向量;fi(x)第i个目标函数,i=1,.,m;vi(x)第i个约束函数,i=1,.,l;i 第i个约束函数的约束界限值,i=1,.,l。3.映射与反映射映射与反映射n n决策向量决策向量x x x x1 1,x xn n T T的某个常数向量值:的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- chap3 决策理论 决策 理论
限制150内