书签分享收藏举报版权申诉 / 58

立即下载

当前位置：首页 > 应用文书 > PPT文档 > 数学随机决策理论与方法.pptx

数学随机决策理论与方法.pptx

上传人：莉***

文档编号：73033705

上传时间：2023-02-15

格式：PPTX

页数：58

大小：445.93KB

( 4.5 )

《数学随机决策理论与方法.pptx》由会员分享，可在线阅读，更多相关《数学随机决策理论与方法.pptx（58页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、2023/2/14 22:351/61随机决策理论与方法1、主观概率2、效用函数3、决策准则4、贝叶斯决策分析5、多属性决策分析6、多目标决策分析7、序贯决策分析第1页/共58页2023/2/14 22:352/61多属性决策分析多目标决策什么是多目标决策问题？(例如购买衣服时，款式、价格、颜色、质量等可能都是决策目标)。多目标决策问题的特点：决策问题的目标多于一个；多个目标间不可公度(non-commensurable)，即各目标没有统一的衡量标准，难以比较；各目标之间存在矛盾。一般将决策变量离散、决策方案有限的多目标决策问题称为多属性(Multi-attribute)决策问题；而将决策变量

2、连续、有无限决策方案的多目标决策问题称为多目标(Multi-objective)决策问题。两者又可以统称为多准则(Multi-criterion)决策问题。第2页/共58页2023/2/14 22:353/61多属性决策分析相关术语属性(Attribute)：备选方案的特征、品质或性能参数(如描述服装的款式、颜色、布料、质量、价格)，也称为指标。指标体系(Index Systems)：一系列互相联系、互相补充的指标所组成的统一整体。指标体系往往由多层组成(习惯上称为一级指标、二级指标等)，层次结构分为树状结构和网状结构，其中以树状结构最常用。一级指标总目标二级指标三级指标第3页/共58页202

3、3/2/14 22:354/61多属性决策分析相关术语目标(Objective)：决策人的愿望或决策人所希望达到的、努力的方向(如物美价廉)。在多目标决策中，目标是求极值的对象，是需要优化的函数式。目的(Goal)：在特定时间、空间状态下，决策人的期望，是目标的具体数值表现。目标和目的常混用。准则(Criterion)：判断的标准或度量事物价值的原则及检验事物合意性的规则，兼指属性和目标。第4页/共58页2023/2/14 22:355/61多属性决策分析求解过程第5页/共58页2023/2/14 22:356/61多属性决策分析目标与属性在多目标决策中，决策目标常用目标集、目标递阶分层结构以

4、及属性集描述；目标递阶分层结构的最下层目标要用一个或多个属性来描述；不同的方案对应的各属性值存在差异，也就导致目标实现的差异，因此可借此来评价方案的优劣；替代属性：某些目标无法用属性值直接度量时，需要使用替代属性对目标进行度量。如师资队伍的质量可以用学历结构、职称结构、专业结构、科研能力等替代属性来衡量。(寻找“替代属性/替代变量”在科学研究中是非常重要的)第6页/共58页2023/2/14 22:357/61多属性决策分析目标与属性属性选择的要求：每个属性是可测和可理解的；属性集是最小完备集：既要能够描述决策问题的所有(重要)方面，又不能有冗余；属性的测量值是可运算的；属性集内的各属性相互独

5、立、可分解。但在实际决策中，上述要求很难达到，这也正是我们开展决策理论与方法研究的动力源。第7页/共58页2023/2/14 22:358/61多属性决策分析目标与属性例：某流域水资源项目建设目标(指标体系)及属性第8页/共58页2023/2/14 22:359/61多属性决策分析问题的符号表示MA=X表示方案集，X=x1,x2,xmA表示属性集，A=a1,a2,an表示状态集，=1,2,kV表示值集，所有可能取值的集合:V，分布函数，确定各状态发生的可能性f:XAV，目标函数，确定各方案对应的属性值第9页/共58页2023/2/14 22:3510/61多属性决策分析问题的符号表示例：给定自

6、然状态的多属性决策问题方案集方案集方案集方案集发电发电发电发电作物作物作物作物船运船运船运船运CODCOD水流失水流失水流失水流失土流失土流失土流失土流失景点数景点数景点数景点数动物动物动物动物植物植物植物植物减灾减灾减灾减灾x x1 18.98.9454555557.27.2828277773 341411581588787x x2 27.67.6626247476.46.4767682824 451512132135454x x3 39.29.2464667679.59.5919180803 339391241249999第10页/共58页2023/2/14 22:3511/61多属性决策

7、分析属性值预处理剩下的问题是我们如何评价方案的优劣。属性值预处理的目标是规范化各属性值，使其能够真正体现方案优劣的实际价值。属性值类型：效益型指标：属性值越大越好；成本型指标：属性值越小越好；中性指标：属性值取某一个恰当的值最优，过大、过小都不合适。第11页/共58页2023/2/14 22:3512/61多属性决策分析属性值预处理预处理主要有两项任务：非量纲化：通过某种方法消除量纲的选用对决策或评价结果的影响。归一化：不同属性的属性值取值范围存在很大差别，为了真实反映各属性值的价值，需要将属性值统一变换到0,1区间上以消除属性取值范围的差异对决策或评价结果的影响。第12页/共58页2023/

8、2/14 22:3513/61多属性决策分析属性值预处理设fi(a)为方案i的a属性值，记fmax=max(fi(a)，fmin=min(fi(a)线性变换效益型。变换z:fi(a)zi(a)定义为：zi(a)=fi(a)/fmax；成本型。变换z:fi(a)zi(a)定义为：zi(a)=1-fi(a)/fmax；或者变换z:fi(a)zi(a)定义为：zi(a)=fmin/fi(a)。标准0-1变换效益型。zi(a)=(fi(a)-fmin)/(fmax-fmin)；成本型。zi(a)=(fmax-fi(a)/(fmax-fmin)。向量规范化：zi(a)=fi(a)/(ifin(a)1/n

9、(n可以取1或2)。第13页/共58页2023/2/14 22:3514/61多属性决策分析属性值预处理j ji i人均论人均论人均论人均论著著著著(a a1 1)科研经科研经科研经科研经费费费费(a a3 3)逾期毕逾期毕逾期毕逾期毕业率业率业率业率(a a4 4)1 10.00000.00001.00001.00000.00000.00002 20.03700.03700.78800.78800.71420.71423 30.18520.18520.20700.20700.48570.48574 40.07410.07410.57590.57590.22860.22865 51.0000

10、1.0000 0.05680.05681.00001.0000j ji i人均论人均论人均论人均论著著著著(a a1 1)科研经科研经科研经科研经费费费费(a a3 3)逾期毕逾期毕逾期毕逾期毕业率业率业率业率(a a4 4)逾期毕逾期毕逾期毕逾期毕业率业率业率业率(a a4 4)1 10.03570.03571.00001.00000.00000.00000.25530.25532 20.07140.07140.80000.80000.53190.53190.54550.54553 30.21430.21430.25200.25200.36170.36170.40000.40004 40.1

11、071 0.1071 0.60000.60000.17020.17020.30770.30775 51.0000 1.0000 0.05680.05680.74470.74471.00001.0000j ji i人均论人均论人均论人均论著著著著(a a1 1)生师生师生师生师比比比比(a a2 2)科研经科研经科研经科研经费费费费(a a3 3)逾期毕逾期毕逾期毕逾期毕业率业率业率业率(a a4 4)1 10.50.55 5500050004.74.72 21.01.07 7400040002.22.23 33.03.01010126012603.03.04 41.51.54 43000300

12、03.93.95 514.014.02 22842841.21.2f fmaxmax1414500050004.74.7f fminmin0.50.52842841.21.2(f f2 2)1/21/214.4414.44718871887.257.25j ji i人均论人均论人均论人均论著著著著(a a1 1)科研经科研经科研经科研经费费费费(a a3 3)逾期毕逾期毕逾期毕逾期毕业率业率业率业率(a a4 4)1 10.03460.03460.69560.69560.64820.64822 20.06930.06930.55650.55650.30340.30343 30.20780.20

13、780.17530.17530.41370.41374 40.10390.10390.41740.41740.53780.53785 50.9695 0.9695 0.03950.03950.16550.1655线性变换标准0-1变换向量变换第14页/共58页2023/2/14 22:3515/61多属性决策分析属性值预处理中性属性(最优值为给定区间)规范化策略下极限f0上极限f0最优区间f1f21zfzi(a)=(1)fi(a)f0，0(2)f0fi(a)f1，1-(f1-fi(a)/(f1-f0)(3)f1fi(a)f2，1(4)f2fi(a)0(i=1,2,n)利用拉格朗日法可将该优化问

14、题转为求解下列方程组：第23页/共58页2023/2/14 22:3524/61多属性决策分析权重确定Matlab求解：Function weight(A)D=diag(diag(A*A)+1)-A-A;n=length(A);Row1=ones(n,1);Col1=ones(1,n);D=D Row1;Col1 0;B=zeros(n,1);B=B;1;W=inv(D)*B第24页/共58页2023/2/14 22:3525/61多属性决策分析权重确定特征向量法：因为AW=nW，n为A的最大特征值。当判断矩阵A的估计存在误差时，则A中元素值的变化带来最大特征值的变化，记此时的最大特征值为ma

15、x，则AW=maxW，W为A关于最大特征值max的特征向量，对W进行归一化处理即得到权重向量。Matlab函数：V,D=eig(A)，返回的V为特征向量矩阵；D为特征值矩阵。第25页/共58页2023/2/14 22:3526/61多属性决策分析权重确定Satty近似算法：A中每行元素连乘并开n次方，记为wi*；求权重：wi=wi*/iwi*；A中每列元素求和：Sj=iaij；计算最大特征值max=iwiSi=sum(AW)。判断矩阵A的一致性检验一致性指标CI(Consistency Index)：CI=|max-n|/(n-1)随机指标RI(Random Index)：用随机方法构造判断矩

16、阵，经过500次以上的重复计算，求出一致性指标并加以平均得到。一致性比率CR(Consistency Ratio)：CR=CI/RI。CR0.1，一致性好；CR0.1，一致性差。第26页/共58页2023/2/14 22:3527/61多属性决策分析权重确定例：设判断矩阵为A，求权重。特征向量法特征向量法最小二乘法最小二乘法Satty近似算法近似算法w10.1584 0.1569 0.1685 w20.1893 0.1801 0.1891 w30.1980 0.1508 0.1871 w40.0483 0.0392 0.0501 w50.1503 0.0992 0.1501 w60.2558

17、0.3737 0.2550 max6.4208 5.9459 6.4431 CI0.0842 0.0108 0.0886 CR0.0679 0.0087 0.0715 第27页/共58页2023/2/14 22:3528/61多属性决策分析决策方法一般加权和法将属性表值cij规范化，得zij；i=1m;j=1n。确定各指标的权重系数，wj；j=1n。计算各方案的综合指标Ci=jwjzij。最后根据Ci大小排出各方案的优劣。一般加权和法的使用条件（实际上很难满足）指标体系为树状结构；每个属性的边际价值是线性的(优劣与属性值大小成正比)；任意两个指标的相互价值都是独立的；属性间的完全可补偿性：一个

18、方案的某属性无论多差都可用其他属性来补偿（一个方案优于另一个方案并不要求在所有属性上都优）。第28页/共58页2023/2/14 22:3529/61多属性决策分析决策方法AHP法(层次分析法，Satty)：在实际决策中并不是所有指标的值都是容易测量的，但不同方案的这些指标的优劣性是可以比较的。Satty提出了一种层次分析法(Analytic Hierarchy Process)来解决此类问题。构造关于指标权重的判断矩阵，求出各指标的权重wj，并检验判断矩阵的一致性；构造每个方案关于各指标优劣性的判断矩阵，从而得到各方案关于该指标的规范化属性值zij；（如果方案关于该指标的值是可测的，则不需要

19、构造此指标的判断矩阵）计算各方案的综合指标Ci=jwjzij。根据Ci的优劣确定方案的优劣。第29页/共58页2023/2/14 22:3530/61多属性决策分析决策方法根据下图所描述的指标体系，如果完全使用AHP法进行决策，需要构造多少个判断矩阵？()1616第30页/共58页2023/2/14 22:3531/61多属性决策分析决策方法加权和与加权积的综合决策法：加权和要求指标具有线性可加（可补偿）性，但在实际决策中有些指标之间是不可补偿的，此时方案关于这类指标的优劣可用加权积法。例如，设方案的优劣可由四个一级指标A,B,C,D评判，其中A,B满足可加性，C,D满足可加性，但A、B与C、

20、D间不满足可加性，则可用下面的加权和与加权积的综合决策法确定各方案的优劣：(wAzA+wBzB)(wCzC+wDzD)第31页/共58页2023/2/14 22:3532/61多属性决策分析决策方法逼近理想解排序方法(Technique for Order Preference by Similarity to Ideal Solution,TOPSIS)：借助多属性问题的理想解和负理想解给方案集X中的各方案排序。在多属性决策中，每个属性都有一个最优值，也有一个最差值。取所有属性的最优值构造一个虚拟方案x*，同时取所有属性的最差值构造另一个虚拟方案x0，则称x*为理想解，x0为负理想解。TOP

21、SIS法就是将各实际方案与理想解和负理想解进行比较，离理想解越近、离负理想解越远的方案越好。第32页/共58页2023/2/14 22:3533/61多属性决策分析决策方法TOPSIS法求解步骤用向量规范法求得规范决策矩阵：zij=cij/(icij)1/2确定各属性的权重系数W=w1,w2,wn确定理想解和负理想解：zj*=maxi(zij)(效益型属性)或mini(zij)(成本型属性)zj0=mini(zij)(效益型属性)或maxi(zij)(成本型属性)计算各方案到理想解和负理想解的加权距离di*=(j(wjzij-wjzj*)2)1/2di0=(j(wjzij-wjzj0)2)1/

22、2计算综合评价指标Ci=di0/(di0+di*)按Ci的大小对各方案排序，Ci越大方案越优，否则越劣。第33页/共58页2023/2/14 22:3534/61多属性决策分析决策方法权重权重0.20.30.40.1简单简单加权和加权和属性属性方案方案人均论人均论著著(a1)生师生师比比(a2)科研经科研经费费(a3)逾期毕逾期毕业率业率(a4)10.03571.00001.00000.00000.7071420.07140.83330.80000.53190.6374630.21430.33330.25200.36170.2798240.10710.66660.60000.17020.47

23、84251.00000.00000.05680.74470.29719TOPSISTOPSISdi*di0Ci10.0346 0.6666 0.6956 0.6482 0.1931 0.3299 0.6308 20.0693 0.5555 0.5565 0.3034 0.1919 0.2679 0.5827 30.2078 0.2222 0.1753 0.4137 0.2914 0.0956 0.2471 40.1039 0.4444 0.4174 0.5378 0.2195 0.2023 0.4796 50.9695 0.0000 0.0395 0.1655 0.3299 0.1931 0.

24、3692 x*0.9695 0.6666 0.6956 0.1655 x00.0346 0.0000 0.0395 0.6482 第34页/共58页2023/2/14 22:3535/61多属性决策分析决策方法TOPSIS法的边界问题x*x0第35页/共58页2023/2/14 22:3536/61随机决策理论与方法1、主观概率2、效用函数3、决策准则4、贝叶斯决策分析5、多属性决策分析6、多目标决策分析7、序贯决策分析第36页/共58页2023/2/14 22:3537/61多目标决策分析问题描述多目标决策问题是指决策变量连续、存在无数决策方案的多准则决策问题。其一般形式为：决策规则：DRf

25、1(x),f2(x),fn(x)x表示一种方案，且xX=xRN|gk(x)0,k=1,2,m,x0问题共包含n个目标，每个目标可能受N个属性影响，所有属性必须满足一定的约束条件（共计m+N个约束）。多目标决策分析就是根据给定的决策规则（体现了决策人的偏好）从可行方案集X中找出最佳调和解xC。f1(x)f2(x)fn(x)x1xN第37页/共58页2023/2/14 22:3538/61多目标决策分析决策方法多目标决策问题主要使用多目标规划方法进行求解。DEA方法(Data Envelopment Analysis)：在多目标决策分析中，除多目标优化问题外，还有一类多目标评价问题：对于多个同质的

26、管理系统(决策单元)，如果已知各系统投入和产出，如何评价这些系统的优劣，或者说相对有效性？问题描述：设有n个决策单元，每个决策单元都有m种资源投入，第j个决策单元第i种投入指标的投入量记为xij0(已知)；每个决策单元均有p种产出，第j个决策单元第r种产出量记为yrj0(已知)。vi、ur分别表示第i种投入指标和第r种产出指标的权系数，需要通过建模得到。如何评价这n个决策单元的相对有效性？第38页/共58页2023/2/14 22:3539/61多目标决策分析决策方法C2R(Charnes,Cooper,Rhodes)模型(第一个DEA模型)对每一个决策单元j，都定义一个效率评价指标：hj称为

27、效率指标，可通过对权系数取值的选择使hj1。评价第j0个决策单元有效性的C2R模型为：第39页/共58页2023/2/14 22:3540/61多目标决策分析决策方法模型转化：将分式规划转变成线性规划。令则分式规划转变为下列形式：第40页/共58页2023/2/14 22:3541/61多目标决策分析决策方法有效性分析：若线性规划的最优解0，0满足条件则决策单元j0为弱DEA有效。若00，00也成立，则决策单元为DEA有效。xy=f(x)A:规模有效，技术有效C：技术有效生产函数曲线B：既不是规模有效也不是技术有效第41页/共58页2023/2/14 22:3542/61随机决策理论与方法1

28、、主观概率2、效用函数3、决策准则4、贝叶斯决策分析5、多属性决策分析6、多目标决策分析7、序贯决策分析第42页/共58页2023/2/14 22:3543/61序贯决策分析问题描述序贯决策是一类多阶段决策问题，前一阶段的决策结果对后一阶段决策直至最终决策产生影响，整个决策问题的求解需要采取多次行动才能完成。将贝叶斯决策分析方法应用于不同的决策阶段，并根据各阶段之间的关系可以获得多阶段决策问题的解。动态规划和马尔可夫决策是两类重要的多阶段决策方法。第43页/共58页2023/2/14 22:3544/61序贯决策分析多阶段决策经过相互衔接、相互关联的若干阶段决策才能完成的决策任务称为多阶段决策

29、。决策分析的关键：划分决策阶段、确定各阶段状态变量、寻找各阶段之间的关系；采用从后向前的逆序归纳法进行决策分析。决策方法：根据问题不同，可选用贝叶斯决策分析方法、多属性决策方法或多目标决策方法。第44页/共58页2023/2/14 22:3545/61序贯决策分析贝叶斯方法例：某公司计划购买一种新产品专利，购置费1万元。若购置了专利，可选择三种生产规模：大批量生产(a1)，中批量生产(a2)，小批量生产(a3)。市场销售状态为：畅销1,0.6;一般2,0.3;滞销3,0.1。根据历年资料统计分析，新产品进入市场的销售收益矩阵如左下表。为了准确掌握市场动向，公司可投入0.5万元开展试销。根据统计

30、表明，产品欢迎度和销售状态之间的关系如右下表。试帮助该企业做如下决策：是否购买专利？(已知如果不购买专利，1万元的投资收益为1.1万元)购买专利后是否试销？如何确定该公司的批量生产计划？万元万元万元万元 1 1 2 2 3 3a1a14 42 2-3-3a2a23 33 3-2-2a3a31 11 11 1 1 1 2 2 3 3H1(H1(欢迎欢迎欢迎欢迎)0.60.60.20.20.20.2H2(H2(一般一般一般一般)0.30.30.60.60.30.3H3(H3(不受欢迎不受欢迎不受欢迎不受欢迎)0.10.10.20.20.50.5第45页/共58页2023/2/14 22:3546/

31、61序贯决策分析贝叶斯方法解：这是一个三阶段决策问题。第一阶段确定是否购买专利，第二阶段确定是否试销，第三阶段确定批量生产计划。决策过程采取逆序归纳法，即先从第三阶段开始。试销：计算后验概率及各批量生产计划的收益，得：试销的期望收益为：0.44*3.406+0.39*2.620+0.17*1.53=2.7805H1H1H2H2H3H3p(Hi)p(Hi)0.440.440.390.39 0.170.17p(p(1|1|Hi)Hi)0.8180.818 0.4620.462 0.3530.353p(p(2|2|Hi)Hi)0.1360.136 0.4620.462 0.3530.353p(p(3

32、|3|Hi)Hi)0.0460.046 0.0760.076 0.2940.294H1H1H2H2H3H3a1a13.4063.4062.5442.5441.2361.236a2a22.7702.7702.6202.6201.5301.530a3a31.0001.0001.0001.0001.0001.000第46页/共58页2023/2/14 22:3547/61序贯决策分析贝叶斯方法不试销：结论：1 1 2 2 3 3期望期望期望期望p(p(i i)0.60.60.30.30.10.1a1a14 42 2-3-32.72.7a2a23 33 3-2-22.52.5a3a31 11 11 1

33、1 1购买专利不购买试销不试销H1,a1：3.406万元H2,a2：2.620万元H3,a2：1.530万元a1：2.7万元1.1万元第47页/共58页2023/2/14 22:3548/61序贯决策分析Markov法有一类序贯决策问题，其状态随着时间变化而随机变化，决策的任务就是根据当前状态预测其未来某一时刻的状态，如销售状态预测、股价预测等。下面介绍一种Markov决策方法分析求解此类问题。虽然Markov过程是很严格的，实际管理问题并不能总是满足其条件，但往往将其看作近似Markov过程也能得到很好的结果。第48页/共58页2023/2/14 22:3549/61序贯决策分析Markov

34、法链及其状态集：设m为随机变量(如股价)，称随机变量序列m|m=1,2,.为链，称由m的全体状态构成的有限集为该链的状态集(如上涨、持平、下跌)，记为N=N1,N2,.,Nn。Markov链：设链m|m=1,2,.，其状态为N=N1,N2,.,Nn。若对于任意正整数k及i(1),i(2),.,i(k),i(k+1)n，条件概率等式：pk+1=Ni(k+1)|1=Ni(1),.,k=Ni(k)=pk+1=Ni(k+1)|k=Ni(k)成立，则称链m|m=1,2,.为Markov链。说明：Markov链的特点是随机变量在第k+1时刻出现某状态的概率仅取决于其在第k时刻的状态，而与k时刻之前的任何时

35、刻的状态无关，即无后效性。第49页/共58页2023/2/14 22:3550/61序贯决策分析Markov法例：如果股价状态(u:上涨；e:持平；d:下跌)的变化序列构成Markov链，则根据下列两个序列：udeedu,duddeu预测下一个交易日为上涨的概率相同。齐次Markov链：设m|m=1,2,.，其状态为N=N1,N2,.,Nn。对于任意正整数i,j,以及s,t,k，条件概率等式ps+k=Nj|s=Ni=pt+k=Nj|t=Ni成立，则称此Markov链为齐次Markov链。ueue1246810133579111214第50页/共58页2023/2/14 22:3551/61序贯

36、决策分析Markov法状态转移概率及转移概率矩阵：设齐次Markov链m|m=1,2,.，状态为N=N1,N2,.,Nn。称pij=ps+1=Nj|s=Ni为随机变量从状态Ni到Nj的转移概率(即s时刻为Ni状态时，s+1时刻为Nj状态的概率)。称对应的矩阵P=(pij)nn为转移概率矩阵。显然有：pij0;jpij=1。k步转移概率及k步转移概率矩阵：设齐次Markov链m|m=1,2,.，其状态为N=N1,N2,.,Nn。称pij(k)=ps+k=Nj|s=Ni为随机变量从状态Ni经k步转移到Nj的转移概率(即s时刻为Ni状态时，s+k时刻为Nj状态的概率)。称对应的矩阵P(k)=(pij

37、(k)nn为k步转移概率矩阵。显然有：pij(k)0;jpij(k)=1。可以证明：P(k)=Pk第51页/共58页2023/2/14 22:3552/61序贯决策分析Markov法基于Markov过程的预测：设随机变量遵从齐次Markov过程，状态转移概率矩阵为P，且第k时刻随机变量的各状态N1,N2,.,Nn的概率分布为u(k)=(u1(k),u2(k),.,un(k)T，则第s时刻(sk)随机变量的各状态的概率分布为：u(s)=(Ps-k)Tu(k)特别地，若k=0(初始状态)，则有u(s)=(Ps)Tu(0)第52页/共58页2023/2/14 22:3553/61序贯决策分析Mark

38、ov法稳定状态概率：设有齐次Markov链m|m=1,2,.，状态为N=N1,N2,.,Nn。若对一切状态Ni，存在不依赖于i的常数j，对于状态Nj，恒有：limkpij(k)=j，则称该齐次Markov链具有遍历性。j称为状态Nj的稳定状态概率；=(1,2,.,n)T称为稳定状态概率向量。若转移矩阵P为正规矩阵(即存在正整数k使得Pk0)，则对应的Markov链具有遍历性，且该Markov链的随机变量各状态最终收敛于某个与初始状态完全无关的稳定状态，稳定状态概率向量满足：PT=。第53页/共58页2023/2/14 22:3554/61序贯决策分析Markov法例：某厂家生产商品A，为了与同

39、类产品B、C的竞争，厂家可采用下列经营策略：(1)发放有奖债券；(2)投放广告；(3)优质售后服务。统计表明，三种经营策略带来的市场占有率转移矩阵分别为：P1=0.95 0.025 0.025;0.10 0.80 0.10;0.10 0.15 0.75P2=0.90 0.05 0.05;0.15 0.75 0.10;0.10 0.15 0.75P3=0.90 0.05 0.05;0.10 0.80 0.10;0.15 0.15 0.70三种方案实施的成本分别为150万元、40万元、30万元。该类商品的市场总容量为1000万件，每销售1件产品可获利1元。为保证在今后长期经验中获取最大利润，企业该

40、采用什么样的经营策略？第54页/共58页2023/2/14 22:3555/61序贯决策分析Markov法解：这是一个长期经营策略问题，可通过计算市场占有率(Markov过程的随机变量)的稳定状态概率向量来确定企业的经营策略。经计算，采取三种经营策略后A、B、C三种商品的市场占有率分别稳定在如下状态：经营策略1：A=0.667,B=0.190,C=0.143经营策略2：A=0.559,B=0.235,C=0.206经营策略3：A=0.545,B=0.273,C=0.182采取不同经营策略时该厂家的收益如下：经营策略1：0.667*1000-150=517万元经营策略2：0.559*1000-4

41、0=519万元经营策略3：0.545*1000-30=515万元。结论：采用经营策略2，即投放广告。第55页/共58页2023/2/14 22:3556/61序贯决策分析Markov法例：某种商品的销售有畅销和滞销两种状态，畅销时可获年利润100万元，滞销时可获年利润30万元。以一年为一期，设不采取广告策略与采取广告策略的销售状态转移矩阵为P1=0.8 0.2;0.4 0.6P2=0.9 0.1;0.7 0.3每年广告费为15万元，假定上一年为畅销。为保证今后3年获得的利润和最大，应该采取什么策略？第56页/共58页2023/2/14 22:3557/61序贯决策分析Markov法解：这是一个短期经营决策问题，可通过计算3年的期望利润总和来确定企业的经营策略。初始状态：u(0)=(1,0)T，收益矩阵F=(100,30)。不投放广告：F总=F*(P1+P12+P13)T*u(0)=244.56万元投放广告：F总=F*(P2+P22+P23)T*u(0)-3*15=230.92万元结论：不采取广告策略。第57页/共58页2023/2/14 22:35决策理论与方法-随机决策理论与方法58/61感谢您的观看。第58页/共58页

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 数学随机决策理论方法

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：数学随机决策理论与方法.pptx
链接地址：https://www.taowenge.com/p-73033705.html