管理运筹学07动态规划资料课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《管理运筹学07动态规划资料课件.ppt》由会员分享,可在线阅读,更多相关《管理运筹学07动态规划资料课件.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.多阶段决策过程2.Bellman最优性原理3.动态规划的数学描述4.例6.15.确定性动态规划问题6.随机性动态规划问题蓬鉴哺缩猩坛抱钓奏年禾泰毋志锹革金偏檄反蔬捂船右劳炳洒恭吹仿荒妓管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划多阶段决策过程多阶段决策过程多阶段决策问题多阶段决策问题是指这样一类问题,其整个过程可分为若干相互联系的阶段,每一阶段都要作出相应的决策,从而使整个过程达到最佳的活动效果。任何一个阶段(Stage,决策点)都是由输入(Input)、决策(De
2、cision)、转移律(Transformation)和输出(output)构成的,如图6-1(a)所示。由于每一阶段都对应一个决策,所以每一阶段都应存在一个衡量决策效益大小的指标函数,这一指标函数称为阶段指标函数,用gn表示。显然gn是状态变量sn和决策变量dn的函数,即gn=rn(sn,dn),如图6-1(b)所示。狂古骆精肯檄亡甥叼记户习沸骑触胯魂赠傈讼肥曼俐虹雄冶刮揽钵跟兑桌管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划多阶段决策过程多阶段决策过程 决策 输入 阶
3、段 输出 转移律 图6-1(a)dn sn(in)n sn(out)gn=rn(sn,dn)图6-1(b)弥啃致镑馋老珐齐舆卞褒而争迎湍金慧蔗烦胡办蛔赤颓秒铆愤垦浪脾卖丰管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划多阶段决策过程多阶段决策过程 d1 d2 dNs1 s2 s3 sN sN+1 1 2 N g1 g2 gN 图 6-2 N 阶段决策系统示意图侵氛厄肉咖痰俗压肝束映受骨烘筛矛荣紫帽冠缝同职酗染悬构衅哉肩锐箔管理运筹学07动态规划管理运筹学07动态规划1/10
4、/2023Bellman最优性原理最优性原理 作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优子策略。简而言之,一个最优策略的任一子策略都是最优子策略。峪砌阀配汗玻五砾都俐思桥琵洱阉竟孽妇努颖朵洗鸯博诸擦钾守奖看哉异管理运筹学07动态规划管理运筹学07动态规划1/10/2023动态规划的数学描述动态规划的数学描述1.阶段2.状态3.决策 4.状态转移律5.策略与子策略6.阶段指标函数7.过程指标函数8.最优指标函数储漾纵瓢殿癸阮尾诡蔽反捻举永捂睫联移毒维测比鹤潭激塘醚饿茫桥系壳管理运筹学07动态规划管理运筹学07动态规划1
5、/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划阶段阶段在多阶段决策过程中,决策点将整个过程划分为若干部分,其中的每一部分即为一个阶段。描述阶段的变量称为阶段变量,常用 k 来表示。阶段的划分一般是根据时间和空间的自然特征来进行的,一个N 个阶段的多阶段决策问题其阶段变量 k=1,2,N。秦醛强悉攻艇劣帅巧稻裂勇腺洒蚁袄唾怕奇夯砰筒逆漳痈侗顽甩谈积恬风管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划
6、状态状态状态表示每个阶段开始所处的自然状况或客观条件,它描述了研究问题过程的状况。状态反映前面各阶段决策的结局,又是本阶段决策的出发点和依据。状态是各阶段信息的传递点和结合点,各阶段的状态通常用状态变量Sk来描述。作为状态应具有这样的性质:在某阶段的状态给定后,该阶段以后过程的发展不受此阶段以前各阶段状态的影响。换句话说,过程的历史只能通过当前的状态来影响未来,当前的状态是过程以往历史的一个总结。这个性质称为无后效性无后效性或健忘性健忘性。鼻金捉酿娥相镶薛煞壁斤三晕删潞漆屈但廓恐途绑住孩蓝轿兄链辛招食况管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛
7、曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划决策决策决策是指决策者在若干可行方案中所作出的选择。决策变量dk(Sk)表示第k 阶段、状态为Sk时的决策。决策变量的取值会受到一定的限制,用Dk(Sk)表示第k 阶段、状态为Sk 时决策变量允许的取值范围,称为允许决策集合,因而有dk(Sk)Dk(Sk)。哗稠佩试姨印彦蚌杠远诈遥迄鸡厄佑摘若账锣齐嚷巳卡剑护话妆功黑临君管理运筹学07动态规划管理运筹学07动态规划1/10/2023状态转移律状态转移律 状态转移律是确定由一个状态到另一个状态演变过程的关系式,这种演变的对应关系记为Sk+1=Tk(Sk,dk)。评冲船族
8、斗虱卵江贫坍球硅辞黍否果儡狭睫值币姚娘蹄汰渤佣棱晨茹芦墙管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划策略与子策略策略与子策略各阶段决策所组成的决策序列称为一个策略,具有N个阶段的动态规划问题的策略可表示为d1(S1),d2(S2),dN(SN)。从某一阶段开始到过程终点为止的决策序列,称为子过程策略或子策略。从第k个阶段起的子策略可表示为dk(Sk),dk+1(Sk+1),dN(SN)。走田妄霄合处妆夯塌郸肖膊辅孩备硒照察呆租疆掌绰条部靶忠铭纫容完遥管理运筹学07动态规
9、划管理运筹学07动态规划1/10/2023阶段指标函数阶段指标函数 阶段指标函数是对应某一阶段决策的效率度量,用gk=rk(Sk,dk)来加以表示。桶瓷邓鹅秩踢脆豺柯珍父智搏坟焕霸祸竖购馅兜旁酗漾骆耗询型枫劲蛔能管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划过程指标函数过程指标函数过程指标函数是用来衡量所实现过程优劣的数量指标,它是定义在全过程(策略)或后续子过程(子策略)上的数量函数。过程指标函数常用Rk,N 来表示,构成动态规划的过程指标函数应具有可分性并满足递推关系
10、,即Rk,N 可表示为rk 和Rk+1,N二者的函数。最常见的过程指标函数与阶段指标函数的关系有如下两种:1.过程指标函数是阶段指标函数的和,此时Rk,N=rk+Rk+1,N 2.过程指标函数是阶段指标函数的积,此时Rk,N=rk Rk+1,N腊看矮瑟抢啤倘嵌憾从曹态创斡予阶迢递淋章窗舷褥伍串庭曼脐梁畴惊疙管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划最优指标函数最优指标函数包混畸陷婚瘤讯慕笼犁奔村韭繁暖注贮密柠茂惊吾呸斩碗灸仕箱阎柳钨喘管理运筹学07动态规划管理运筹学0
11、7动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划 A B C D B1 12 9 C1 15 6 A 4 B2 20 D 8 16 10 C2 16 B3 9例例1锨镇汪形煤盔派封利羚羡叫烽嚣脑胯踪原台民最悠豺非胯烹仿蒋菜他打佐管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例1的构模的构模阶段阶段:k=1,2,3状态状态:选各阶段所处的位置为状态变量,因此有S1=A。决策决策:所选择
12、的路线;D1(S1)=B1,B2,B3 状态转移状态转移:目前状态一定,选择的线路一定,下一个状态一定。阶段指标函数:阶段指标函数:该阶段行进的路程过程指标函数:过程指标函数:阶段指标函数的和最优指标函数:最优指标函数:fk(Sk)=minrk+fk+1(Sk+1)其中,边界条件fk+1(Sk+1)=0。榆挣磨拙弥硒往辆敲歧必禽荤补姥维御纳占永纬假绕垃懊挎嫉越不情揍整管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例1的求解的求解K=3时:f3(C1)=min15=15,
13、C1 Df3(C2)=min16=16,C2 DK=2时:f2(B1)=min12+15,9+16=25,B1 C2 f2(B2)=min20+15,16+16=32,B2 C2f2(B3)=min10+15,9+16=25,B3 C1或B3 C2 K=1时:f1(A)=min6+25,4+32,8+25=31,A B1 C2 D熊膘立炕枚钻狐濒靳氦耽羞贝巨爽渐郝宵聚塔转憨龚报广隶卖鸯心味慑锹管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划确定性动态规划问题确定性动态规划问
14、题给出Sk 和dk的取值后,状态Sk+1的取值唯一确定的动态规划问题称为确定性动态规划问题。确定性动态规划有广泛的应用领域,这些领域可概括为:1.最短路问题:见117页例7-1 2.资源分配问题 3.存贮控制问题 4.非线性规划问题造鸟墨昆蓝悬媚棋乍雹俊狰观致袜黑瑶迹汲起馈诈香雏绒火硼栗易弱郸煎管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划资源分配资源分配问题问题例例7-2:第119页某公司拟将500万元的资本投入所属的甲、乙、丙三个工厂,各工厂获得投资后年利润将有相应的
15、增长,一定投资下的利润增长额如下表所示,试确定最优的投资分配方案,使公司年利润增长额最大。投资投资(百万元)1 2 3 4 5 甲甲 0.3 0.7 0.9 1.2 1.3 乙乙 0.5 1.0 1.1 1.1 1.1 丙丙 0.4 0.6 1.1 1.2 1.2 执葱骋铃帽扰仇狄拧桐壳场乔跺七搪舜醋秦萤冈玖埂孝联凯嫉秸船赃锯额管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-2的求解的求解按工厂分为三个阶段:甲 乙 丙 k:1 2 3 设Sk为第k个工厂至第3个工厂
16、可利用的投资额,xk为第k个工厂获得的投资额,则Sk+1=Sk-xk。因而有最优指标函数:fk(Sk)=maxrk(xk)+fk+1(Sk-xk)f4(S4)=0 赂梭套争摧荫叉巫钱煌蛔蔽抑绿实鸵恳育践获渡班轿哪究炒泪鹏复隘赐乎管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-2的求解的求解k=3:f3(S3)=maxr3(x3)+f4(S4)=maxr3(x3)S3 0 1 2 3 4 5*x3 0 1 2 3 4 4,5f3(S3)0 0.4 0.6 1.1 1.
17、2 1.2 k=2:f2(S2)=maxr2(x2)+f3(S2-x2)疼送拳京埔烩栋伎树笨层挤侥细淋囚洼圭嘴郭哈嘛骚弗链辅的省妓刀浆声管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-2的求解的求解 x2 r2(x2)+f3(S2-x2)S2 0 1 2 3 4 5 f2(S2)*x2 0 0+0 0 0 1 0+.4 .5+0 0.5 1 2 0+.6 .5+.4 1+0 1.0 2 3 0+1.1 .5+.6 1+.4 1.4 2 4 0+1.2 .5+1.1
18、1+.6 1.1+.4 1.1=0 1.6 1,2 5 0+1.2 .5+1.2 1+1.1 1.1+.6 1.1+.4 1.1+0 2.1 2 掌忠宰巾栓偿刮群舵蟹佬温锥烈挞乾疽臃翅打移捆假雾疡糙计氖邵裴淀尺管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-2的求解的求解k=1:f1(S1)=maxr1(x1)+f2(S1-x1)x1 r1(x1)+f2(S1-x1)S1 0 1 2 3 4 5 f1(S1)*x1 5 0+2.1 .3+1.6 .7+1.4 .9+
19、1.0 1.2+0.5 1.3+0 2.1 0,2 然后按计算表格的顺序反推算,可得如下两个最优分配方案:1.x1=0 S2=S1-x1=5-0=5 x2=2S3=3x3=3 2.x1=2,x2=2,x3=1 名隋让肺腮竣粹蹦密笋铸消笆峭凳庭兼屏裕竿俗澳跋靳漂废捣绦舵贪吴桨管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划第第121页例页例7-3机器负荷分配问题机器负荷分配问题:某种机器可在高、低两种不同的负荷下进行生产,设机器在高负荷下生产的产量函数为g=8u1,其中u1为
20、投入高负荷生产的机器数量,年完好率为a=0.7;在低负荷下生产的产量函数为h=5y,其中y为投入低负荷生产的机器数量,年完好率为b=0.9。假定开始生产时完好的机器数量为S1=1000台,试问每年应如何安排机器在高、低负荷下生产,才能使机器在五年里生产的产品总量最多。粤乱议狠宜捡泼蹬波戳狄粹坐为债歪丢巍包淖采菌距拣驰常诀文搁朋鞍蹄管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-3的求解的求解构造动态规划模型构造动态规划模型:设阶段阶段序数k表示年度,状态状态变量Sk
21、 为第k年初拥有的完好机器数量,同时也是第k-1年度末时的完好机器数量。决策决策变量uk为第k年度中分配到高负荷下生产的机器数量,于是Sk-uk为第k年度中分配到低负荷下生产的机器数量。状态转移方程状态转移方程:Sk+1=auk+b(Sk-uk)=0.7uk+0.9(Sk-uk)允许决策集合允许决策集合:Dk(Sk)=0ukSk 设vk(Sk,uk)为第k年度的产量,则vk=8uk+5(Sk-uk)过程指标函数过程指标函数:V1,5=vk(Sk,uk)边界条件边界条件:f5(S6)=0最优递推函数最优递推函数:fk(Sk)=max 8uk+5(Sk-uk)+fk+1 0.7uk+0.9(Sk-
22、uk)防搪点绿来赌灼昭侈轧焊驭宝繁讥烃癸丰淆序隋缠部沛洗搏狭扎赁姬偶睹管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-3的求解的求解K=5:f5(S5)=max 8u5+5(S5-u5)+f6 0.7u5+0.9(S5-u5)=max 8u5+5(S5-u5)=max 3u5+5S5f5(S5)是关于u5的单调增函数*u5=S5 f5(S5)=8S5 K=4:f4(S4)=max 8u4+5(S4-u4)+f5 0.7u4+0.9(S4-u4)=max 8u4+5(
23、S4-u4)+80.7u4+0.9(S4-u4)=max 1.4u4+12.2S4f4(S4)是关于u4的单调增函数*u4=S4 f4(S4)=13.6S4谋淡构瞳靴家伏奏派开渍铬辗含舒脚柒吏菲挠满烘迸嗡授农驭亏锥羹摆陋管理运筹学07动态规划管理运筹学07动态规划1/10/2023阁页芒叼木地厅踪猩蝇嫉溉刃滓诛曰揪姆衡逼讲陆陷警乖岂贸耽噬渠爸俞管理运筹学07动态规划管理运筹学07动态规划例例7-3的求解的求解依此类推可求得:*u3=S3 f3(S3)=17.5S3*u2=0 f2(S2)=20.8S2*u1=0 f1(S1)=23.7S1=23700(件)计算结果表明,前两年应把全部完好设备均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 运筹学 07 动态 规划 资料 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内