数学建模优化理论与方法.ppt
数学规划的理论与方法数学规划的理论与方法1.线性规划理论与方法线性规划理论与方法2.目标规划的理论与方法目标规划的理论与方法3.整数规划的理论与方法整数规划的理论与方法4.非线性规划的理论与方法非线性规划的理论与方法5.动态规划动态规划6.最优控制理论最优控制理论y一一.线性规划的理论与方法线性规划的理论与方法 线性规划是指目标函数是由线性函数给出,约束条件由线性等式或者不等式给出的优化问题。最早提出线性规划问题并进行专门研究的学者康托洛维奇。康托洛维奇在20世纪30年代就提出了求解线性规划问题的“解乘数法”。自从1947年美国学者丹青格提出求解线性规划问题的一般方法单纯形方法 后,才使线性规划的理论和方法日臻成熟。(1)由决策变量构成,反映决策的目标是线性函数。(2)一组由决策变量的线性等式或不等式构成约束 条件。(3)对决策变量取值范围加以限制的非负约束。1.1线性规划模型的特征线性规划模型的特征 例1:某工厂生产甲、乙两种产品,每件产品的利润、所消耗的材料、工时及每天的材料限额和工时限额,如表1.1所示。试问如何安排生产,使每天所得的利润为最大?表表1.11.1甲乙限额材料2324工时3226利润(元/件)43设每天生产甲、乙两种产品分别为 x1 ,x2 则该问题可描述为由如下数学模型:1.2线性规划问题的标准型线性规划问题的标准型如下形式的线性规划模型被称作标准型:也可用矩阵形式描述:A:资源消耗系数矩阵b:资源限量向量C:价格向量X:决策变量向量同时我们对标准型作如下假定:一般的线性规划问题通过变换可化成标准型,变换方式可以归结为:1.3线性规划问题解的概念线性规划问题解的概念对于线性规划问题可行解基解基可行解1.4线性规划问题的图解法线性规划问题的图解法下面结合例1的求解来说明图解法步骤。例1第一步:在直角坐标系中分别作出各种约束条件,求出可行域(图中阴影部分)。x2Q2(6,4)x13x1+2x2=262x1+3x2=24ZOQ1(26/3,0)Q3(6,4)第二步:作出一条目标函数等值线,并确定 Z 值增大的方向。第三步:沿 Z 值增大方向移动,当移至 Q2(6,4)点时,Z 值为最大,Z*=36.1.5基本定理基本定理 从理论上来讲,采用“枚举法”找出所有基可行解,并1.6求解求解线性规划问题的单纯形方法线性规划问题的单纯形方法 一一比较,一定会找到最优解。但当 m,n 较大时,这种方法是不经济和不可取的。下面介绍求解线性规划问题的有效方法单纯形方法。单纯形法的实质是从一个基可行解向另一个基可行解(极点到极点)的迭代方法。以下通过例1的求解过程说明单纯形方法的基本步骤。例1:第一步:第一步:引进松驰变量 x3,x4 将原问题化为标准型。标标准准型型第二步:第二步:找出初始可行基,建立初始单纯形表。见下表1.2。cj 4 3 0 0 CBXBb x1 x2 x3 x400 x3x42426 2 3 1 0 3 2 0 1Z0 -4 -3 0 0 表 1.2第三步:第三步:最优性检验。第四步:第四步:换基迭代。cj 4 3 0 0 CBXBb x1 x2 x3 x400 x3x42426 2 3 1 0 3 2 0 11226/3Z0 -4 -3 0 0 04x3x120/326/3 0 5/3 1 -2/3 1 2/3 0 1/3413Z104/3 0 -1/3 0 4/3表1.3同理,确定 x2 换入,x3 换出,继续迭代得表 1.3 cj 4 3 0 0 CBXBb x1 x2 x3 x434x2x146 0 1 3/5 -2/5 1 0 -2/5 3/5Z36 0 0 1/5 6/5 表 1.3 表中最后一行的所有检验数都已是正数或零,从而得到基本最优解 X*=(6,4,0,0)T,Z*=36。由于 x3,x4 是引进的松弛变量,因此原问题的最优解为 x1=6,x2=4,最优值 Z*=36。例2 一奶制品加工厂用牛奶生产 A1,A2 两种奶制品,1 桶牛奶可以在设备甲上用 12 小时加工成 3 公斤 A1,或者在设备乙上用 8 小时加工成 4 公斤 A2。根据市场需求,生产的 A1,A2 全部能售出,且每公斤 A1 获利 24 元,每公斤 A2 获利 16 元。现在加工厂每天能得到 50 桶牛奶的供应,每天正式工人总的劳动时间为 480 小时,并且设备甲每天至多能加工 100 公斤 A1,设备乙的加工能力没有限制。试为该厂制定一个 我们无意过深涉及线性规划的具体计算方法,而着重介绍的是如何建立若干实际的线性规划模型,如何使用现成的数学软件进行求解,以及如何对结果进行深入的分析。下面以奶制品加工生产计划为例,进行详细的讨论。生产计划,使每天获利最大,并进一步讨论以下 3 个附加问题:若用 35 元可买到 1 桶牛奶,买吗?若买,每天最多 买多少?若可以聘用临时工人以增加劳动时间,付给临时工人 的工资最多是每小时几元?由于市场需求的变化,A1 的获利增加到 30元/公斤,应否改变生产计划?1桶牛奶 3公斤A1 12小时 8小时 4公斤A2 或获利24元/公斤 获利16元/公斤 50桶牛奶时间480小时 至多加工100公斤A1每天:分析x1 桶牛奶生产 A1 x2 桶牛奶生产 A2获利 243x1获利 164 x2决策变量决策变量 数学模型原料供应原料供应 劳动时间劳动时间 加工能力加工能力 非负约束非负约束 解法1:图解法。x1x20ABCDl1l2l3l4l5约约束束条条件件Z=0Z=2400Z=3360c从图中可以看出,在 B(20,30)点得到最优解。解法2:软件实现。求解线性规划有不少现成的数学软件,比如用 LINDO 软件就可以很方便地实现。在 LINDO6.1版本下打开一个新文件,像书写模型一样。直接输入:max72x1+64x2st2)x1+x2503)12x1+8x24804)3x1100end注:LINDO中已规定所有决策变量均为非负,故变量非负的条件不必输入。输入文件中第1行为目标函数,2),3),4)是为了标示各约束条件,便于从输出结果中查找相应信息;程序最后以end 结束。将文件存储并命名后,选择菜单“Solve”并对提示“DO RANGE(SENSITIVITY)ANALYSIS?”回答“是”,即可得到如下输出:OBJECTIVEFUNCTIONVALUE1)3360.000VARIABLEVALUEREDUCEDCOSTX120.0000000.000000X230.0000000.000000ROWSLACKORSURPLUSDUALPRICES2)0.00000048.0000003)0.0000002.0000004)40.0000000.000000NO.ITERATIONS=220桶牛奶生产桶牛奶生产A1,30桶生产桶生产A2,利润,利润3360元。元。原料无剩余原料无剩余时间无剩余时间无剩余加工能力剩余加工能力剩余40三三种种资资源源“资源资源”剩余剩余为零的约束为为零的约束为紧约束(有效紧约束(有效约束)约束)结果解释结果解释 OBJECTIVEFUNCTIONVALUE1)3360.000VARIABLEVALUEREDUCEDCOSTX120.0000000.000000X230.0000000.000000ROWSLACKORSURPLUSDUALPRICES2)0.00000048.0000003)0.0000002.0000004)40.0000000.000000NO.ITERATIONS=2最优解下最优解下“资源资源”增加增加1单位时单位时“效益效益”的增的增量量原料增加原料增加1单位单位,利润增长利润增长48时间增加时间增加1单位单位,利润增长利润增长2加工能力增长不影响利润加工能力增长不影响利润影子价格影子价格35元可买到元可买到1桶牛奶,要买吗?桶牛奶,要买吗?350,并将各个约束条件加到目标函数上,得一新函数如下:可以看出,当 时,有 ;当 时,由于M 很大,将使 很大,从而使很大,这就相当于对非可行点的“惩罚”。而且,X 点离可行域越远惩罚越严厉。可以想见,当 M 变得足够大时,相应于这样的 M 值,(4.12)的无约束极小点 X(M),就会和原来的约束问题的极小点足够接近。而当 时,它就成为原约束问题的极小点。惩罚函数(4.12)也可改写成另外的形式:或者:是阶越函数:假定对某一罚因子,例如说 M1,就加大罚因子的值。随着罚因子数值的增加,惩罚函数中的惩罚项所起的作用随之增大,minP(X,M)的解 X(M)离可行域 R 的“距离”就会越来越近,当趋于无穷大时,点列 X(Mk)就从可行域 R 的外部趋于原非线性规划问题的极小点。和不等式约束问题类似,对于等式约束问题,即:采用以下形式的罚函数:对于既包含等式约束又包含不等式约束的一般非线性规划问题(4.1),其罚函数为或罚函数法的迭代步骤如下:(1)取第一个罚因子 M1 0 (例如M1=1),允许误差 ,并令 k:=1。(2)求下述无约束极值问题的最优解:其中P(X,Mk)可取式(4.15)或(4.16)的形式。设其极小点为 X(k)。(3)若存在某一个 ,有或存在某一个 ,有则取 Mk+1Mk(例如 Mk+1=cMk,c=10),并令 k:=k+1。然后,转回第(2)步。否则,停止迭代,得所要的点 X(k)。4.6.2 4.6.2 障碍函数法障碍函数法(内点法)内点法)罚函数法的一个重要特点,就是函数 P(X,M)可在整个 En 空间内进行优化,可以任意选择初始点,这给计算带来了很大方便。但由于迭代过程常常是在可行域外进行,因而不能以中间结果直接作为近似解使用。如果要求每次的近似解都是可行解,以便观察目标函数值的改善情况;或者,如果目标函数在可行域外的性质比较复杂,甚至没有定义,这时就无法使用上面所述的罚函数法了。障碍函数法与罚函数法不同,它要求迭代过程始终在可行 域内部进行。考虑非线性规划(4.3),当 X 点从可行域 R 内部趋于其边界时,至少有某一个约束函数 趋于零。从而,下述倒数函数和对数函数都将无限增大。如果把式(4.17)或(4.18)加到非线性规划(4.3)的目标函数上,就能构成新的目标函数障碍函数。或 如果从某一点 出发,求下列无约束极小化问题 则随着障碍因子 的逐渐减小,即障碍项所起的作用也越来越小,因而,求出的问题(4.21)的解 就会逐步逼近原约束问题(4.3)的极小解。障碍函数法的迭代步骤如下:(1)取第一个障碍因子 ,允许误差 ,并令 k:=1。(2)构造障碍函数,可采取(4.19)或(4.20)。(3)对障碍函数进行无约束极小化,设所得解为 。(4)检查是否满足收敛准则:或如果满足此准则,则以 X(k)为原约束问题的近似极小解,停止迭代;否则,取 rk+1 rk,令 k:=k+1,转回第(3)步继续进行迭代。五五.动态规动态规划划动态规划是解决多阶段决策过程最优化问题的一种方法。该方法是由美国数学家贝尔曼等人在 20 世纪 50 年代初提出的。他们针对多阶段决策问题的特点,提出了解决这类问题的最优化原理,并成功地解决了生产管理、工程技术等方面的许多实际问题。多阶段决策问题的特点是整个决策过程可以分为好几个彼此有联系的阶段,而每一个阶段都有多于一个的小方案需要选择确定,决策者需要在可供选择的小方案中选出其中的一个最优方案,使其效果在预定的目标下达到最好。A5BDFCE11121067一个简单的多级决策:有某旅行者从 A 地出发到 F 地,可以选择两条路线,一是途经 B 地,D 地到 F;另一是途经 C 地,E 地到 F(如图),每段路程所需的费用在图中标出。这个问题是以总旅费达到最小作为目标,显然应选择:A C E F。整个规划的目标是使得最终结果达到最优,这就意味着,某一段作出的决策,就这个阶段来说,并不一定是一个最优的选择,甚至要作出某些牺牲(如上例第一段)。但是由于各阶段的相互影响,到最后却会得到一个最优的结果。相反,在这一阶段选择了一个最优的决策,并不等于最后得到最优结果,这就是动态规划的特点。使用动态规划方法解决多阶段决策问题,首先要将实际问题写成动态规划模型,此时要用到以下概念:(1)阶段;(2)状态;(3)决策和策略;(4)状态转移;(5)指标函数。下面我们结合以下例题说明这些概念。例 5.1 最短路线问题。如图所示,给定一个线路网络图,要从 A 地向 F 地铺设一条输油管道,各点间连线上的数字表示距离,问应选择什么线路,可使总距离最短?A468335425B1B2E2FD1E1C1C2C3C4D3D2737835448431265(1)阶段。将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,以便按次序去求每阶段的解。(2)状态。各阶段开始时的客观条件叫状态。描述各阶段状态的变量称为状态变量,sk 表示第 k 阶段的状态变量,sk 的取值集合称为状态集合,用 Sk 表示。在例5.1中,各阶段的状态集合分别是:当某段的初始状态已选定某个点时,从这个点以后的铺管路线只与该点有关,不受以前铺管路线的影响,这叫状态变量的“无后效性”,如果所选的状态变量不具备“无后效性”就不能用来构造动态规划模型。(3)决策和策略。当各段的状态取定以后,就可以作出不同的决定,从而确定下一阶段的状态,这种决定称为决策。表示决策的变量,称为决策变量,常用 uk(sk)表示第 k 阶段当状态为 sk 时的决策变量,Dk(sk)表示第 k 阶段从状态 sk 出发的允许决策集合。在例5.1中,有 D2(B1)=C1,C2,C3 如我们决定选择 C3,则可表为:u2(B1)=C3 各段决策确定后,整个问题的决策序列就构成一个策略,用 p1,n u1(s1),u2(s2),un(sn)表示,P1,n 表示允许决策的集合,使整个问题达到最优效果的策略就是最优策略。(4)状态转移方程。动态规划中,如果给定了第 k 阶段的状态 sk 和本阶段决策 uk(sk)则第 k+1 段的状态 sk+1 也就完全确定,它们的关系可用下列状态转移方程表示:sk+1=Tk(sk,uk)例5.1中,状态转移方程为:sk+1=uk(sk)(5)指标函数。用于衡量所选定策略优劣的数量指标称为指标函数。它分 为阶段指标函数和过程指标函数两种。阶段指标函数是指第 k段,从状态 sk 出发,采取决策 uk 时的效益,用 d(sk,uk)表示。一个 n 段的决策过程,从 1 到 n 叫做问题的原过程,对任意给定的 ,从第 k 段到第 n 段的过程称为原过程的一个后部子过程。V1,n(s1,p1,n)表示初始状态为s1 采用策略 p1,n 时,后部子过程的指标函数值,而Vk,n(sk,pk,n)表示在第 k 段,状态为 sk 采用策略 pk,n时,后部子过程的指标函数值。最优指标函数记为 fk(sk),它表示从第 k 段状态 sk 采用最优策略 到过程终止时的最佳效益值。即:当 k1 时,就是从初始状态 到全过程结束的整体最优函数。下面用动态规划方法求解例5.1。本方法是从过程的最后一段开始,用逆序递推方法求解,逐步求出各段各点到终点 F 的最短路线。第一步:从 k=5 开始,状态变量 s5 可取两种状态 E1,E2,它们到 F 点的路长分别为 4,3。即:第二步:k=4,状态变量可取三个值D1,D2,D3,从 D1 到 F 有两条路线,需要加以比较,取其中最短的,即:这说明 D1 到 F 最短距离为 7,其路径为 D1 E1 F 。相应决策 。即 D2 到 F 最短距离为 5,其路径为 D2 E2 F 。相应决策为 。即 D3 到 F 最短距离为 5,其路径为 D3 E1 F 。相应决策为 。类似地,可算得:3名商人名商人 3名随从名随从问题分析问题分析:安全渡河问题可以安全渡河问题可以视为一个多步决策过程。视为一个多步决策过程。每一步,即船由每一步,即船由此岸到此岸到彼岸或从彼岸驶回此岸,彼岸或从彼岸驶回此岸,都要对都要对船上的人员(商船上的人员(商人、随从各几人)作出人、随从各几人)作出决策,在保证安全的前决策,在保证安全的前提下(两岸的随从数都提下(两岸的随从数都河河小船小船(至多至多2人人)不比商人数多),在有限步内全部人员过河。用状态变不比商人数多),在有限步内全部人员过河。用状态变量表示某一岸的人员状况,决策变量表示船上的人员状量表示某一岸的人员状况,决策变量表示船上的人员状况,于是可以找出状态随决策变化的规律。况,于是可以找出状态随决策变化的规律。模型构成模型构成xk第第k次渡河前此岸的商人数次渡河前此岸的商人数yk第第k次渡河前此岸的随从数次渡河前此岸的随从数xk,yk=0,1,2,3;k=1,2,sk=(xk,yk)过程的状态(向量)过程的状态(向量)S=(x,y)x=0,y=0,1,2,3;x=3,y=0,1,2,3;x=y=1,2S允许状态集合允许状态集合uk第第k次渡船上的商人数次渡船上的商人数vk第第k次渡船上的随从数次渡船上的随从数dk=(uk,vk)决策决策D=(u,v)u+v=1,2允许决策集合允许决策集合uk,vk=0,1,2;k=1,2,sk+1=sk dk+(-1)k状态转移律状态转移律求求dk D(k=1,2,n),使使sk S,并按并按转移律转移律由由s1=(3,3)到达到达sn+1=(0,0).多步决策多步决策问题问题模型求解模型求解xy3322110穷举法穷举法编程上机编程上机图解法图解法状态状态s=(x,y)16个格点个格点10个个点点允许决策允许决策移动移动1或或2格格;k奇奇,左下移左下移;k偶偶,右上移右上移.s1sn+1d1,,d11给出安全渡河方案给出安全渡河方案同学们还可以进一步同学们还可以进一步考虑考虑4名商人各带一随从的情况(小船同前)。名商人各带一随从的情况(小船同前)。d1d11允许状态允许状态S=(x,y)x=0,y=0,1,2,3;x=3,y=0,1,2,3;x=y=1,2:评价对象(可替代且非劣的方案)评价对象(可替代且非劣的方案):评价指标(准则、项目):评价指标(准则、项目):评价指标权重,评价指标权重,1、关联矩阵法、关联矩阵法综合评价方法综合评价方法ViX1X2XnXjVijAiVij=?逐对比较法、古林法逐对比较法、古林法A1A2AmV11V12V1nV21V22V2nVm1Vm2Vmn.评价指标评价指标Xj替代方案替代方案Ai期望利期望利润(万润(万元)元)产品成品产品成品率(率(%)市场占有市场占有率(率(%)投资费用投资费用(万元)(万元)产品外观产品外观自行设计自行设计(A1)6509530110美美观观国外引进国外引进(A2)7309735180比较美观比较美观改改建(建(A3)520922550美美观观方案预期结果例表方案预期结果例表评价指标评价指标得分序号得分序号累计得累计得分分权重权重12345678910期期望望利利润润(X1)111140.4产产品品成成品品率(率(X2)011130.3市市场场占占有有率(率(X3)000110.1投投资资费费用用(X4)001120.2产产品品外外观观(X5)000000.0逐对比较法例表逐对比较法例表评评价价尺尺度度(得得分分)评价指标评价指标54321期期望望利利润润(万万元)元)800以上以上701-800601-700501-600500以下以下产产 品品 成成 品品 率率(%)97以上以上96-9791-9586-9085以下以下市市 场场 占占 有有 率率(%)40以上以上35-3930-3425-2925以下以下投投资资费费用用(万万元)元)20以下以下21-8081-120121-160160以上以上产品外观产品外观非常美观非常美观美观美观比较美观比较美观一般一般不美观不美观评价尺度例表评价尺度例表VijAi期望期望利润利润产品成产品成品率品率市场占市场占有率有率投资投资费用费用产品产品外观外观Vi0.40.30.10.20.0自行设计自行设计(A1)333343.0国外引进国外引进(A2)444133.4改建改建(A3)232442.7Xj关联矩阵表(逐对比较法)关联矩阵表(逐对比较法)341/2序号序号评价指标评价指标RjKj1期望利润期望利润180.5802产品成品率产品成品率60.1943市场占有率市场占有率20.0654投资费用投资费用40.1295产品外观产品外观10.032合计合计311.0003RjKjWj基准化基准化归一化归一化古林法求古林法求j例表例表序号序号(j)评价指标评价指标替代方案替代方案RijKijVij1期望利润期望利润A10.8901.2500.342A21.4041.4040.384A31.0000.2742产品成品产品成品率率A10.9791.0320.334A21.0541.0540.342A31.0000.324古林法求古林法求Vij例表例表3市场占市场占有率有率A10.8571.2000.333A21.4001.4000.389A31.0000.2784投资费投资费用用A11.6360.4550.263A20.2870.2870.160A31.0000.5775产品外产品外观观A11.3331.0000.364A20.7500.7500.272A31.0000.364古林法求古林法求Vij例表(续)例表(续)VijAi期望利期望利润润产品成品产品成品率率市场占有市场占有率率投资费投资费用用产品外产品外观观Vi0.5800.1940.0650.1290.032A10.3420.3840.2740.3340.3420.3240.3330.3890.2780.2630.1600.5770.3640.2720.3640.3300.3340.326A2A3Xj关联矩阵例表(古林法)关联矩阵例表(古林法)AnalyticHierarchyProcessAHP(美国运筹学家、匹兹堡大学教授(美国运筹学家、匹兹堡大学教授T.L.Saaty,1977)投资效果好(投资效果好(T)风险程度(风险程度(I1)资金利润率(资金利润率(I2)转产难易程度(转产难易程度(I3)产品产品1(P1)产品产品2(P2)产品产品3(P3)(目的层)(目的层)(准则层)(准则层)(方案层)(方案层)三、层次分析(三、层次分析(AHP)法)法判断矩阵标度定义判断矩阵标度定义标度标度含义含义1两个要素相比,具有同样重要性两个要素相比,具有同样重要性3两个要素相比,前者比后者稍微重要两个要素相比,前者比后者稍微重要5两个要素相比,前者比后者明显重要两个要素相比,前者比后者明显重要7两个要素相比,前者比后者强烈重要两个要素相比,前者比后者强烈重要9两个要素相比,前者比后者极端重要两个要素相比,前者比后者极端重要2,4,6,8上述相邻判断的中间值上述相邻判断的中间值倒数倒数两个要素相比,后者比前者的重要性标度两个要素相比,后者比前者的重要性标度AHP方法的基本工具方法的基本工具判断矩阵判断矩阵TI1I2I3WiWioI111/320.8740.230I23152.4660.648I31/21/510.4640.122(3.804)注注Wi的求取采用方根法(求根法或称几何平均值法)的求取采用方根法(求根法或称几何平均值法)I1P1P2P3WiWioP111/31/50.4060.105P2311/31.0000.258P35312.4660.637判断矩阵及其分析处理举例判断矩阵及其分析处理举例I2P1P2P3WiWioP11272.4100.592P21/2151.3570.333P31/71/510.3060.075I3P1P2P3WiWioP111/31/70.3620.081P2311/50.8430.188P37513.2710.731判断矩阵及其分析处理举例(续)判断矩阵及其分析处理举例(续)求综合重要度(加权和)求综合重要度(加权和)TI1I2I3综合综合重要度重要度权重权重0.2300.6480.122(加权和)(加权和)P10.1050.5920.1490.426P20.2580.3330.0660.283P30.6370.0750.7850.291(1)分分析析评评价价系系统统中中各各基基本本要要素素之之间间的的关关系系,建建立立系统的递阶层次结构(分解法);系统的递阶层次结构(分解法);(2)对对同同一一层层次次的的各各要要素素关关于于上上一一层层次次中中某某一一准准则则的的重重要要性性进进行行两两两两比比较较,构构造造判判断断矩矩阵阵(专专家家调调查查法法);(3)由由判判断断矩矩阵阵计计算算被被比比较较要要素素对对于于该该准准则则的的相相对对权重(方根法);权重(方根法);(4)计计算算各各层层要要素素相相对对于于系系统统目目的的(总总目目标标)的的合合成(总)权重,并据此对方案等排序(加权和法)。成(总)权重,并据此对方案等排序(加权和法)。AHP方法步骤方法步骤 课程:课程:教师:教师:班级:班级:评价项目(权重)评价项目(权重)好好(100)较较 好好(85)一一 般般(70)较较 差差(55)1.教学计划及教学内容安排(教学计划及教学内容安排(0.10)90.36140.5620.0800.002.教材及参考资料状况教材及参考资料状况(0.10)30.12140.5670.2810.043.教师教学态度及责任心教师教学态度及责任心(0.15)50.20150.6050.2000.004.教师讲解能力(教师讲解能力(0.10)10.04100.40110.4430.12评价结果评价结果(票数票数/隶属度隶属度)评价等级评价等级四、模糊综合评判法(四、模糊综合评判法(1)5.课堂教学形式的多样化程度(课堂教学形式的多样化程度(0.10)20.08110.44120.4800.006.理理论论联联系系实实际际程程度度及及教教学学案案例例使使用用情情况(况(0.10)50.20140.5660.2400.007.辅助教学环节及考核情况辅助教学环节及考核情况(0.10)40.1660.24130.5220.088.教学改革与创新情况教学改革与创新情况(0.10)30.1280.32120.4820.089.从从本本课课程程学学习习中中所所获获得得的的收收益益程程度度(0.15)50.20120.4860.2420.08综合评价结果综合评价结果综合隶属度综合隶属度0.1680.4700.3180.044综合得分综合得分81.43四、模糊综合评判法(四、模糊综合评判法(2)隶属度隶属度 rij指多个评价主体对某个评价对象指多个评价主体对某个评价对象在第在第i个项目下作出第个项目下作出第j等级评定的可能性程度。等级评定的可能性程度。若记:隶属度矩阵为若记:隶属度矩阵为评价项目权重向量为评价项目权重向量为评价等级分值向量为评价等级分值向量为则有:综合隶属度向量则有:综合隶属度向量S=W R综合得分综合得分四、模糊综合评判法(四、模糊综合评判法(3)动态规划模型常被用来求解经济管理中的货物存储、动态规划模型常被用来求解经济管理中的货物存储、设备更新、资源分配、任务均衡、水库调度、系统可靠性设备更新、资源分配、任务均衡、水库调度、系统可靠性等问题,在离散系统最优控制中也有广泛应用。等问题,在离散系统最优控制中也有广泛应用。动态规划模型的主要缺点是:动态规划模型的主要缺点是:1.1.没有统一的标准模型,也没有万能的构造模型的没有统一的标准模型,也没有万能的构造模型的 方法,方法,需要对每类问题具体分析。在定义状态变量、建立状态转需要对每类问题具体分析。在定义状态变量、建立状态转移率等方面,需要灵活技巧,这就带来了应用上的局限性。移率等方面,需要灵活技巧,这就带来了应用上的局限性。2.2.用数值方法求解时存在维数灾。由于状态个数随维数呈指用数值方法求解时存在维数灾。由于状态个数随维数呈指数增长,对高维问题求解十分困难。数增长,对高维问题求解十分困难。六六.最优控制理论最优控制理论 最优控制理论是从20世纪50年代末60年代初发展起来的现代控制理论的一个重要分支。它最初研究的对象是由导弹、航天、航空、航海中的制导、导航和控制中所总结出来的一类按某个性能指标取最优(极小或极大)的控制问题。其核心问题是如何为被控制系统选择一个控制策略,使得被控制系统本身获得优良的技术品质和满意的经济效益。今天,最优控制理论的研究,无论在深度和广度上都有了较大的发展,诸如分布参数系统的最优控制、随机系统的最优控制、大系统的最优控制、微分对策等许多方面都是当前极其活跃的科学研究领域。6.1 6.1 控制工程中的几个实际问题控制工程中的几个实际问题 为了更好地说明最优控制问题,我们给出几个工程控制中的实例。例6.1(升降机的最快升降问题)一个内部带控制器的物体 M,其质量为 1。常重力加速度 g 垂直向下作用到M 的质心上,控制器可提供一个作用于 M 使其垂直上升或下降的加速度 。设 和 分别表示 t0 时刻质心距地面的垂直距离和垂直运动速度。我们的问题是如何选择 ,使 M 从初始时刻 t0 的初态 最快地到达终端时刻 tf 的末态 (到达地面),(到达地面的速度)。这是一个最优控制问题,我们怎gu(t)x样用数学语言把它抽象成为数学问题。由牛顿第二定律可知:取 ,则上式可表示为:而端点条件(初态和末态)为:这里 称为状态量,而 称为控制量(它操纵 M 的上下运动)。于是升降机的最快升降问题可叙述为:寻找满足 的控制,使得它把 M(由(6.1)式描述)从初态转移到末态(0,0)且使过渡时间最短。数学模型如下:例6.2(生产库存控制问题)一种产品的生产与其库存有密切关系。生产太多卖不出去,生产太少,就会造成市场脱销,因而减少收入。因此采取什么策略使库存适当,市场又不脱销是一个值得讨论的策略问题。设 是 时刻的库存量,是 时刻产品的生产率 是 时刻的销售率。生产库存系统的状态方程可描述为其初始条件为这里 为状态量,为控制量。显然控制应满足如下限制:。分别为最小和最大生产率。设 表示生产率为 时单位时间内的生产成本,表示库存为 时单位时间内的库存成本,对给定的终端时刻 ,要求整个时间内总成本最小,即性能指标为于是所谓最优库存问题的数学模型如下:从以上两例可以看出,最优控制问题的数学模型一般为:6.2 6.2 固定边界问题固定边界问题 我们现在考虑如下固定边界问题: