非线性约束最优化算法.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《非线性约束最优化算法.pptx》由会员分享,可在线阅读,更多相关《非线性约束最优化算法.pptx(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本文框架本文框架最优化算法最优化算法分类分类不等式约束组合不等式约束组合变量消除变量消除优化优化函数函数和和滤波滤波马洛托斯现象马洛托斯现象二二次校正和非次校正和非单调单调方法方法第1页/共50页15.1 15.1 最优化算法分类最优化算法分类非线性最优化非线性最优化算法没有分类标准;算法没有分类标准;对对后面后面章节各种章节各种逼近做了分组,逼近做了分组,如下如下 所所述述:I.I.第第1616章章,讨论,讨论二次线性二次线性规划规划(quadratic programming)求解问题的算法问题的算法,它,它具有独特具有独特的性能。对的性能。对有有效效集集(active set),内点内点
2、法法(interior-point)和和梯度投影法梯度投影法(gradient projection methods)进行进行讨论讨论。II.II.第第1717章章,讨论讨论罚函数罚函数(penalty)和和增广增广拉格朗日拉格朗日(augmented Lagrangian methods)方法方法,把目标函,把目标函数和条件都结合归到罚函数里边,这样可以通过求解一系列非约束条件处理数和条件都结合归到罚函数里边,这样可以通过求解一系列非约束条件处理15.115.1问题问题。第2页/共50页15.11 15.11 罚函数罚函数和和增广增广朗格朗日方法朗格朗日方法假如假如(15.1)15.1)中只
3、有等式约束中只有等式约束条件存在条件存在,那么二,那么二次次罚函数罚函数定义定义:等式约束问题,定义等式约束问题,定义:结合拉格朗日函数性质和二次罚函数(结合拉格朗日函数性质和二次罚函数(15.215.2)函数)函数增广拉格朗日函数增广拉格朗日函数:第3页/共50页15.12 15.12 连续连续二次规划方法二次规划方法第第1818章章,讨论讨论序列二次规划方法二次规划方法(sequential quadratic programming)简称SQP.基本的SQP方法中定义Pk在(xk,k)迭代的方向,从而得到解约束条件:第4页/共50页15.13 非线性规划内点法第19章,讨论非线性规划内点
4、法(interior-point)相对在14章讨论的线性规划来说,这种方法可以看做是原始对偶内点法(primal-dual interior-point)的拓展,也可以看做是障碍法。约束条件:第5页/共50页15.2 不等式约束组合求解非线性规划最主要的难题是处理不等式约束,特别是在解中确定哪些约束条件是有效的。估测一个最优有效集A*,这是一组约束条件,在解处满足等式。这估测值叫做作用集,用w表示。在作用域约束条件强制为等式,约束条件在w处忽略,然后求解。最后验证是否有一个拉格朗日乘数,得到近似解X*,且W满足KKT条件(12.34)。这样把这X*看做(15.1)的局部解。例子:即使小数量的不
5、等式约束,确定最优化有效集不是一个简单的任务。问题:约束条件:第6页/共50页15.21 W的八种可能选择用在下面的描述的作用作用域:按指数1到3有序标记,图15.1阐述了目标函数的形态,可行域是两轴和曲线包围的区域。可以看出在解中只有第一个约束条件有效,(x*,y*)=(1.953,0.089)即使对这个小的例子,考虑所有w可能的值很麻烦,图15.1表明,可以利用定义这个问题和他们的派生的函数知识消除,事实上在16章描述的有效集方法利用这种信息来进行一系列有根据的猜测作用域,避免w选择的明显偏离15.1的解。既内点法(障碍法)之后,一种不同的方法在19章考虑,这种方法生成的迭代远离通过不等式
6、约束条件定义的可行定义域的边界,作为非线性规划的解释近似的阻碍作用被消弱,允许精度增加解的估计,在这种方法中避免了非线性规划组合的难题。第7页/共50页第一种可能:求解方案中任何约束条件无效,也就是说w=,由于f=(x-2,y-1/2)T,可以看到无约束f最小值在可行域外边,所以最优化有效集不能为空。有7种另外可能,其中三个约束条件是有效的,w=1,2,3,图(15.1)对这个问题这样的情况没有发生,三个约束条件不共享一个相同的交叉点。通过单一的有效约束条件,得到三个更进一步的可能,那就是是w=1,w=2,w=3W=2,只有x=0的约束条件有效,如果在这种条件下使f执行最小化,得到(0,1、2
7、)T这个点,检查(12.34)KKT条件,表明无论选择什么拉格朗日乘数,都不能满足在0,1、2)T的条件。(因为必须要1=3=0满足(13.34e),通过这表明,设2=-2满足(12.34a),但是2的值不满足(12.34d)。W=1,3,得到单一的可行点(3,0)T,由于约束条件2在这个点无效,令2=0,解决(12.34a)用其他朗格朗日乘数,得到1=-16,3=16.5。,这些值是负数,不满足(12.34)所以(3,0)T不是(15.1)的解。W=1,求解等式约束条件问题,这问题中第一个约束条件是有效的,得到点(x,y)T=(1.953,0.089)T和拉格朗日乘数1=0.411。通过设定
8、2=3=0,很容易得到,(12.34)的KKT其他条件是满足。于是得结论这个点是KKT点,由于拉格朗日的Hessian正定,很容易得到二阶充分条件满足。第8页/共50页15.3 变量消除处理约束最优化问题,用边界条件消除问题中的变量是正常的,用更少的自由度得到一个简单问题。然而由于消除法可能改变问题或者引入病态条件必须小心使用I.目标函数:II.约束条件:III.得到两个变量的函数:第9页/共50页15.31 非线性消除的缺点问题思考:问题思考:约束条件:约束条件:通过消除通过消除y y求解,得到下面等式:求解,得到下面等式:很明显,随着很明显,随着x x趋近负无穷时,趋近负无穷时,h(x)h
9、(x)趋近负无穷。盲目应用这个转换,趋近负无穷。盲目应用这个转换,得到这个问题无线,但是这个问题不能忽略约束条件(得到这个问题无线,但是这个问题不能忽略约束条件(x-1x-1)3 3=y=y2 2,这,这个含蓄的表明个含蓄的表明x1x1界值,这个解是有效的。因此,如果希望消除界值,这个解是有效的。因此,如果希望消除y y,必,必须加入须加入x1x1这个界值。这个界值。这个这个问题说明了用非线性消去变量,可能导致很难追踪错误的结果。基问题说明了用非线性消去变量,可能导致很难追踪错误的结果。基于这个原因,大多数最优化算法中不用非线性消去法。相反,许多约束于这个原因,大多数最优化算法中不用非线性消去
10、法。相反,许多约束条件的线性的算法会用到消去法去解一些简单问题。现在就系统的概述条件的线性的算法会用到消去法去解一些简单问题。现在就系统的概述下用线性约束去得到变量消除的目的。下用线性约束去得到变量消除的目的。第10页/共50页15.32 用线性约束简单消去思考线性函数的约束条件的最小化问题,约束条件是线性等式约束:约束条件:A A是是一一个个mnmn的的矩矩阵阵,mnmn。简简单单起起见见假假设设A A是是满满秩秩(假假如如情情况况不不是是这这种种情情况况,得得到到这这个个问问题题要要么么矛矛盾盾,要要么么约约束束条条件件多多余余的的,能能删删除除而而不不影影响响问问题题的的解解)在在这这种
11、种假假定定下下,我我们们可可以以找找到到线线性性独独立立矩矩阵阵的的m m列列的的一一个个子子集集。如如果果将将这这些些列列向向量量组组合合到到一一个个 的的B B矩矩阵阵,定定义义一一个个 的的P P置置换换矩矩阵阵。矩矩阵阵是将这些列与的第一个是将这些列与的第一个 列进行交换的矩阵,列进行交换的矩阵,表达式表达式:N N表示矩阵表示矩阵n-mn-m剩余列。剩余列。(这里的注释和第这里的注释和第1313章一致,讨论线性规划背章一致,讨论线性规划背景的相似概念景的相似概念)第11页/共50页定义下面形式下的子向量:(15.8)xB为基变量,B为基矩阵。注意PPT=I可以将约束条件Ax=b改写如
12、下:重排这个式子,通过下面的表达式可以减少所给的基变量:(15.9)从而,通过选择任意xN值,计算约束条件Ax=b的可行点,然后可以通过(15.9)设置xB。因此,(15.4)问题和非约束问题等价。(15.10)上述讨论说明了线性等式的约束条件的非线性最优化问题是从数学上述讨论说明了线性等式的约束条件的非线性最优化问题是从数学观点来的,非约束问题观点来的,非约束问题同样,下面就讨论非约束问题同样,下面就讨论非约束问题第12页/共50页15.34 线性等式的非约束问题的非线性最优化思考:(15.11a)约束条件:(15.10)定义转置矩阵P得 的组成从新排列,xT=(x3,x6,x1,x2,x4
13、,x5)T,得到AP矩阵的系数:基矩阵B是对角阵,因此,很容易求取转置(15.12)第13页/共50页替换替换(15.11a)(15.11a)中的中的x3x3,x6x6,问题,问题变成如下:变成如下:(15.13)(15.13)从系数矩阵从系数矩阵(不含有不含有X3X3和和X6X6两个变量两个变量)中选择其它两列中选择其它两列作作(15.11b)15.11b)系系统中消除的基础。然而,这些选择,统中消除的基础。然而,这些选择,B-1NB-1N将会变得更复杂将会变得更复杂。用用高斯消元法选择一组高斯消元法选择一组m m非独立列,在线性代数中的用语,能计算出非独立列,在线性代数中的用语,能计算出这
14、个矩阵的行阶梯型,选择中心轴列做为基矩阵的列。理想情况下,这个矩阵的行阶梯型,选择中心轴列做为基矩阵的列。理想情况下,希望希望B B矩阵很好分解和适定性。为了这个目的,用稀疏高斯消去算法矩阵很好分解和适定性。为了这个目的,用稀疏高斯消去算法去,保持稀疏、控制舍入误差。去,保持稀疏、控制舍入误差。第14页/共50页从(15.8)和(15.9)中可以看出在线性约束条件(15.6)中任意可行点 可以被写成:(15.14)(15.15)注意注意 z z有有 n-mn-m线性非独立列线性非独立列(由于在由于在低维低维中存在单位矩中存在单位矩阵的存在阵的存在)满足满足AZ=0AZ=0因此因此,Z Z是空矩
15、阵是空矩阵A A的基础矩阵。的基础矩阵。加加上上Y Y和和Z Z的列组成是一个线性的列组成是一个线性非独立集非独立集。我们。我们也可以看到也可以看到 是线性约束是线性约束条件一条件一个特解个特解.第15页/共50页换句话说,这个简单消去法说明了可行点可以作为Ax=b(15.14的第一项)的特解加上沿着约束条件(15.14的第二项)的空集(或者相切)总的概括。这(15.13),(15.14)的关系表明特解Yb是从控制x的n-m个在点的组成,别的 部分是松弛的,直到它们满足约束条件;Yb的特解有时称作坐标松弛步长。见图15.3坐标松弛步长Yb通过选择不基矩阵B去成为A矩阵的第一列,若果选择B作为A
16、的第二列,那么坐标松弛步长将沿着X2轴。简单消去法不费时,但是数值不稳定会产生。如果图15.3中这个可行集是由几乎平行与X1轴的一条线组成的话,沿着这个坐标轴的坐标松弛是一个比较大的数量级。计算x作为不同的大矢量,给出数值取消。在这种情况下选择沿着x2轴的特解会比较好,也就是说选择不同的基。因此,一般情况下,选择最好的基底并不是一个简单的任务。当这个基矩阵 约束条件很少时,在定义 过程中会引起数值错误。为了克服过分协调松弛步长的危险。我们可以定义这个特解Yb作为约束条件的最小基准步长。这种方法是现在所描述的纵多消去法中的特殊情况。第16页/共50页15.35 线性约束条件的一般消减法对(15.
17、14)和(15.15)归类,选择矩阵YRnm和ZRn(n-m),具有以下性质:(15.16)这些属性表明,正如(15.15)Z的列是空矩阵A的基底。因为A有满秩,所以AY I Z=AY I0,所以AY矩阵也是非奇异矩阵,现在表示线性约束Ax=b任何形式的解,如下:(15.17)对向量XYRm和xZRn-m,通过15.17的取代到约束条件Ax=b得到:因此通过非奇异矩阵,可以直接被写成下式:(15.18)通过代替表达式(15.17),得到任意一个向量 的形式:(15.19)第17页/共50页xzRn-m的任意选择满足约束条件Ax=b。因此,这个问题(15-6)可以被重新当做如下的非约束问题:(1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 非线性 约束 优化 算法
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内