第四章 无约束优化方法.doc
《第四章 无约束优化方法.doc》由会员分享,可在线阅读,更多相关《第四章 无约束优化方法.doc(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 无约束优化方法在求解目标函数的极小值的过程中,若对设计变量的取值范围不加限制,则称这种最优化问题为无约束优化问题。尽管对于机械的优化设计问题,多数是有约束的,无约束最优化方法仍然是最优化设计的基本组成部分。因为约束最优化问题可以通过对约束条件的处理,转化为无约束最优化问题来求解。无约束优化问题的一般形式可描述为:求n维设计变量使目标函数 (4.1)对于上述无约束优化问题的求解,可以利用第二章讲述的无约束优化问题的极值条件求得。即将求目标函数的极值问题变成求方程的解。也就是求使其满足解上述方程组,求得驻点后,再根据极值点所需满足的充分条件来判定是否为极小值点。但上式是一个含有个未知量,个
2、方程的方程组,在实际问题中一般是非线性的,很难用解析法求解,要用数值计算的方法。由第二章的讲述我们知道,优化问题的一般解法是数值迭代的方法。因此,与其用数值方法求解非线性方程组,还不如用数值迭代的方法直接求解无约束极值问题。数值迭代法的基本思想是从一个初始点出发,按照一个可行的搜索方向搜索,确定最佳的步长使函数值沿方向下降最大,得到点。依此一步一步地重复数值计算,最终达到最优点。优化计算所采用的基本迭代公式为 (4.2)由上面的迭代公式可以看出,采用数值法进行迭代求优时,需要确定初始点、搜索方向和迭代步长,称为优化方法迭代算法的三要素。第三章我们已经讨论了如何在搜索方向上确定最优步长的方法,本
3、章我们将讨论如何确定搜索方向。一个算法的搜索方向是该优化方法的基本标志,它从根本上决定着一个算法的成败和收敛速率的快慢。因此,分析、确定搜索方向是研究优化方法的最根本的任务之一。各种无约束优化方法也是在确定搜索方向上显示出各自的特点。无约束优化方法可以分为两类。一类是通过计算目标函数的一阶或二阶导数值确定搜索方向的方法,称为间接法,如最速下降法、牛顿法、变尺度法和共轭梯度法。另一类是直接利用目标函数值确定搜索方向的方法,称为直接法,如坐标轮换法、鲍威尔法和单形替换法。本章将分别讨论上述这两类无约束优化方法。41最速下降法4.1.1最速下降法的基本原理由第二章优化设计的数学基础可知,梯度方向是函
4、数增加最快的方向,负梯度方向是函数下降最快的方向,所以最速下降法以负梯度方向为搜索方向,每次迭代都沿着负梯度方向进行一维搜索,直到满足精度要求为止。因此,最速下降法又称为梯度法。由公式(4.2)可知,若某次选代中己取得点,从该点出发,取负梯度方向为搜索方向。则最速下降法的迭代公式为 (4.3)当第次的迭代初始点和搜索方向已经确定的情况下,原目标函数成为关于步长的一维函数。即最优步长可以利用一维搜索的方法求得根据一元函数极值的必要条件和多元复合函数的求导公式,得或写成 由此可知,在最速下降法中相邻两个搜索方向互相正交。也就是说在用最速下降法迭代求优的过程中,走的是一条曲折的路线,该次搜索方向与前
5、一次搜索方向垂直,形成“之”字形的锯齿现象,如图4.1所示。最速下降法刚开始搜索步长比较大,愈靠近极值点其步长愈小,收敛速度愈来愈慢。特别是对于二维二次目标函数的等值线是较扁的椭圆时,这种缺陷更加明显。因此所谓最速下降是指目标函数在迭代点附近出现的局部性质,从迭代过程的全局来看,负梯度方向并非是目标函数的最快搜索方向。 图4.1最速下降法的搜索路径此外,最速下降法的迭代公式也可以写成下面的形式 (4.4)将其与式4.3相比较,可知,此处等于4.3式中步长除以函数在点导数的模,而此时的搜索方向也不再是个单位向量。4.1.2最速下降法的迭代过程) 给定初始点,收敛精度,并令计算次数;) 计算点的梯
6、度及梯度的模,并令) 判断是否满足精度指标;若满足,为最优点,迭代停止,输出最优解和,否则进行下一步计算;) 以为出发点,沿进行一维搜索,求能使函数值下降最多的步长,即) 令,转到步骤2)。最速下降法的程序框图如图4.2所示。开始输入,计算及搜索方向一维搜索求最优步长结束4.2最速下降法的程序框图例题4.1 用最速下降法求目标函数的极小值,设初始点,计算精度。解 ()计算初始点处目标函数的梯度和梯度的模()由于,不满足精度指标,转下一步计算。()确定搜索方向()计算新的迭代点由公式(4.2)可得代入目标函数 沿方向进行一维搜索(或对求导,并令其为零)令,求得最优步长。()计算新迭代点()计算新
7、迭代点的梯度及梯度的模因已满足精度要求,停止迭代,得最优解为,可见,对于目标函数的等值线为圆的情况,只要一次迭代就能达到极小值点。这是因为圆周上任意一点的负梯度方向总是指向圆心的,如图4.3所示。图4.3例题4.1目标函数极小值的搜索过程例题4.2用最速下降法求目标函数的极小值,设初始点,计算精度。解()计算初始点处目标函数的梯度和梯度的模()由于,不满足精度指标,转下一步计算。()确定搜索方向()计算新的迭代点由公式(4.2)可得代入目标函数并沿方向进行一维搜索,求得最优步长。()计算新迭代点()计算新迭代点的梯度及梯度的模继续进行第二次迭代。以下各次迭代的结果列于表4.1。到第五次迭代结束
8、时有故迭代终止,最优解为图4.4给出了本例题的搜索过程。表4.1 例题4.2各次迭代结果x1x2022104100.0811.-0.3.3.20.0.0.3.30.-0.000110.0.40.0.0.0.50.-0.90.0.图4.4 例题4.2 目标函数极小值的搜索过程例题4.3 用最速下降法求目标函数的极小值,计算精度。解 ()取初始点,计算初始点处的目标函数、梯度及其模()求搜索方向()计算新的迭代点代入目标函数,并沿方向进行一维搜索,求得最优步长于是新迭代点()计算新迭代点处的目标函数、梯度及其模未达到精度要求,应继续迭代,各轮计算结果如表4.2所示。表4.2 例题4.3各次迭代结果
9、x1x20006010.7703317.3.15.736845.26.5.9.1.37.5.8.0.47.5.8.0.57.5.8.0.67.5.8.0.77.5.8.0.87.996085.997068.0.经过8轮的迭代,满足精度要求,迭代终止。输出最优解为,其函数值为。搜索过程如图4.5所示。图4.5 例题4.3 目标函数极小值的搜索过程通过上面的分析可知最速下降法具有以下特点:(1)理论明确,程序简单,对初始点要求不严格,每次迭代所需的计算量和存储量也较小,适用于计算机计算。(2)对一般函数而言,最速下降法的收敛速度并不快,因为最速下降方向仅仅是指某点的一个局部性质。(3)最速下降法相
10、邻两次搜索方向的正交性,决定了迭代全过程的搜索路线呈锯齿状,在远离极小点时逼近速度较快,而在接近极小点时逼近速度较慢。(4)最速下降法的收敛速度与目标函数的性质以及初始点的选择密切相关。对于等值线(面)为同心圆(球)的目标函数,一次搜索即可达到极小点。若目标函数为二次函数,等值线为椭圆,当初始点选在长轴或短轴上时,一次搜索也可达到极小值点。42牛顿法牛顿法是根据目标函数的等值线在极值点附近为同心椭圆族的特点,在极值点邻域内用一个二次函数来近似代替原目标函数,并将的极小值点作为对目标函数求优的下一个迭代点,经多次迭代,使之逼近原目标函数的极小值点。4.2.1牛顿法的基本原理设目标函数是连续二阶可
11、微的,将函数在点按泰勒级数展开,并保留到二次项,得此式是个二次函数,设为的极小值点,则即 (4.5)这就是多元函数求极值的牛顿法迭代公式。式中取称为牛顿方向,为常数。式中没有步长,或者可以看成步长恒等于1,所以牛顿法是一种定步长的迭代。例题4.4 用牛顿法求目标函数的极小值。解 ()取初始点()计算梯度、二阶偏导数矩阵及其逆矩阵()计算新的迭代点经过一次迭代即可求得极小值点,函数极小值。例题4.5 用牛顿法求目标函数的极小值,计算精度。解 ()取初始点,()计算梯度、二阶偏导数矩阵及其逆矩阵()计算新的迭代点经过一次迭代即可求得极小值点,函数极小值。例题4.6 用牛顿法求目标函数的极小值,计算
12、精度。解 ()取初始点。()计算梯度、二阶偏导数矩阵及其逆矩阵()计算新的迭代点()计算新迭代点的梯度及梯度的模继续进行第二次迭代。以下各次迭代的结果列于表4.3。到第四次迭代结束时有 故迭代终止,最优解为表4.3 例题4.6各次迭代结果x1x200046.1-2.5-0.2541.062566.2-1.854841.4.16.3-1.347491.0.4.4-1.117221.03897-0.490440.5-1.056871.-0.513320.6-1.052761.-0.513410.目标函数的等值线如图4.6所示。用解析的方法可知,目标函数有三个驻点:,。由函数取得极值的充分条件可知,
13、是极小值点,是鞍点,而则是局部极小值点。因此,初始点的选择对于问题的求解至关重要。若初始点取为,函数收敛到。若初始点取为,函数收敛到鞍点。 图4.6 例题4.6 目标函数的等值线4.2.2 阻尼牛顿法由以上的两个例题可以看出,对于二次函数,用牛顿法迭代一次即可得到最优点;对于非二次函数,若函数的迭代点已进入极小点的邻域,则其收敛速度也是很快的。但是从牛顿法迭代公式的推导可以看出,迭代点是由近似二次函数的极值条件确定的,该点可能是极小值点,也可能是的极大值点。因此在用牛顿法迭代时,可能会出现函数上升的现象,即,使迭代不能收敛于最优点。例如上例中若取初始点,第一次迭代点的函数值就增大。这表明牛顿法
14、不能保证函数值稳定地下降,在严重的情况下甚至不能收敛而导致计算失败。可见,牛顿法对初始点的要求是比较苛刻的,所选取的初始点离极小值点不能太远。而在极小值点位置未知的情况下,上述要求很难达到。为了消除牛顿法的上述这些弊病,需要对其做一些修改。将牛顿法定步长的迭代,改为变步长的迭代,引入步长,在的牛顿方向进行一维搜索,保证每次迭代点的函数值都是下降的。这种方法称为阻尼牛顿法,其迭代公式为 (4.6)式中,为牛顿方向的最优步长。这种方法对初始点的选取不再苛刻,从而提高了牛顿法的可靠度。但采用阻尼牛顿法,每次迭代都要进行一维搜索,使收敛速度大大降低。例如,对于例4.6所示的目标函数,取同样的初始点,采
15、用阻尼牛顿法进行迭代,达到同样的精度,要经过25次的迭代,越靠近极小值点收敛速度越慢,使牛顿法收敛速度快的优势损失殆尽。阻尼牛顿法的迭代过程阻尼牛顿法的计算步骤如下:)给定初始点,收敛精度,并令计算次数;)计算点的梯度和梯度的模;)判断是否满足精度指标;若满足,为最优点,迭代停止,输出最优解和,否则进行下一步计算;5)计算点的牛顿方向6)以为出发点,沿进行一维搜索,求能使函数值下降最多的步长,即令,转到步骤2)。阻尼牛顿法的程序框图如图4.7所示。牛顿法和阻尼牛顿法统称为牛顿型方法。这类方法的最大优点是收敛速度快。也就是说,它的迭代次数相对其他方法来说少得多。特别是对于一些性态较好的目标函数,
16、例如二次函数,只需保证求梯度和二阶偏导数矩阵时的精度,不管初始点在何处,均可一步就找出最优点。可是这类方法也有很大的缺点。首先,在每次迭代决定牛顿方向时,都要计算目标函数的一阶导数和二阶导数矩阵及其逆矩阵。这就使计算较为复杂,增加了每次迭代的计算工作量和计算机的存储量。开始输入,计算及其一维搜索求最优步长结束计算点的牛顿方向图表 Error! No text of specified style in document.1图4.6阻尼牛顿法的程序框图4.7阻尼牛顿法的程序框图3共轭梯度法431 共轭方向由4.1节的讨论可知,最速下降法具有计算简单,对初始点的选择要求低,最初几步迭代速度快的优点
17、,但是越接近极值点时效果越差,在搜索过程中呈锯齿状的搜索路径,如图4.1所示。设想在搜索过程中,如果能如图4.9所示,截弯取直在沿搜索到点后,不再沿的负梯度方向搜索,而改沿的方向进行搜索,前已述及,任意形式的目标函数在极值点附近都近似于一个二次函数,希望对二次函数一次搜索到达极小值点X*。即有 (4.8)那么这样的方向应该满足什么条件呢? 在点的梯度为 (4.9)因为为极小值点,应满足存在极值的必要条件,故有由式(4.8)及式(4.9)可得将等式两边同时左乘。因为与正交,。则有这就是使直指极小点所必须满足的条件。两个向量和称为G的共轭向量,或称和对是共轭方向。可见,沿方向搜索得到后,再沿的共轭
18、方向搜索就可以到达极小值点。下面给出共轭方向的定义:设为阶的正定矩阵,若有两个维向量和满足 (4.10)则两个向量和称为矩阵的共轭向量,和对矩阵是共轭方向。显然,当(单位矩阵)时,式(4.10)变为即,向量和互相正交。由此可见,共轭概念是正交概念的推广,正交是共轭的特例。432 共轭方向的性质性质 若非零向量系是对共轭的,则这n个向量是线性无关的。性质2 在n维空间中互相共轭的非零向量的个数不超过n。性质3 从任意初始点出发,顺次沿n个的共轭方向进行一维搜索,最多经过n次迭代就可以找到的二次函数f(x)的极小值点。上述三条性质是采用共轭方向进行迭代的重要理论依据。用共轭方向法进行迭代的关键是如
19、何获得新的共轭方向。提供共轭向量系的方法有许多种,从而形成了各种具体的共轭方向法,如共轭梯度法、鲍维尔法等。433 共轭梯度法的基本原理1、 正定二元二次函数的等值线是椭圆线簇,椭圆线簇的中心就是目标函数的极值点;2、 过同心椭圆线簇中心作任意直线,此直线方向与椭圆交点处的切线方向是对A共轭的。下面进行反证:对二次函数:由于任意形式的目标函数在极值点附近的特性,都近似于一个二次函数,其等值线在极值点附近为近似的同心椭圆族。同心椭圆族有一个特性,就是任意两根平行线与椭圆族切点的连线必通过椭圆的中心。共轭梯度方向的构造:基本思想就是希望利用前面已知的方向信息和梯度信息,434 共轭梯度法的迭代过程
20、共轭梯度法的迭代步骤如下:) 取初始点,计算精度;) 令,;) 从出发沿方向一维搜索到;) 计算梯度,检验是否满足。若满足则迭代停止,点为极小值点。否则进行5);) 判断是否成立,若,则令,返回2);否则计算令,返回3);共轭梯度法的程序框图如图(4.12)所示。例题4.8 用共轭梯度法求目标函数的极小值,计算精度。解 ()取初始点, ()计算初始点处的梯度及其模以及搜索方向()计算新的迭代点代入目标函数,并沿方向进行一维搜索(或对求导,并令其为零),求得最优步长。于是新迭代点()计算新迭代点处的梯度及其模()计算系数,及共轭方向()计算新的迭代点代入目标函数,并沿方向进行一维搜索,求得最优步
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 无约束优化方法 第四 无约束 优化 方法
限制150内