常用无约束最优化方法ppt课件.ppt
《常用无约束最优化方法ppt课件.ppt》由会员分享,可在线阅读,更多相关《常用无约束最优化方法ppt课件.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 常用无约束优化方法常用无约束优化方法最速下降法最速下降法 Newton法法修正修正Newton法法共轭方向法共轭方向法 共轭梯度法共轭梯度法 变尺度法变尺度法 坐标轮换法坐标轮换法 单纯形法单纯形法第五章第五章 常用无约束优化方法常用无约束优化方法对于多维无约束最优化问题对于多维无约束最优化问题)(minXf(5.1) 成立点成立点 就是问题(就是问题(5.1)的)的全局最优点全局最优点但是,但是,大多数最优化方法只能求到局部最优点这个矛盾对大多数最优化方法只能求到局部最优点这个矛盾对于实际问题来讲一般容易解决,因为根据问题的实际于实际问题来讲一般容易解决,因为根据问题的实际意义
2、多半可以直接判定用优化方法求出的局部最优解意义多半可以直接判定用优化方法求出的局部最优解是否为全局最优解但在理论上这是个比较复杂的问是否为全局最优解但在理论上这是个比较复杂的问题,本书不涉及题,本书不涉及 *X其中其中 这个问题的求解是指,在这个问题的求解是指,在 中找一中找一点,使得对于任意的点,使得对于任意的 都有都有1RRfn:nRnRX )()(*XfXf(5.2) 无约束优化方法是优化技术中极为重要无约束优化方法是优化技术中极为重要,它不仅可以直它不仅可以直接用来求解无约束优化问题,而且很多约束优化问题接用来求解无约束优化问题,而且很多约束优化问题也常将其转化为无约束优化问题,然后用
3、无约束优化也常将其转化为无约束优化问题,然后用无约束优化方法来求解同时,有些无约束优化方法只需略加处方法来求解同时,有些无约束优化方法只需略加处理,即可用于求解约束优化问题理,即可用于求解约束优化问题 第五章第五章 常用无约束优化方法常用无约束优化方法无约束优化理论发展较早,比较成熟,方法也很多,无约束优化理论发展较早,比较成熟,方法也很多,新的方法还在陆续出现把这些方法归纳起来可以分新的方法还在陆续出现把这些方法归纳起来可以分成两大类:一类是仅用计算函数值所得到的信息来确成两大类:一类是仅用计算函数值所得到的信息来确定搜索方向,通常称它为定搜索方向,通常称它为直接搜索法直接搜索法,简称为,简
4、称为直接法直接法,另一类需要计算函数的一阶或二阶导数值所得到的信另一类需要计算函数的一阶或二阶导数值所得到的信息来确定搜索方向,这一类方法称为息来确定搜索方向,这一类方法称为间接法间接法(或(或解析解析法法)直接法不涉及导数和)直接法不涉及导数和Hesse矩阵,适应性强,但矩阵,适应性强,但收敛速度一般较慢;间接法收敛速度一般较快,但需收敛速度一般较慢;间接法收敛速度一般较快,但需计算梯度,甚至需要计算计算梯度,甚至需要计算Hesse矩阵一般的经验是,矩阵一般的经验是,在可能求得目标函数导数的情况下还是尽可能使用间在可能求得目标函数导数的情况下还是尽可能使用间接方法;相反,在不可能求得目标函数
5、的导数或根本接方法;相反,在不可能求得目标函数的导数或根本不存在导数的情况下,当然就应该使用直接法不存在导数的情况下,当然就应该使用直接法 第五章第五章 常用无约束优化方法常用无约束优化方法5.1 最速下降法最速下降法为求问题(为求问题(5.1)的最优解,按最优化算法的基本思想)的最优解,按最优化算法的基本思想是从一个给定的初始点是从一个给定的初始点 出发,通过基本迭代公式出发,通过基本迭代公式 ,按照特定的算法产生一串点列,按照特定的算法产生一串点列 ,如果点列收敛,则该点列的极限点为问题(如果点列收敛,则该点列的极限点为问题(5.1)的最)的最优解优解 0XkkkkPtXX1kX最速下降法
6、基本原理最速下降法基本原理在基本迭代公式在基本迭代公式 中,每次迭代搜索方向中,每次迭代搜索方向 取为目标函数取为目标函数 的负梯度方向,即的负梯度方向,即 ,而,而每次迭代的步长每次迭代的步长 取为最优步长,由此所确定的算法取为最优步长,由此所确定的算法称为称为最速下降法最速下降法kkkkPtXX1kP)(Xf)(kkXfPkt在第二章中,我们曾经提到,对于函数,其函数在第二章中,我们曾经提到,对于函数,其函数值下降最快的方向是该函数的负梯度方向。值下降最快的方向是该函数的负梯度方向。 第五章第五章 常用无约束优化方法常用无约束优化方法对于问题(对于问题(5.1),假定我们已经迭),假定我们
7、已经迭代了代了k次,获得了第次,获得了第k个迭代点个迭代点Xk现现在从在从Xk出发,可选择的下降方向很多出发,可选择的下降方向很多,一个非常自然的想法是沿最速下降,一个非常自然的想法是沿最速下降方向(即负梯度方向)进行搜索应该方向(即负梯度方向)进行搜索应该是有利的,至少在邻近的范围内是这是有利的,至少在邻近的范围内是这样因此,取搜索方向为样因此,取搜索方向为:)(kkXfP为了使目标函数在搜索方向上下降最多,沿为了使目标函数在搜索方向上下降最多,沿Pk进行一维进行一维搜索,由此得到第搜索,由此得到第k+1个迭代点,即个迭代点,即)(1kkkkXftXX其中步长其中步长tk因子由因子由 来确定
8、。来确定。 )(min)(kktkkkXftXfXftXf记为记为 )(,(1kkkXfXlsX令令k=0,1,2,. ,就可以得到一个点列(初始点可任意选,就可以得到一个点列(初始点可任意选择)。当函数满足一定的条件时,择)。当函数满足一定的条件时, 该点列必收敛于函该点列必收敛于函数的极小点。数的极小点。 为书写方便,记为书写方便,记 故故 在不发生在不发生混淆时,再记混淆时,再记 )()(XfXg)()(kkXfXg)()(kkkXfXgg第五章第五章 常用无约束优化方法常用无约束优化方法迭代步骤迭代步骤 已知目标函数已知目标函数 及其梯度及其梯度,终止限,终止限 、 和和 )(Xf)(
9、Xg123(1)选定初始点)选定初始点 ,计,计算算 , ;置;置 0X)(00Xff)(00Xgg0k(2)作直线搜索:)作直线搜索: ),(1kkkgXlsX计算计算 )(11kkXff)(11kkXgg(3)用终止准则检测是否满足:)用终止准则检测是否满足:若满足,则打印最优解若满足,则打印最优解 , ,结束;否则,置结束;否则,置 ,转(,转(2) 1kX)(1kXf1 kk第五章第五章 常用无约束优化方法常用无约束优化方法将最速下降法应用于正定二次函数将最速下降法应用于正定二次函数 cXbAXXXfTT21)((5.4) 可以推出显式迭代公式可以推出显式迭代公式设第设第k次迭代点为次
10、迭代点为Xk,我们来求,我们来求Xk+1的表达式对式的表达式对式(5.4)关于)关于X求梯度,有求梯度,有 bAXXg)((5.5) 因此,因此,bAXXggkkk)((5.6) 现在从现在从Xk出发沿出发沿-gk作直线搜索以确定作直线搜索以确定Xk+1,于是,于是kkkkgtXX1(5.7) 其中其中tk是最优步长因子是最优步长因子 又因又因 0)(1kTkgXg,再结合式(再结合式(5.5)、()、(5.6)、()、(5.7)0)(kTkkkgbgtXA0kTkkkgAgtg或或可得可得 由此解出由此解出kTkkTkkAggggt 第五章第五章 常用无约束优化方法常用无约束优化方法代入式(
11、代入式(5.7)中得到)中得到kkTkkTkkkgAggggXX1(5.8) 例例5.1 试用最速下降法求函数试用最速下降法求函数 的极小的极小点迭代两次,计算各迭代点的函数值,梯度及其模,点迭代两次,计算各迭代点的函数值,梯度及其模,并验证相邻两个搜索方向是正交的设初始点并验证相邻两个搜索方向是正交的设初始点为为 2221214),(xxxxfTX 1, 1 0解解 与式(与式(5.4)比较,得)比较,得8002A梯度表达式是梯度表达式是212182),()(xxxxfXf由由 ,计算出,计算出 TX 11 0,5141)(220 xf82)(00Xfg24621. 8|0g第五章第五章 常
12、用无约束优化方法常用无约束优化方法因为目标函数是二次的,可以使用式(因为目标函数是二次的,可以使用式(5.8),所以有),所以有04616. 073846. 08213077. 0110000001gAggggXXTT计算计算,55385. 004616. 0473846. 0)(221Xf,52237. 136923. 047692. 1)(111gXfg11076. 011076. 036923. 047692. 142500. 004616. 073846. 01111112gAggggXXTT,91335. 088008. 022152. 0)(06134. 0)(2221gXfgXf
13、因为因为10210.00000.0000TTg gg g,说明相邻两个搜索方向是正交的说明相邻两个搜索方向是正交的 第五章第五章 常用无约束优化方法常用无约束优化方法有关说明有关说明 最速下降法的优点是算法简单,每最速下降法的优点是算法简单,每次迭代计算量小,占用内存量小,次迭代计算量小,占用内存量小,即使从一个不好的初始点出发,往即使从一个不好的初始点出发,往往也能收敛到局部极小点,但它有往也能收敛到局部极小点,但它有一个严重缺点就是收敛速度慢一个严重缺点就是收敛速度慢沿负梯度方向函数值下降很快的说法,容易使人们产生沿负梯度方向函数值下降很快的说法,容易使人们产生一种错觉,认为这一定是最理想
14、的搜索方向,沿该方向一种错觉,认为这一定是最理想的搜索方向,沿该方向搜索时收敛速度应该很快,然而事实证明,梯度法的收搜索时收敛速度应该很快,然而事实证明,梯度法的收敛速度并不快特别是对于等值线(面)具有狭长深谷敛速度并不快特别是对于等值线(面)具有狭长深谷形状的函数,收敛速度更慢其原因是由于每次迭代后形状的函数,收敛速度更慢其原因是由于每次迭代后下一次搜索方向总是与前一次搜索方向相互垂直,如此下一次搜索方向总是与前一次搜索方向相互垂直,如此继续下去就产生所谓的锯齿现象即从直观上看,在远继续下去就产生所谓的锯齿现象即从直观上看,在远离极小点的地方每次迭代可能使目标函数有较大的下降,离极小点的地方
15、每次迭代可能使目标函数有较大的下降,但是在接近极小点的地方,由于锯齿现象,从而导致每但是在接近极小点的地方,由于锯齿现象,从而导致每次迭代行进距离缩短,因而收敛速度不快次迭代行进距离缩短,因而收敛速度不快 第五章第五章 常用无约束优化方法常用无约束优化方法5.2 Newton法法如果目标函数在上具有连续的二阶偏导数,其如果目标函数在上具有连续的二阶偏导数,其Hesse矩矩阵正定并且可以表达成为显式(记阵正定并且可以表达成为显式(记 ,那么,那么可以使用下述的可以使用下述的Newton法这种方法一旦用好,收敛法这种方法一旦用好,收敛速度是很快的它是一维搜索速度是很快的它是一维搜索Newton切线
16、法的推广切线法的推广 )()(2XfXG基本原理基本原理为寻求收敛速度快的算法为寻求收敛速度快的算法,在应用在应用基本迭代公式中基本迭代公式中 ,每轮迭代在迭代的起始点每轮迭代在迭代的起始点 处用处用一个适当的二次函数来近似该点一个适当的二次函数来近似该点处的目标函数,由此用点处的目标函数,由此用点 指向指向近似二次函数极小点的方向来构近似二次函数极小点的方向来构造搜索方向造搜索方向 . kkkkPtXX1kXkXkP第五章第五章 常用无约束优化方法常用无约束优化方法1RRfn:设最优化问题为设最优化问题为 )(minXf其中其中 二阶可导,二阶可导,Hesse矩阵矩阵 )(2Xf正定正定 不
17、妨设经过不妨设经过 次迭代已获点次迭代已获点 ,现将,现将 在在 处处展成二阶泰勒公式,于是有展成二阶泰勒公式,于是有 kkXkXX )(Xf)()(21)()()()()(2kkTkkTkkXXXfXXXXXfXfXQXf显然显然 是二次函数,并且还是正定二次函数,所以是二次函数,并且还是正定二次函数,所以 是凸函数且存在唯一全局极小点为求此极小点,令是凸函数且存在唯一全局极小点为求此极小点,令)(XQ)(XQ0)()()(2kkkXXXfXfXQ即可解得即可解得)()(12kkkXfXfXX即即 )()(121kkkkXfXfXX(5.9) 对照基本迭代公式对照基本迭代公式,易知,式(易知
18、,式(5.9)中的搜索方向)中的搜索方向)()(12kkkXfXfP步长因子步长因子 1kt第五章第五章 常用无约束优化方法常用无约束优化方法方向方向 是直指点是直指点 处近似二次函数处近似二次函数 的极小点的方向此时称此方向为从点的极小点的方向此时称此方向为从点 出发的出发的Newton方向方向从初始点开始,每一轮从当前迭代点出发,从初始点开始,每一轮从当前迭代点出发,沿沿Newton方向并取步长方向并取步长 的算法称为的算法称为Newton法法 )()(12kkkXfXfPkX)(XQkX1kt迭代步骤迭代步骤 已知目标函数已知目标函数 及其梯度及其梯度 ,Hesse矩阵矩阵 ,终,终止限
19、止限 )(Xf)(Xg)(XG(1)选定初始点)选定初始点 ;计算;计算 ;置;置 0X)(),(0000XggXff0k(2)计算)计算 . )(2kkXfG(3)由方程)由方程 解出解出 kkkgPGkP(4)计算)计算 .,)(111kkkkkXffPXX)(11kkXgg(5)判别终止准则是否满足:若满足,则打印最优解)判别终止准则是否满足:若满足,则打印最优解 , 结束;否则,置结束;否则,置 ,转(,转(2) 1kX1kf1kk第五章第五章 常用无约束优化方法常用无约束优化方法第五章第五章 常用无约束优化方法常用无约束优化方法例例5.2 试用试用Newton法求法求 的极小点,初的
20、极小点,初始点取为始点取为 2221214)(xxxxf,TX 1, 1 0解解 梯度为梯度为 TxxXfXg82)()(21,Hesse矩阵为矩阵为8002)(XG其逆矩阵为其逆矩阵为125. 0005 . 0)(1XG由迭代公式(由迭代公式(5.9)得第)得第1 迭代点为迭代点为11000()()10.502000.125180XXG Xg X 由此由此 ,停止迭代得,停止迭代得 61100|)(|XfTXX001*,第五章第五章 常用无约束优化方法常用无约束优化方法对于目标函数是非二次函数的非约束最优化问题,一般对于目标函数是非二次函数的非约束最优化问题,一般来说,用来说,用Newton
21、法通过有限轮迭代法通过有限轮迭代并不能并不能保证可求得保证可求得最优解但由于目标函数在最优解附近能近似于二次函最优解但由于目标函数在最优解附近能近似于二次函数,因此当先取接近于最优解的初始点使用数,因此当先取接近于最优解的初始点使用Newton法法求解时,其收敛速度一般是较快的求解时,其收敛速度一般是较快的从例从例5.2我们看到,用我们看到,用Newton法求解,只经一轮迭代就法求解,只经一轮迭代就得到最优解这一结果并不是偶然的,因为从得到最优解这一结果并不是偶然的,因为从Newton方向的构造我们知道,对于正定二次函数,方向的构造我们知道,对于正定二次函数,Newon方方向就是指向其极小点的
22、方向因此,用向就是指向其极小点的方向因此,用Newton法解目法解目标函数为标函数为正定二次正定二次函数的函数的无约束无约束最优化问题,只需一最优化问题,只需一次迭代就可得最优解次迭代就可得最优解 事实上,可以证明在初始点离最优解不远的条件下,事实上,可以证明在初始点离最优解不远的条件下,Newton法是二次收敛的但是当初始点选得离最优解法是二次收敛的但是当初始点选得离最优解太远时,太远时,Newton法并不一定是收敛的方法,甚至连其法并不一定是收敛的方法,甚至连其下降性也很难保证下降性也很难保证第五章第五章 常用无约束优化方法常用无约束优化方法有关说明有关说明 Newton法收敛速度非常快具
23、有二次收敛的优点,但它存法收敛速度非常快具有二次收敛的优点,但它存在下面四个严重的缺点:在下面四个严重的缺点:(1)尽管每次迭代不会使目标函数上升,但仍不能保)尽管每次迭代不会使目标函数上升,但仍不能保证下降当证下降当Hesse矩阵非正定时,矩阵非正定时,Newton法的搜索将会法的搜索将会失败失败 (2)对初始点要求严格一般要求比较接近或有利于)对初始点要求严格一般要求比较接近或有利于接近极值点,而这在实际计算中是比较难办的接近极值点,而这在实际计算中是比较难办的 (3)在进行某次迭代时可能求不出搜索方向由于搜)在进行某次迭代时可能求不出搜索方向由于搜索方向为索方向为 ,若目标函数在若目标函
24、数在 点点Hesse矩阵是奇异的,则矩阵是奇异的,则 不存在,因而不能不存在,因而不能构成构成newton方向,从而使迭代无法进行方向,从而使迭代无法进行)()(12kkkXfXfPkX12)(kXf(4)newton方向构造困难,计算相当复杂,除了求梯方向构造困难,计算相当复杂,除了求梯度以外还需计算度以外还需计算Hesse矩阵及其逆矩阵,占用机器内存矩阵及其逆矩阵,占用机器内存相当大相当大 第五章第五章 常用无约束优化方法常用无约束优化方法5.3 拟拟Newton法法基本原理基本原理为了克服为了克服Newton法的缺点,人们保留选取法的缺点,人们保留选取Newton方向作方向作为搜索方向,
25、摒弃其步长恒取为搜索方向,摒弃其步长恒取1,而用一维搜索确定最优,而用一维搜索确定最优步长,由此产生的算法称为步长,由此产生的算法称为修正修正Newton法法(或(或阻力阻力Newton法法)迭代步骤迭代步骤 已知目标函数已知目标函数 及其梯度及其梯度 ,Hesse矩阵矩阵 ,终,终止限止限 )(Xf)(Xg)(XG(1)选取初始点)选取初始点 ,令,令 0X0k(2)计算)计算 若若 ,停止迭代输出,停止迭代输出,否则转(否则转(3) )()(kkXfXg|)(|kXf(3)构造)构造Newton方向计算方向计算 ,取,取121)()(kkXfXG)()(12kkkXfXfP(4)进行一维搜
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 无约束 优化 方法 ppt 课件
限制150内