第四章-常用无约束最优化方法ppt课件.ppt
《第四章-常用无约束最优化方法ppt课件.ppt》由会员分享,可在线阅读,更多相关《第四章-常用无约束最优化方法ppt课件.ppt(119页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Company Logo4.74.74.64.64.54.54.44.44.34.3修正修正NewtonNewton法法共轭方向法共轭方向法共轭梯度法共轭梯度法变尺度法变尺度法坐标轮换法坐标轮换法第四章第四章 常用无约束最优化方法常用无约束最优化方法4.24.24.14.14.84.8最速下降法最速下降法Newton Newton 法法单纯形法单纯形法Company Logo成立点成立点 就是问题(就是问题(4.14.1)的全局最优点但是,大多数)的全局最优点但是,大多数最优化方法只能求到局部最优点,即在最优化方法只能求到局部最优点,即在 中找到一点中找到一点 ,使得式(使得式(4.2)4.2
2、)在在 的某个领域中成立的某个领域中成立第四章第四章 常用无约束最优化法常用无约束最优化法 本章开始讨论多维无约束最优化问题本章开始讨论多维无约束最优化问题 (4.14.1)其中其中 这个问题的求解是指,在这个问题的求解是指,在 中找一中找一点点 ,使得对于任意的,使得对于任意的 都有都有 (4.24.2))(minXf1RRfn:nR*XnRX )()(*XfXf*XnR*X*XCompany Logo 这个矛盾对于实际问题来讲一般容易解决,因为根据问题这个矛盾对于实际问题来讲一般容易解决,因为根据问题的实际意义多半可以直接判定用优化方法求出的局部最优解的实际意义多半可以直接判定用优化方法求
3、出的局部最优解是否为全局最优解但在理论上这是个比较复杂的问题,本是否为全局最优解但在理论上这是个比较复杂的问题,本书不涉及书不涉及 无约束优化方法是优化技术中极为重要和基本的内容之无约束优化方法是优化技术中极为重要和基本的内容之一它不仅可以直接用来求解无约束优化问题,而且很多约一它不仅可以直接用来求解无约束优化问题,而且很多约束优化问题也常将其转化为无约束优化问题,然后用无约束束优化问题也常将其转化为无约束优化问题,然后用无约束优化方法来求解另外,有些无约束优化方法只需略加处理,优化方法来求解另外,有些无约束优化方法只需略加处理,即可用于求解约束优化问题即可用于求解约束优化问题Company
4、Logo 无约束优化理论发展较早,比较成熟,方法也很多,新的无约束优化理论发展较早,比较成熟,方法也很多,新的方法还在陆续出现把这些方法归纳起来可以分成两大类:方法还在陆续出现把这些方法归纳起来可以分成两大类:一类是仅用一类是仅用计算函数值所得到的信息来确定搜索方向计算函数值所得到的信息来确定搜索方向,通常,通常称它为称它为直接搜索法直接搜索法,简称为,简称为直接法直接法,另一类需要,另一类需要计算函数的计算函数的一阶或二阶导数值所得到的信息来确定搜索方向一阶或二阶导数值所得到的信息来确定搜索方向,这一类方,这一类方法称为法称为间接法(或解析法间接法(或解析法)直接法不涉及)直接法不涉及导数和
5、导数和HesseHesse矩阵矩阵,适应性强,但收敛速度一般较慢;间接法收敛速度一般较快,适应性强,但收敛速度一般较慢;间接法收敛速度一般较快,但需计算梯度,甚至需要计算但需计算梯度,甚至需要计算HesseHesse矩阵一般的经验是,在矩阵一般的经验是,在可能求得目标函数导数的情况下还是尽可能使用间接方法;可能求得目标函数导数的情况下还是尽可能使用间接方法;相反,在不可能求得目标函数的导数或根本不存在导数的情相反,在不可能求得目标函数的导数或根本不存在导数的情况下,当然就应该使用直接法况下,当然就应该使用直接法Company Logo 一、最速下降法基本原理一、最速下降法基本原理 在基本迭代公
6、式在基本迭代公式 中,每次迭代搜索中,每次迭代搜索 方向取为目标函数方向取为目标函数 的负梯度方向,即的负梯度方向,即 ,而每次迭代的步长而每次迭代的步长 取为最优步长,由此所确定的算法取为最优步长,由此所确定的算法称为最速下降法称为最速下降法 对于问题(对于问题(4.14.1)为了求其最优解,按最优化算法的基)为了求其最优解,按最优化算法的基本思想是从一个给定的初始点本思想是从一个给定的初始点 出发,通过基本迭代公出发,通过基本迭代公式式 ,按照特定的算法产生一串,按照特定的算法产生一串点列点列 ,如果点列收敛,则该点列的极限点为问题,如果点列收敛,则该点列的极限点为问题(4.14.1)的最
7、优解)的最优解4.1 4.1 最速下降法最速下降法0XkkkkPtXX1kXkkkkPtXX1kP)(Xf)(kkXfPktCompany Logo 为了求解问题(为了求解问题(4.14.1),如图),如图4.14.1所示,假定我们已经迭所示,假定我们已经迭代了代了 次,获得了第次,获得了第 个迭代点个迭代点 现在从现在从 出发,可出发,可选择的下降方向很多,一个非常自然的想法是沿最速下降方选择的下降方向很多,一个非常自然的想法是沿最速下降方向(即负梯度方向)进行搜索应该是有利的,至少在向(即负梯度方向)进行搜索应该是有利的,至少在 邻邻近的范围内是这样因此,取搜索方向为近的范围内是这样因此,
8、取搜索方向为 kkkXkXkX)(kkXfP图图4.14.1Company Logo 为了使目标函数在搜索方向上获得最多的下降,沿为了使目标函数在搜索方向上获得最多的下降,沿 进行进行一维搜索,由此得到第一维搜索,由此得到第 个迭代点个迭代点 ,即,即 , 其中步长因子其中步长因子 按下式确定按下式确定 ,也可记为也可记为 (4.34.3) 显然,令显然,令 就可以得到一个点列就可以得到一个点列 ,其中其中 是初始点,由计算者任意选定当是初始点,由计算者任意选定当 满足一定的条满足一定的条件时,由式(件时,由式(4.34.3)所产生的点列)所产生的点列 必收敛于必收敛于 的极小的极小点点 kP
9、1k1kX)(1kkkkXftXXkt)(min)(kktkkkXftXfXftXf)(,(1kkkXfXlsX, 2, 1, 0k210,XXX0X)(XfkX)(Xf*XCompany Logo 以后为书写方便,记以后为书写方便,记 因因此,此, 在不发生混淆时,在不发生混淆时,再记再记 )()(XfXg)()(kkXfXg)()(kkkXfXggCompany Logo 已知目标函数已知目标函数 及其梯度及其梯度 ,终止限,终止限 、 和和 (1 1)选定初始点)选定初始点 ,计算,计算 , ; 置置 (2 2)作直线搜索:)作直线搜索: ;计算;计算 , (3 3)用终止准则检测是否满
10、足:若满足,则打印最优)用终止准则检测是否满足:若满足,则打印最优解解 , ,结束;否则,置,结束;否则,置 ,转,转(2 2)最速下降法算法流程如图最速下降法算法流程如图4.24.2所示所示 二、最速下降法迭代步骤二、最速下降法迭代步骤)(Xf)(Xg1230X)(00Xff)(00Xgg 0k),(1kkkgXlsX)(11kkXff)(11kkXgg1kX)(1kXf1kk,Company Logo开始结束选定X0YX , fH准则满足)()(0000XggXff),(00gXlsX)()(XggXffggffXX000最速下降法算最速下降法算法流程如图所法流程如图所示示图图4.24.2
11、Company Logo 设第设第 次迭代点为次迭代点为 ,我们来求,我们来求 的表达式对式的表达式对式(4.4)(4.4)关于求关于求 梯度,有梯度,有 ,(4.5)(4.5)因此,因此, (4.6)(4.6)现在从现在从 出发沿出发沿 作直线搜索以确定作直线搜索以确定 ,于是,于是 , (4.7)(4.7)其中其中 是最优步长因子是最优步长因子 将最速下降法应用于正定二次函数将最速下降法应用于正定二次函数 (4.44.4)可以推出显式迭代公式可以推出显式迭代公式cXbAXXXfTT21)(kkX1kXXbAXXg)(bAXXggkkk)(kXkg1kXkkkkgtXX1ktCompany
12、Logo 又因式(又因式(4.24.2),有),有 ,再利用式,再利用式(4.54.5),式(),式(4.64.6)和式()和式(4.74.7)可得)可得或或 由此解出由此解出 ,代入式(代入式(4.74.7)中得到)中得到 . .(4.84.8)这就是最速下降法用于二次函数的显式迭代公式这就是最速下降法用于二次函数的显式迭代公式0)(1kTkgXg0)(kTkkkgbgtXA0kTkkkgAgtgkTkkTkkAggggtkkTkkTkkkgAggggXX1Company Logo例例4.1 试用最速下降法求函数试用最速下降法求函数 的极小点迭代两次,计算各迭代点的函数值,梯度及的极小点迭代
13、两次,计算各迭代点的函数值,梯度及其模,并验证相邻两个搜索方向是正交的设初始点其模,并验证相邻两个搜索方向是正交的设初始点为为 2221214),(xxxxfTX 1, 1 0Company Logo解解 与式(与式(4.44.4)比较,得)比较,得 ,梯度表达式是梯度表达式是 ,由由 ,计算出,计算出 , , 因为目标函数是二次的,可以使用式(因为目标函数是二次的,可以使用式(4.84.8),所以有),所以有 ,8002A212182),()(xxxxfXfTX 11 0,5141)(220 xf82)(00Xfg24621. 8|0g04616. 073846. 08213077. 011
14、0000001gAggggXXTTCompany Logo计算计算 因为因为 由此说明相邻两个搜索方向由此说明相邻两个搜索方向 与、与、 , 与与 是正交的是正交的,55385. 004616. 0473846. 0)(221Xf,52237. 136923. 047692. 1)(111gXfg11076. 011076. 036923. 047692. 142500. 004616. 073846. 01111112gAggggXXTT,91335. 088008. 022152. 0)(06134. 0)(2221gXfgXf10210.00000.0000TTgggg,11gP00gP
15、22gP11gPCompany Logo三、最速下降法有关说明三、最速下降法有关说明 最速下降法的优点是算法简单,每次迭代计算量小,占用内最速下降法的优点是算法简单,每次迭代计算量小,占用内存量小,即使从一个不好的初始点出发,往往也能收敛到局部极存量小,即使从一个不好的初始点出发,往往也能收敛到局部极小点,但它有一个严重缺点就是收敛速度慢小点,但它有一个严重缺点就是收敛速度慢 图图4.34.3沿负梯度方向函数值下降很快的说法,容易使人们产生沿负梯度方向函数值下降很快的说法,容易使人们产生一种错觉,认为这一定是最理想的搜索方向,沿该方向搜索时收一种错觉,认为这一定是最理想的搜索方向,沿该方向搜索
16、时收敛速度应该很快,然而事实证明,梯度法的收敛速度并不快特敛速度应该很快,然而事实证明,梯度法的收敛速度并不快特别是对于等值线(面)具有狭长深谷形状的函数,收敛速度更别是对于等值线(面)具有狭长深谷形状的函数,收敛速度更慢慢Company Logo其原因是由于每次迭代后下一次搜索方向总是与其原因是由于每次迭代后下一次搜索方向总是与前一次搜索方向相互垂直,如此继续下去就产前一次搜索方向相互垂直,如此继续下去就产生所谓的锯齿现象(如图生所谓的锯齿现象(如图4.34.3所示)即从直所示)即从直观上看,在远离极小点的地方每次迭代可能使观上看,在远离极小点的地方每次迭代可能使目标函数有较大的下降,但是在
17、接近极小点的目标函数有较大的下降,但是在接近极小点的地方,由于锯齿现象,从而导致每次迭代行进地方,由于锯齿现象,从而导致每次迭代行进距离缩短,因而收敛速度不快距离缩短,因而收敛速度不快图图4.34.3Company Logo4.2 Newton4.2 Newton法法 如果目标函数如果目标函数 在在 上具有连续的二阶偏导数,上具有连续的二阶偏导数,其其HesseHesse矩阵矩阵 正定并且可以表达成为显式(今后为正定并且可以表达成为显式(今后为了简便起见,记了简便起见,记 ,那么可以使用下述,那么可以使用下述的的NewtonNewton法这种方法一旦好用,收敛速度是很快法这种方法一旦好用,收敛
18、速度是很快的它是一维搜索的它是一维搜索NewtonNewton切线法的推广切线法的推广)(XfnR)(XG)()(2XfXG图图4.44.4Company Logo 下面具体讨论下面具体讨论NewtonNewton法法 设最优化问题为设最优化问题为 ,其中,其中 二阶可导,二阶可导,HesseHesse矩阵矩阵 正定正定不妨设经过不妨设经过 次迭代已获点次迭代已获点 ,现将,现将 在在 处展成处展成二阶泰勒公式,于是有二阶泰勒公式,于是有 一、一、NewtonNewton法基本原理法基本原理 为寻求收敛速度快的算法,我们考虑在应用基本迭代公式为寻求收敛速度快的算法,我们考虑在应用基本迭代公式
19、中,每轮迭代在迭代的起始点中,每轮迭代在迭代的起始点 处用一个适当的二次函数来近似处用一个适当的二次函数来近似该点处的目标函数,由此用点该点处的目标函数,由此用点 指向近似二次函数极小点的方向指向近似二次函数极小点的方向来构造搜索方向来构造搜索方向 (如图(如图4.44.4所示)所示)kkkkPtXX1kXkXkP)(minXf1RRfn:)(2XfkkX)(XfkXX Company Logo 显然显然 是二次函数,特别由假设知是二次函数,特别由假设知 还是正定二次函还是正定二次函数,所以数,所以 是凸函数且存在唯一全局极小点为求此极小点,是凸函数且存在唯一全局极小点为求此极小点,令令即可解
20、得即可解得 ,亦即亦即 .)()(21)()()()()(2kkTkkTkkXXXfXXXXXfXfXQXf)(XQ)(XQ)(XQ0)()()(2kkkXXXfXfXQ)()(12kkkXfXfXX,)()(121kkkkXfXfXX(4.9)Company Logo对照基本迭代公式对照基本迭代公式易知,式(易知,式(4.94.9)中的搜索方向)中的搜索方向 ,步长因子步长因子 换句话说从点换句话说从点 出发沿搜索方向出发沿搜索方向并取步长并取步长 即可得即可得 的极小点的极小点 因此,因此,是直指点是直指点 处近似二次函数处近似二次函数 的极小点的方向的极小点的方向kkkkPtXX1)()
21、(12kkkXfXfP1ktkX)()(12kkkXfXfP1kt)(XQ1kX)()(12kkkXfXfPkX)(XQCompany Logo此时称此时称为从点为从点 出发的出发的NewtonNewton方向从初始点开始,每一轮方向从初始点开始,每一轮从当前迭代点出发,沿从当前迭代点出发,沿NewtonNewton方向并取步长方向并取步长 的的算法称为算法称为NewtonNewton法法)()(12kkkXfXfPkX1ktCompany Logo二、二、NewtonNewton法迭代步骤法迭代步骤已知目标函数已知目标函数 及其梯度及其梯度 ,HesseHesse矩阵矩阵 ,终止限终止限 (
22、1 1)选定初始点)选定初始点 ;计算;计算 ;置置 (2 2)计算)计算 (3 3)由方程)由方程 解出解出 (4 4)计算)计算 (5 5)判别终止准则是否满足:若满足,则打印最优)判别终止准则是否满足:若满足,则打印最优解解 , 结束;否则,置结束;否则,置 ,转(,转(2 2) NewtonNewton法的流程如图法的流程如图4.54.5所示所示)(Xf)(Xg)(XG0X)(),(0000XggXff0k)(2kkXfGkkkgPGkP,)(111kkkkkXffPXX)(11kkXgg1kX1kf1kkCompany Logo开始结束选定X0N求解方程H准则满足X , f)()(0
23、000XggXff)(0XGG 0gGP)()(0XggXffPXXggffXX000NewtonNewton法的流法的流程如图所示程如图所示图图4.54.5Company Logo解解 梯度为梯度为 ,HesseHesse矩阵为矩阵为 ,其逆矩阵为其逆矩阵为 由迭代公式(由迭代公式(4.134.13)得第)得第1 1 迭代点为迭代点为由于此时由于此时 ,停止迭代得,停止迭代得 ,因此,它就是极小点因此,它就是极小点 例例4.2 4.2 试用试用NewtonNewton法求法求 的的极小点,初始点取为极小点,初始点取为 2221214)(xxxxf,TX 1, 1 0TxxXfXg82)()(
24、21,8002)(XG125. 0005 . 0)(1XG11000()()10.502000.125180XXG Xg X 61100|)(|XfTXX 00 1*,Company Logou从上述例从上述例4.24.2我们看到,用我们看到,用NewtonNewton法求解,只经一轮迭法求解,只经一轮迭代就得到最优解代就得到最优解u这一结果并不是偶然的,因为从这一结果并不是偶然的,因为从NewtonNewton方向的构造我方向的构造我们知道,对于正定二次函数,们知道,对于正定二次函数,NewonNewon方向就是指向其极方向就是指向其极小点的方向小点的方向u因此,用因此,用NewtonNew
25、ton法解目标函数为正定二次函数的无约法解目标函数为正定二次函数的无约束最优化问题,只需一次迭代就可得最优解束最优化问题,只需一次迭代就可得最优解Company Logou 对于目标函数是非二次函数的非约束最优化问题,一般地说,对于目标函数是非二次函数的非约束最优化问题,一般地说,用用NewtonNewton法通过有限轮迭代并不能保证可求得最优解但由于法通过有限轮迭代并不能保证可求得最优解但由于目标函数在最优解附近能近似于二次函数,因此当先取接近于目标函数在最优解附近能近似于二次函数,因此当先取接近于最优解的初始点使用最优解的初始点使用NewtonNewton法求解时,其收敛速度一般是快法求解
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 常用 无约束 优化 方法 ppt 课件
限制150内