无约束优化方法(白版).ppt
《无约束优化方法(白版).ppt》由会员分享,可在线阅读,更多相关《无约束优化方法(白版).ppt(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 无约束优化方法无约束优化方法 4-1 4-1 最速下降法(梯度法)最速下降法(梯度法)4-2 4-2 牛顿类方法牛顿类方法4-3 4-3 变尺度法变尺度法4-4 4-4 共轭方向法共轭方向法4-5 4-5 鲍威尔方法鲍威尔方法4-6 4-6 其它方法(如坐标轮换法、单纯形法)其它方法(如坐标轮换法、单纯形法)第第1章章所所列列举举的的机机械械优优化化设设计计问问题题,都都是是在在一一定定的的限限制制条条件件下下追追求求某某一一指指标标为为最最小小,它它们们都都属属于于约约束束优优化化问题。工程问题大都如此。问题。工程问题大都如此。为什么要研究无约束优化问题为什么要研究无约束优化问
2、题为什么要研究无约束优化问题为什么要研究无约束优化问题?(1)有有些些实实际际问问题题,其其数数学学模模型型本本身身就就是是一一个个无无约约束束优化问题。优化问题。(2)通通过过熟熟悉悉它它的的解解法法可可以以为为研研究究约约束束优优化化问问题题打打下下良好的基础。良好的基础。(3)约约束束优优化化问问题题的的求求解解可可以以通通过过一一系系列列无无约约束束优优化化方方法法来来达达到到。所所以以无无约约束束优优化化问问题题的的解解法法是是优优化化设设计计方法的基本组成部分,也是优化方法的基础。方法的基本组成部分,也是优化方法的基础。(4)对对于于多多维维无无约约束束问问题题来来说说,古古典典极
3、极值值理理论论中中令令一一阶阶导导数数为为零零,但但要要求求二二阶阶可可微微,且且要要判判断断海海赛赛矩矩阵阵为为正正定定才才能能求求得得极极小小点点,这这种种方方法法有有理理论论意意义义,但但无无实实用用价价值值。和和一一维维问问题题一一样样,若若多多元元函函数数F(X)不不可可微微,亦亦无无法法求求解解。但但古古典典极极值值理理论论是是无无约约束束优优化方法发展的基础。化方法发展的基础。目前已研究出很多种无约束优化方法,它们的目前已研究出很多种无约束优化方法,它们的主要不同点在于主要不同点在于构造搜索方向构造搜索方向上的差别。上的差别。(1)间接法)间接法要使用导数,如梯度法、(阻尼)要使
4、用导数,如梯度法、(阻尼)牛顿法、变尺度法、共轭梯度法等。牛顿法、变尺度法、共轭梯度法等。(2)直接法)直接法不使用导数信息,如坐标轮换法、不使用导数信息,如坐标轮换法、鲍威尔法单纯形法等。鲍威尔法单纯形法等。无约束优化问题是:无约束优化问题是:求求n维设计变量维设计变量使目标函数使目标函数 搜索方向的构成问题乃是无约束优化方法的关键。搜索方向的构成问题乃是无约束优化方法的关键。用直接法寻找极小点时,不必求函数的导数,只要计用直接法寻找极小点时,不必求函数的导数,只要计算目标函数值。这类方法较适用于解决变量个数较少的算目标函数值。这类方法较适用于解决变量个数较少的(n20)问题,一般情况下比间
5、接法效率低。间接法除)问题,一般情况下比间接法效率低。间接法除要计算目标函数值外,还要计算目标函数的梯度,有的要计算目标函数值外,还要计算目标函数的梯度,有的还要计算其海赛矩阵。还要计算其海赛矩阵。4-1 4-1 梯度法梯度法 基本思想基本思想:函数的负梯度方向是函数值在该点:函数的负梯度方向是函数值在该点下降最快的方向。将下降最快的方向。将n n维问题转化为一系列沿负梯度维问题转化为一系列沿负梯度方向用一维搜索方法寻优的问题,利用负梯度作为方向用一维搜索方法寻优的问题,利用负梯度作为搜索方向,故称最速下降法或梯度法。搜索方向,故称最速下降法或梯度法。搜索方向搜索方向s取该点的负梯度方向取该点
6、的负梯度方向(最速下降方最速下降方向向),使函数值在该点附近的范围内下降最快,使函数值在该点附近的范围内下降最快。为为了了使使目目标标函函数数值值沿沿搜搜索索方方向向 能能够够获获得得最最大大的的下下降降值值,其其步步长长因因子子 应应取取一一维维搜搜索索的的最最佳佳步长。即有步长。即有根据一元函数极值的必要条件和多元复合根据一元函数极值的必要条件和多元复合函数求导公式,得函数求导公式,得 在最速下降法中,在最速下降法中,相邻两个迭代点上的函相邻两个迭代点上的函数梯度相互垂直。而搜数梯度相互垂直。而搜索方向就是负梯度方向,索方向就是负梯度方向,因此相邻两个搜索方向因此相邻两个搜索方向互相垂直。
7、这就是说在互相垂直。这就是说在迭代点向函数极小点靠迭代点向函数极小点靠近的过程,走的是曲折近的过程,走的是曲折的路线。形成的路线。形成“之之”字字形的锯齿现象,而且越形的锯齿现象,而且越接近极小点锯齿越细。接近极小点锯齿越细。图图4-2最速下降法的搜索路径最速下降法的搜索路径方法特点方法特点(1 1)初始点可任选,每次迭代计算量小,存储)初始点可任选,每次迭代计算量小,存储量少,程序简短。即使从一个不好的初始点出量少,程序简短。即使从一个不好的初始点出发,开始的几步迭代,目标函数值下降很快,发,开始的几步迭代,目标函数值下降很快,然后慢慢逼近局部极小点。然后慢慢逼近局部极小点。(2 2)任意相
8、邻两点的搜索方向是正交的,它的)任意相邻两点的搜索方向是正交的,它的迭代路径为绕道逼近极小点。当迭代点接近极迭代路径为绕道逼近极小点。当迭代点接近极小点时,步长变得很小,越走越慢。小点时,步长变得很小,越走越慢。沿负梯度方向进行一维搜索,有沿负梯度方向进行一维搜索,有为一维搜索最佳步长,应满足极值必要条件为一维搜索最佳步长,应满足极值必要条件例例4 41 1 求目标函数求目标函数 的极小点。的极小点。解解 取初始点取初始点则初始点处函数值及梯度分别为则初始点处函数值及梯度分别为算出一维搜索最佳步长算出一维搜索最佳步长第一次迭代设计点位置和函数值第一次迭代设计点位置和函数值继续作下去,经继续作下
9、去,经1010次迭代后,得到最优解次迭代后,得到最优解 这个问题的目标函数的等值线为一簇椭圆这个问题的目标函数的等值线为一簇椭圆,迭代点从迭代点从走的是一段锯齿形路线,见下图。走的是一段锯齿形路线,见下图。将上例中目标函数将上例中目标函数引入变换引入变换其等值线由椭圆变成一簇同心圆。其等值线由椭圆变成一簇同心圆。仍从仍从即即出发进行最速下降法出发进行最速下降法寻优。此时:寻优。此时:沿负梯度方向进行一维搜索:沿负梯度方向进行一维搜索:则函数则函数f(f(X X)变为:变为:y1=x1,y2=5x2为一维搜索最佳步长,可由极值条件:为一维搜索最佳步长,可由极值条件:由由从而算得一步计算后设计点的
10、位置及其目标函数:从而算得一步计算后设计点的位置及其目标函数:经变换后,只需一次迭代,就可找到最优解。经变换后,只需一次迭代,就可找到最优解。这是因为经过尺度变换:这是因为经过尺度变换:等值线由椭圆变成圆。等值线由椭圆变成圆。梯度法的特点梯度法的特点l(1)理论明确,程序简单,对初始点要求不严格。)理论明确,程序简单,对初始点要求不严格。l(2)对一般函数而言,梯度法的收敛速度并不快,因)对一般函数而言,梯度法的收敛速度并不快,因为最速下降方向仅仅是指某点的一个局部性质。为最速下降方向仅仅是指某点的一个局部性质。l(3)梯度法相邻两次搜索方向的正交性,决定了迭代)梯度法相邻两次搜索方向的正交性
11、,决定了迭代全过程的搜索路线呈全过程的搜索路线呈锯齿锯齿状,在远离极小点时逼近速度状,在远离极小点时逼近速度较快,而在接近极小点时逼近速度较慢。较快,而在接近极小点时逼近速度较慢。l(4)梯度法的收敛速度与目标函数的性质密切相关。)梯度法的收敛速度与目标函数的性质密切相关。对于等值线对于等值线(面面)为同心圆(球)的目标函数,一次搜索为同心圆(球)的目标函数,一次搜索即可达到极小点。即可达到极小点。4-2 -2 牛顿法及其改进牛顿法及其改进设设 为为 的极小点的极小点基本思想基本思想基本思想基本思想:在在在在x xk k邻邻邻邻域内用一个二次函数域内用一个二次函数域内用一个二次函数域内用一个二
12、次函数来近似代替原目来近似代替原目来近似代替原目来近似代替原目标标标标函数,并将函数,并将函数,并将函数,并将的极小点作的极小点作的极小点作的极小点作为对为对为对为对目目目目标标标标函数函数函数函数求求求求优优优优的下一个迭代点的下一个迭代点的下一个迭代点的下一个迭代点。经经经经多次迭代,使之逼近目多次迭代,使之逼近目多次迭代,使之逼近目多次迭代,使之逼近目标标标标函数函数函数函数的极小点。的极小点。的极小点。的极小点。牛牛牛牛顿顿顿顿法是求函数极法是求函数极法是求函数极法是求函数极值值值值的最古老算法之一。的最古老算法之一。的最古老算法之一。的最古老算法之一。这就是多元函数求极值的牛顿法迭代
13、公式。这就是多元函数求极值的牛顿法迭代公式。对于二次函数对于二次函数,海赛矩阵海赛矩阵H H是一个常矩阵,其中是一个常矩阵,其中各元素均为常数。因此,无论从任何点出发,只各元素均为常数。因此,无论从任何点出发,只需一步就可找到极小点。需一步就可找到极小点。例例4 42 2 求目标函数求目标函数 的极小点。的极小点。解解 取初始点取初始点 从牛顿法迭代公式的推演中可以看到,迭代点从牛顿法迭代公式的推演中可以看到,迭代点的位置是按照极值条件确定的,其中并未含有沿下的位置是按照极值条件确定的,其中并未含有沿下降方向搜寻的概念。因此对于非二次函数,如果采降方向搜寻的概念。因此对于非二次函数,如果采用上
14、述牛顿迭代公式,有时会使函数值上升用上述牛顿迭代公式,有时会使函数值上升。阻尼牛顿法阻尼牛顿法阻尼因子阻尼因子,沿牛顿方向进行一维搜索的最佳沿牛顿方向进行一维搜索的最佳步长,由下式求得:步长,由下式求得:经过一次迭代即求得极小点经过一次迭代即求得极小点函数极小值函数极小值阻尼牛顿法程序框图方法特点方法特点(1)初始点应选在初始点应选在X*附近,有一定难度;附近,有一定难度;(2)尽管每次迭代都不会是函数值上升,但不能保证尽管每次迭代都不会是函数值上升,但不能保证每次下降每次下降;(3)若迭代点的海赛矩阵为奇异,则无法求逆矩阵,若迭代点的海赛矩阵为奇异,则无法求逆矩阵,不能构造牛顿法方向;不能构
15、造牛顿法方向;(4)不仅要计算梯度,还要求海赛矩阵及其逆矩阵,不仅要计算梯度,还要求海赛矩阵及其逆矩阵,计算量和存储量大。此外,对于二阶不可微的计算量和存储量大。此外,对于二阶不可微的F(X)也也不适用。不适用。虽然阻尼牛顿法有上述缺点,但在特定条件下它虽然阻尼牛顿法有上述缺点,但在特定条件下它具有收敛最快的优点,并为其他的算法提供了思路和具有收敛最快的优点,并为其他的算法提供了思路和理论依据。理论依据。一般迭代式:一般迭代式:梯度法:梯度法:牛顿法:牛顿法:阻尼牛顿法:阻尼牛顿法:梯度法与牛顿法:梯度法与牛顿法:4-3 变尺度法变尺度法DFP变尺度法首先有戴维顿(变尺度法首先有戴维顿(Dav
16、idon)与)与1959年提出,又于年提出,又于1963年由弗莱彻(年由弗莱彻(Fletcher)和鲍维尔加)和鲍维尔加以发展和完善,成为现代公认的较好的算法之一。以发展和完善,成为现代公认的较好的算法之一。DFP法是基于牛顿法的思想又作了重要改进。这法是基于牛顿法的思想又作了重要改进。这种算法仅用到梯度,不必计算海赛阵及其逆矩阵,但又种算法仅用到梯度,不必计算海赛阵及其逆矩阵,但又能使搜索方向逐渐逼近牛顿方向,具有较快的收敛速度。能使搜索方向逐渐逼近牛顿方向,具有较快的收敛速度。1.基本思想基本思想2.变量的尺度变换是放大或缩小各个坐标。通过变量的尺度变换是放大或缩小各个坐标。通过尺尺3.度
17、变换可以把函数的偏心程度降到最低限度。度变换可以把函数的偏心程度降到最低限度。例如在用最速下降法求例如在用最速下降法求的极小的极小值时值时,需要需要进进行行10次迭代才能达到极小点次迭代才能达到极小点如作变换如作变换y1=x1,y2=5x2把把的尺度放大的尺度放大5倍,则目标函数等值线由一簇倍,则目标函数等值线由一簇椭圆变成一簇同心圆。椭圆变成一簇同心圆。x2消除了函数的偏心,用最速下降法只需一次迭消除了函数的偏心,用最速下降法只需一次迭代即可求得极小点。代即可求得极小点。梯度法构造简单,只用到一阶偏导数,计算量小,梯度法构造简单,只用到一阶偏导数,计算量小,初始点可任选,且开始几次迭代,目标
18、函数值下降很初始点可任选,且开始几次迭代,目标函数值下降很快;其主要缺点是迭代点接近快;其主要缺点是迭代点接近X*时,即使对二次正定时,即使对二次正定函数收敛也非常慢。函数收敛也非常慢。牛顿法收敛很快,对于二次函数只需迭代一次便牛顿法收敛很快,对于二次函数只需迭代一次便达到最优点,对非二次函数也能较快迭代到最优点,达到最优点,对非二次函数也能较快迭代到最优点,但要计算二阶偏导数矩阵及其逆阵,对维数较高的优但要计算二阶偏导数矩阵及其逆阵,对维数较高的优化问题,其计算工作和存储量都太大。化问题,其计算工作和存储量都太大。能不能将两种算法的优点综合起来,扬长避短?能不能将两种算法的优点综合起来,扬长
19、避短?Ak是需要构造是需要构造nn的一个对称方阵的一个对称方阵,如如Ak=I,则得到梯度法则得到梯度法;则得到阻尼牛顿法则得到阻尼牛顿法;如如当矩阵当矩阵Ak不断地迭代而能很好地逼近不断地迭代而能很好地逼近时,就可以不再需要计算二阶导数。时,就可以不再需要计算二阶导数。变尺度法的关键在于尺度矩阵变尺度法的关键在于尺度矩阵Ak的产生的产生。对于二次函数对于二次函数:进行尺度变换进行尺度变换在新的坐标系中,函数在新的坐标系中,函数f(x)的二次项变为:的二次项变为:目的:减少二次项的偏心目的:减少二次项的偏心如如G是正定,则总存在矩阵是正定,则总存在矩阵Q,使得:,使得:用矩阵用矩阵Q-1右乘等式
20、两边,得:右乘等式两边,得:用矩阵用矩阵Q左乘等式两边,得:左乘等式两边,得:所以所以上式说明:二次函数矩阵上式说明:二次函数矩阵G的逆阵,可以通过尺度变换的逆阵,可以通过尺度变换矩阵矩阵Q来求得。来求得。牛顿迭代公式:牛顿迭代公式:记:记:搜索方向:搜索方向:迭代公式:迭代公式:A A 称为变尺度矩阵称为变尺度矩阵在例在例42中中如取如取求得:求得:2.构造尺度矩阵构造尺度矩阵构造尺度矩阵构造尺度矩阵A Ak k从初始矩阵从初始矩阵A0=I(单位矩阵单位矩阵)开始,通过对公式开始,通过对公式因此,一旦达到最优点附近,就可望达到牛顿法因此,一旦达到最优点附近,就可望达到牛顿法的收敛速度的收敛速
21、度。1)DFP法(法(Davidon-Fletcher-Powell)式中式中中修正矩阵中修正矩阵 的不断修正,在迭代中逐步逼近于的不断修正,在迭代中逐步逼近于。2 2)BFGSBFGS算法算法算法算法(Broyden-Fletcher-Gold frob-(Broyden-Fletcher-Gold frob-(Broyden-Fletcher-Gold frob-(Broyden-Fletcher-Gold frob-ShannoShannoShannoShanno)lDFP算法由于舍入误差和一维搜索不精确,有可算法由于舍入误差和一维搜索不精确,有可能导致构造矩阵的正定性遭到破坏,以至算法
22、不稳能导致构造矩阵的正定性遭到破坏,以至算法不稳定。定。BFGS算法对于维数较高问题具有更好的稳定算法对于维数较高问题具有更好的稳定性。性。例例4-3:用用DFP算法求下列问题的极值:算法求下列问题的极值:l解:解:1)取初始点)取初始点,为了按,为了按DFP法构造第法构造第一次搜寻方向一次搜寻方向d0,需计算初始点处的梯度需计算初始点处的梯度取初始变尺度矩阵为单位矩阵取初始变尺度矩阵为单位矩阵A0=I,则第一次,则第一次搜寻方向为搜寻方向为l沿沿d0方向进行一维搜索,得方向进行一维搜索,得为一维搜索最佳步长,应满足为一维搜索最佳步长,应满足得得:,2)再按)再按DFP法构造点法构造点x1处的
23、搜寻方向处的搜寻方向d1,需计算,需计算代入校正公式代入校正公式=第二次搜寻方向为第二次搜寻方向为再沿再沿d1进行一维搜索,得进行一维搜索,得为一维搜索最佳步长,应满足为一维搜索最佳步长,应满足,得得3)判断判断x2是否为极值点是否为极值点梯度梯度:海赛矩阵海赛矩阵:梯度为零向量梯度为零向量,海赛矩阵正定。可见点满足极值海赛矩阵正定。可见点满足极值充要条件,因此为极小点。充要条件,因此为极小点。4-4 共轭方向法共轭方向法 l1.共共轭方向:轭方向:l设设G为为nn阶实对称正定矩阵,如果有两个阶实对称正定矩阵,如果有两个n维维向量向量d0和和d1满足满足,则称向量,则称向量d0与与d1关关于矩
24、阵于矩阵G共共轭。轭。当当G为单位矩阵时为单位矩阵时,假设目标函数假设目标函数f(x)在极值点附近的二次近似函数为在极值点附近的二次近似函数为对二维情况对二维情况任选取初始点任选取初始点x0沿某个下降方向沿某个下降方向d d0 0作一维搜索,得作一维搜索,得x1 因因为为 是是沿沿d0方方向向搜搜索索的的最最佳佳步步长长,即即在在点点x1处处函函数数f(x)沿沿方方向向d0的的方方向向导导数数为为零零。考考虑虑到到点点x1处方向导数与梯度之间的关系,故有处方向导数与梯度之间的关系,故有如果按最速下降法,选择负梯度方向如果按最速下降法,选择负梯度方向 为搜为搜索方向,则将发生锯齿现象索方向,则将
25、发生锯齿现象。取下一次的迭代搜索方向取下一次的迭代搜索方向d1直指极小点直指极小点x*。0d0 x0 x1x*1 11d1d1l如如果果能能够够选选定定这这样样的的搜搜索索方方向向,那那么么对对于于二二元元二二次次函函数数只只需需顺顺次次进进行行d0、d1两两次次直直线线搜搜索索就就可可以以求求到到极小点极小点x*,即有,即有那么这样的那么这样的d1方向应该满足什么条件呢方向应该满足什么条件呢?对于前述的二次函数对于前述的二次函数:当当时,时,x*是是f(x)极小点,应满足极值必要条件,故有极小点,应满足极值必要条件,故有将等式两边同时左乘将等式两边同时左乘得得:有有 就是使就是使d1直指极小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 无约束 优化 方法 白版
限制150内