使用导数的最优化方法幻灯片.ppt





《使用导数的最优化方法幻灯片.ppt》由会员分享,可在线阅读,更多相关《使用导数的最优化方法幻灯片.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、使用导数的最优化方法第1页,共74页,编辑于2022年,星期四一一.无约束最优化问题无约束最优化问题 无约束非线性规划问题的求解方法分为解析法和直接法两类。解析法解析法 需要计算函数的梯度,利用函数的解析性质构造迭代公式使之收敛到最优解。本节介绍最速下降法、共轭梯度法、牛顿法、变尺度法等解析方法 直接法直接法 仅通过比较目标函数值的大小来移动迭代点。下一章主要介绍模式搜索法等直接方法。第2页,共74页,编辑于2022年,星期四 无约束非线性规划问题的求解方法分为解析法和直接法两类。一般来说,无约束非线性规划问题的求解是通过一系列一维搜索来实现。因此,如何选择搜索方向是解无约束非线性规划问题的核
2、心问题,搜索方向的不同选择,形成不同的求解方法。本章主要介绍解析法;另一类只用到目标函数值,不必计算导数,通常称为直接方法直接方法,放在第11章讨论.第3页,共74页,编辑于2022年,星期四本章考虑如下的下降算法:本章考虑如下的下降算法:主要介绍最速下降法、牛顿法,共轭梯度法,拟牛顿法等第4页,共74页,编辑于2022年,星期四10.1 最速下降法最速下降法 10.1.1 最速下降方向最速下降方向 考虑无约束问题(6.1.2)其中函数 具有一阶连续偏导数.人们在处理这类问题时,总希望从某一点出发,选择一个目标函数值下降最快的方向,以利于尽快达到极小点.正是基于这样一种愿望,早在1847年法国
3、著名数学家Cauchy提出了最速下降法最速下降法.后来,Curry等人作了进一步的研究.现在最速下降法已经成为众所周知的一种最基本的算法,它对其他算法的研究也很有启发作用,因此在最优化方法中占有重要地位.下面我们先来讨论怎样选择最速下降方向最速下降方向.第5页,共74页,编辑于2022年,星期四 人们在处理这类问题时,总希望从某一点出发,选择一个目标函数值下降最快的方向,以利于尽快达到极小点.正是基于这样一种愿望,早在1847年法国著名数学家Cauchy提出了最速下降法最速下降法.后来,Curry等人作了进一步的研究.现在最速下降法已经成为众所周知的一种最基本的算法,它对其他算法的研究也很有启
4、发作用,因此在最优化方法中占有重要地位.下面我们先来讨论怎样选择最最速下降方向速下降方向.我们知道,函数 在点 处沿方向 的变化率可用方向导数来表达,对于可微函数,方向导数等于梯度与方向的内积,即(6.1.2)因此,求函数 在点 处的下降最快的方向,可归结为求解下列非线性规划:(6.1.3)第6页,共74页,编辑于2022年,星期四根据Schwartz不等式,有去掉绝对值符号,可以得到(6.1.4)由上式可知,当(6.1.5)时等号成立.因此,在点 处沿(6.1.5)所定义的方向变化率最小,即负梯度方向为最速下降方向负梯度方向为最速下降方向.这里要特别指出,在不同尺度下最速下降方向是不同的.前
5、面定义的最速下降方向,是在向量 的殴氏范数 不大于1的限制得到的,属于殴氏度量意义下的最速下降方向.如果改用其他度量,比第7页,共74页,编辑于2022年,星期四如,设 为对称正定矩阵,在向量 的 范数 不大于1的限制下,极小化 ,则得到的最速下降方向与前者不同.10.1.2 最速下降算法最速下降算法 最速下降法的迭代公式是(10.1.6)其中 是从 出发的搜索方向,这里取在点 处的最速下降方向,即 是从 出发沿方向 进行一维搜索的步长,即 满足(10.1.11)第8页,共74页,编辑于2022年,星期四 计算步骤计算步骤如下:1.给定初点 ,允许误差 ,置 .2.计算搜索方向 3.若 ,则停
6、止计算;否则,从 出发,沿 进行一维搜索,求 ,使 4.令 ,置 ,转步2.例例10.1.1 用最速下降法解下列问题:第9页,共74页,编辑于2022年,星期四解:解:第二次迭代:第10页,共74页,编辑于2022年,星期四第三次迭代:第11页,共74页,编辑于2022年,星期四第12页,共74页,编辑于2022年,星期四在最速下降法的一位搜素中即在最速下降法中相邻两次搜索方向是正交的。第13页,共74页,编辑于2022年,星期四对于二次严格凸函数其中A为n维对称正定矩阵可以求出步长因子k(本章习题7)第14页,共74页,编辑于2022年,星期四锯齿现象锯齿现象 最速下降法的迭代点在向极小点靠
7、近的过程中,走的是曲折的路线:后一次搜索方向d(k+1)与前一次搜索方向 d(k)总是相互垂直的,称它为锯齿现象锯齿现象。这一点在前面的例题中已得到验证。除极特殊的目标函数(如等值面为球面的函数)和极特殊的初始点外,这种现象一般都要发生。最速下降法的收敛性第15页,共74页,编辑于2022年,星期四 从直观上可以看到,在远离极小点的地方,每次迭代都有可能使目标函数值有较多的下降,但在接近极小点的地方,由于锯齿现象,每次迭代行进的距离开始逐渐变小。因而收敛速度不快。已有结论表明,最速下降法对于正定二次函数关于任意初始点都是收敛的(定理10.1.2),而且恰好是线性收敛的。第16页,共74页,编辑
8、于2022年,星期四第17页,共74页,编辑于2022年,星期四第18页,共74页,编辑于2022年,星期四10.2 牛顿法牛顿法 6.2.1 牛顿法牛顿法 设 是二次可微实函数,.又设 是 的极小点的一个估计,我们把 在 展成Taylor级数,并取二阶近似:其中 是 在 处的Hessian矩阵.为求 的平稳点,令即(10.2.1)第19页,共74页,编辑于2022年,星期四设 可逆,有(10.2.1)得到牛顿法的迭代公式(10.2.2)其中 是Hessian矩阵 的逆矩阵.这样,知道 后,算出在这一点处目标函数的梯度和Hessian矩阵的逆,代人(10.2.2),便得到后继点 ,用 代替 ,
9、再用(10.2.2)计算,又得到 的后继点.依此类推,产生序列 .在适当的条件下,这个序列收敛.第20页,共74页,编辑于2022年,星期四则牛顿法产生的序列收敛于 .实际上,当牛顿法收敛时,有下列关系:其中 C 是某个常数.因此,牛顿法至少2级收敛,参看文献19.可见牛顿法的收敛速率是很快的.第21页,共74页,编辑于2022年,星期四例例10.2.1 用牛顿法解下列问题:我们取初点解:第2次迭代:第22页,共74页,编辑于2022年,星期四第2次迭代:继续迭代,得到最终收敛到最优解x*=(1,0)T第23页,共74页,编辑于2022年,星期四我们先用极值条件求解.令下面用牛顿法求解.任取初
10、始点x(1),根据牛顿法的迭代公式:特别地,对于二次凸函数,用牛顿法求解,经1次迭代即达极小点.设有二次凸函数其中A是对称正定矩阵。求迭代点x(2)即1次迭代达到极小点.第24页,共74页,编辑于2022年,星期四不一定是下降方向,经迭代,目标函数值可能上升.此外,即使目标函数值下降,得到的点 也不一定是沿牛顿方向的最好点或极小点.因此,人们对牛顿法进行修正,提出了阻尼牛顿法.值得注意,当初始点远离极小点时,牛顿法可能不收敛.原因之一,牛顿方向 以后还会遇到一些算法,把它们用于二次凸函数时,类似于牛顿法,经有限次迭代必达到极小点.这种性质称为二次终止性二次终止性.对于二次凸函数,用牛顿法求解,
11、经1次迭代即达极小点第25页,共74页,编辑于2022年,星期四 10.2.2 阻尼牛顿法阻尼牛顿法 阻尼牛顿法与原始牛顿法的区别在于增加了沿牛顿方向的一维搜索,其迭代公式是(6.2.6)其中 为牛顿方向,是由一维搜索得到的步长,即满足 阻尼牛顿法的计算步骤计算步骤如下:1.给定初始点 ,允许误差 ,置 .2.计算 第26页,共74页,编辑于2022年,星期四 3.若 ,则停止迭代;否则,令 4.从 出发,沿方向 作一维搜索:令 .5.置 ,转步2.由于阻尼牛顿法含有一维搜索,因此每次迭代目标函数值一般有所下降(决不会上升).可以证明,阻尼牛顿法在适当的条件下具有全局收敛性,且为2级收敛.第2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 使用 导数 优化 方法 幻灯片

限制150内