最优化问题数学基础课件.ppt
《最优化问题数学基础课件.ppt》由会员分享,可在线阅读,更多相关《最优化问题数学基础课件.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于最优化问题数学基础第1页,此课件共67页哦1.1 二次型与正定矩阵一、二次型与实对称矩阵二次型理论在最优化设计中应用十分广泛应用矩阵的乘法运算,二次型与实对称矩阵紧密地联系在一起了,从而二次型的基本问题又可转化成实对称矩阵问题二次型理论问题起源于化二次曲线和二次曲面的方程为标准形式的问题推广到n维空间中,二次超曲面的一般方程为第2页,此课件共67页哦,ninjjiijnnnnnnnnnnnnxxaxaxxaxxaxxaxaxxaxxaxxaxaxxxf11222112222221221112112211121)(第3页,此课件共67页哦用矩阵表示为其中,矩阵A的元素正是二次型的项的系数的一
2、半,是二次型的项的系数因此,二次型和它的矩阵A是相互唯一决定的,且,AXXxxxAxxxxxaxxxfTninjnnjiijn11212121)()(jiaajiijjixxiia2ixTAA第4页,此课件共67页哦 二、正定矩阵定义2.1 如果二次型对于任何一组不全为零的数恒有 则称正定,且二次型矩阵A也称为正定 简言之,一个对称矩阵A如果是正定的,则二次型 对于所有非零向量X其值总为正类似可以给出定义,若二次型 则A为半正定矩阵;若,则A为半负定矩阵;若二次型既不是半正定又不是半负定,就称矩阵A为不定的ninjTjiijnAXXxxaxxxf1121)(,nxxx,210)(21AXXxx
3、xfTn,)(21nxxxf,)(21nxxxf,AXXT0)(21AXXxxxfTn,0AXXT第5页,此课件共67页哦矩阵A为正定的充要条件是它的行列式的顺序主子式全部大于零,即由此可见,正定矩阵必然是非奇异的例2.1 判断矩阵 是否正定解 ,A是正定的1112121222111211212212000nnnnnnaaaaaaaaaaaaaa,201032124A42142408023013023102,第6页,此课件共67页哦 一、方向导数 所谓方向导数的概念是作为偏导数的一个推广而引入,它主要研究函数沿任一给定方向的变化率 定义2.2 设 在点 处可微,P是固定不变的非零向量,是方向P
4、上的单位向量,则称极限 (2.1)为函数 在点 处沿P方向的方向导数,式中 是它的记号2.2 方向导数与梯度1:RRfn0XetXfteXfPXft)()(lim)(0000)(Xf0XPXf)(0第7页,此课件共67页哦定义2.3 设 是连续函数,且 ,若存在 ,当 时都有,则称P为在点处的下降方 向若 ,则称P为在点处的上升方向 由以上两个定义可立刻得到如下的结论:若 ,则 从 出发在 附近沿P方向是下降;若 ,则从出发在附近沿P方向是上升1:RRfn0X0P0),0(t)()(00XftPXf)()(00XftPXf0)(0PXf)(Xf0X0X0)(0PXf第8页,此课件共67页哦二、
5、梯度定义2.4 以 的n个偏导数为分量的向量称为 在X处的梯度,记为 梯度也可以称为函数 关于向量 的一阶导数以下几个特殊类型函数的梯度公式是常用的:(1)若 (常数),则 ,即 ;(2)证 设 ,则于是 的第 个分量是所以(3)(4)若Q是对称矩阵,则)(Xf)(Xf12()()()()Tnf Xf Xf Xf Xxxx,)(XfXcXf)(0)(Xf0cbXbT)(1212TTnnbb bbXx xx,niiiTxbXb1)(XbTj1()()1 2nTiijijjb Xb xbjnxx,bXbT)(XXXT2)(QXQXXT2)(第9页,此课件共67页哦 三、梯度与方向导数之间的关系 定
6、理2.1 设 在点 处可微,则 ,其中 是 方向上的单位向量.由这个定理容易得到下列结论:(1)若 ,则P的方向是函数在点 处的下降方向;(2)若 ,则 的方向是函数在点 处的上升方向 方向导数的正负决定了函数值的升降,而升降的快慢就由它的绝对值大小决定绝对值越大,升降的速度就越快,即 1:RRfn0XeXfPXfT)()(00eP0)(0PXfT0)(0PXfT0X0XP第10页,此课件共67页哦 =1 上式中的等号,当且仅当的方向与的方向相同时才成立由此可得如下重要结论(如图2.1所示):(1)梯度方向是函数值的最速上升方向;(2)函数在与其梯度正交的方向上变化率为零;(3)函数在与其梯度
7、成锐角的方向上是上升的,而在与其梯度成钝角的方向上是下降的;(4)梯度反方向是函数值最速下降方向 00()()Tf Xf XeP 0()f X00(cos(),)()f Xef X 1 第11页,此课件共67页哦 对于一个最优化问题,为了尽快得到最优解,在每一步迭代过程中所选取的搜索方向总是希望它等于或者是靠近于目标函数的负梯度-图2.1的方向,这样才能使函数值下降的最快第12页,此课件共67页哦 例2.2 试求目标函数在点处的最速下降方向,并求沿这个方向移动一个单位长后新点的目标函数值 解解 因为 所以最速下降方向是 =这个方向上的单位向量是故新点是 对应目标函数值为 112fxx222fx
8、x0()f X12102322xxxx06000()1()f Xef X10000312XXe 221()0215f X第13页,此课件共67页哦2.3 海色矩阵及泰勒展式 一、海色(Hesse)矩阵 前面说过,梯度 是 关于 的一阶导数,现在要问 关于 的二阶导数是什么?定义 2.5 设::,如果在点 处对于自变量的各分量的二阶偏导数 都存在,则称函数在点处二阶可导,并且称矩阵()f X()f XX()f XXf1RRnnRX 00X第14页,此课件共67页哦 是 在点 处的Hesse矩阵 在数学分析中已经知道,当 在点 处的所有二阶偏导数为连续时有 因此,在这种情况下Hesse矩阵是对称的
9、 222000211212220002202122222000212()()()()()()()()()()nnnnnf Xf Xf Xxx xx xf Xf Xf Xf Xxxxxxf Xf Xf Xxxxxx f0Xf0X2200()()1 2ijjif Xf Xi jnx xx x ,第15页,此课件共67页哦例2.3 求目标函数 的梯度和Hesse矩阵解 因为 所以23132221233241432)(xxxxxxxxxXf232131124xxxxxf32122246xxxxf31233246xxxxxf3123321222321312464624)(xxxxxxxxxxxXf第16
10、页,此课件共67页哦又因为所以 22221213211213222212222331222212462fffxxxxxx xx xfffxxxx xx ,13213122122642412222212)(xxxxxxxxXf第17页,此课件共67页哦例2.4 设 ,求线性函数在任意点X处的梯度和Hesse矩阵解:设 ,则 (2.2)由式(2.2)进而知 (阶零矩阵)1,RbRXRannbXaXfT)(1212TTnnaa aaXx xx,121()nniiif x xxa xb,1 2iifainx,aaaaXfTn,)(21201 2ijfi jnx x,OXf)(2第18页,此课件共67页
11、哦例2.5 设 是对称矩阵,求二次函数 在任意点处的梯度和Hesse矩阵解 设 则将它对各变量 求偏导数,得 nnRa1RcRbn,()f X 12TTX AXb Xc1212()TTijn nnnAaXx xxbb bb,121111()2nnnnijijiiijif xxxa x xb xc,(1 2)ix in,111111111()()()nnjjjjjjnnnnjjnnjjjjnf Xa xba xxbf Xf Xba xba xxbAXXf)(第19页,此课件共67页哦在上式中显然再对它们求偏导数得 以上例子说明,元函数求导与一元函数的求导在形式上是一致的,即线性函数的一阶导数为常
12、向量,其二阶导数为零矩阵;而二次函数的一阶导数为线性向量函数,二阶导数为常矩阵 最后介绍在今后的计算中要用到的向量函数的导数1()1 2nijjijif Xa xbinx,2()1 2ijijf Xai jnx x,AaaaaaaaaaXfnnnnnn2122221112112)(第20页,此课件共67页哦定义2.6 设 ,记 如果 在点 处于自变量 的各分量的偏导数 都存在,则称向量函数 在点 处是一阶可导的,并且称矩阵1010101220202012000012()()()()()()()()()()nnm nmmmnh Xh Xh Xxxxh Xh Xh XxxxH XhXhXhXxxx
13、nmnRXRRH0,:1()()()TmH Xh XhX,(1 2)ih im,0XTnxxxX,210()(1 2)ijhXjnx,)(XH0X第21页,此课件共67页哦是在点处的一阶导数或Jacobi矩阵,简记为 由于n元函数 的梯度是向量函数所以 的一阶导数或Jacobi矩阵为00()()m nH XH X 1RRfn:1()()()Tnf Xf Xf Xxx,)(Xf112111222212()()()()()()()()()()nn nnnnnnf Xf Xf Xxxxxxxf Xf Xf Xf Xxxxxxxf Xf Xf Xxxxxxx 222211212222221222222
14、12()()()()()()()()()()nnnnnf Xf Xf Xxx xx xf Xf Xf Xf Xxxxxxf Xf Xf Xxxxxx ,第22页,此课件共67页哦 得到112111222212()()()()()()()()()()nn nnnnnnf Xf Xf Xxxxxxxf Xf Xf Xf Xxxxxxxf Xf Xf Xxxxxxx 22221121222222122222212()()()()()()()()()()nnnnnf Xf Xf Xxx xx xf Xf Xf Xf Xxxxxxf Xf Xf Xxxxxx ,)()(2XfXfnn第23页,此课件共6
15、7页哦据此,从上式得知,函数梯度的Jacobi矩阵即为此函数的Hesse矩阵下面给出今后要用到的几个公式:(1),其中 是分量全为常数的 维向量,是 阶零矩阵(2),其中 是维向量,是 阶单位矩阵(3),其中 是 阶矩阵(4)设 ,其中 ,则Oc cnOnnIX XInn()AXAAnm)()(0tPXft111nfRRRR:,:PtPXfPtPtPXftTT)()(,)()(020 第24页,此课件共67页哦二、泰勒展开式多元函数的泰勒展开在最优化方法中十分重要,许多方法及其收敛性的证明是从它出发,这里给出泰勒展开定理及其证明 定理2.2 设 具有二阶连续偏导数,则 (2.3)其中 ,而 证
16、 设 ,于是对 按一元函数在 点展开,得到其中 令 ,于是 (2.4)1RRfn:PXfPPXfXfPXfTT)(21)()()(2PXX10)()(tPXft(0)()(1)()f Xf X P,)(t0t2)(21)0()0()(tttt 101t)(21)0()0()1(第25页,此课件共67页哦又因为代入式(2.4)中,所以 式(2.3)还可以写成 2(0)()()()TTf XPPf XP P ,PPXfPPXfXfPXfTT)(21)()()(2)|(|)(21)()()(22PoPXfPPXfXfPXfTT第26页,此课件共67页哦2.4 极小点的判定条件函数在局部极小点应满足什
17、么条件?反之,满足什么条件的是局部极小点?这是我们关心的基本问题下面针对多元函数的情形给出各类极小点的定义定义2.7 对于任意给定的实数 ,满足不等式 集合称为点的邻域,记为定义2.8 设 ,若存在点 和数 ,都有 ,则称 为 局部极小点(非严格)0|0XX0,|),(00XXXXN1RRDfn:DX*0X*(,)N XD)()(*XfXf*X)(Xf第27页,此课件共67页哦 定义2.9 设 ,若存在点 和数 ,但 ,都有 ,则称 为 的严格局部极小点 定义2.10 设 ,若存在点 和数 ,都有 ,则称 为 在D上的全局极小点(非严格)定义2.11 设 ,若存在点 ,但 ,都有 ,则称 为
18、在D上的严格全局极小点1RRDfn:DX*0X*(,)N XD*XX)()(*XfXf*X)(Xf1RRDfn:DX*0DX)()(*XfXf*X)(Xf1RRDfn:DX*DX*XX)()(*XfXf*X)(Xf第28页,此课件共67页哦 由以上定义看到,是局部极小点,是指在以为中心的一个邻域中在点处取得最小的值;而是全局极小点,是指在定义域D中在点处取得最小的值全局极小点可能在某个局部极小点处取得,也可能在D的边界上取得实际问题通常是求全局极小点,但是直到目前为止,最优化中绝大多数方法都是求局部极小点的,解决这一矛盾的一种方法是先求出所有的局部极小点,再求全局极小点第29页,此课件共67页
19、哦 定理2.3 设 具有连续的一阶偏导数若 是 的局部极小点并且是D的内点,则 (2.5)证 设 是任意单位向量,因为 是 的局部极小点,所以存在 ,当 或 时总有 (2.6)引入辅助一元函数 ,此时,由式(2.6)得 又因 1RRDfn:*X)(Xf0)(*Xfe*X)(Xf0|t),(*XNteX)()(*XfteXf)()(*teXft)0()(t*X第30页,此课件共67页哦 是D的内点,所以与它对应的 是 的局部极小点又根据一元函数极小点的必要条件,得到 ,即 再由单位向量 的任意性得 这里条件(2.5)仅仅是必要的,而不是充分的例如 在点 处的梯度是 ,但 是双曲面的鞍点,而不是极
20、小点(如图2.2所示)0t)(t0)0(0)(*eXfTe0)(*Xf2121),(xxxxf*0,0TX Tf0,0)0,0(TX0,0*第31页,此课件共67页哦 定义2.12 设 是D的内 点若 ,则称 为 的驻点 定理2.4 设 具有连续二阶偏导数,是D的一个内点若 ,并且 是正定的,则 是 的严格局部极小点*1XRRDfn,:0)(*Xf*X)(Xf1RRDfn:*X0)(*Xf)(*2Xf*X)(Xf第32页,此课件共67页哦 证 因为 是正定矩阵,则必存在 ,使得对于所有的 都有 (参看高等代数二次型理论)现在将 在点 处按泰勒公式展开,并注意到 ,于是可得)(*2Xf0nRP
21、2*2|)(PPXfPT)(Xf*X0)(*Xf*2*2*2*21()()()()()(|)2|(|)2Tf Xf XXXf XXXoXXXXoXX第33页,此课件共67页哦 当 充分接近 (但 )时,上式左端的符号取决于右端第一项,因此 一般说来,这个定理仅具有理论意义因为对于复杂的目标函数,Hesse矩阵不易求得,它的正定性就更难判定了 X*X*XX)()(*XfXf第34页,此课件共67页哦定理2.5 若多元函数在其极小点处的Hesse矩阵是正定的,则它在这个极小点附近的等值面近似地呈现为同心椭球面族证 设 是多元函数的极小点,并设 是充分靠近极小点 的一个等值面,即 充分小把 在点 展
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优化 问题 数学 基础 课件
限制150内