最优化问题数学基础.ppt
《最优化问题数学基础.ppt》由会员分享,可在线阅读,更多相关《最优化问题数学基础.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于最优化问题数学基础现在学习的是第1页,共67页1.1 二次型与正定矩阵一、二次型与实对称矩阵二次型理论在最优化设计中应用十分广泛应用矩阵的乘法运算,二次型与实对称矩阵紧密地联系在一起了,从而二次型的基本问题又可转化成实对称矩阵问题二次型理论问题起源于化二次曲线和二次曲面的方程为标准形式的问题推广到n维空间中,二次超曲面的一般方程为现在学习的是第2页,共67页,ninjjiijnnnnnnnnnnnnxxaxaxxaxxaxxaxaxxaxxaxxaxaxxxf11222112222221221112112211121)(现在学习的是第3页,共67页用矩阵表示为其中,矩阵A的元素正是二次型的
2、项的系数的一半,是二次型的项的系数因此,二次型和它的矩阵A是相互唯一决定的,且,AXXxxxAxxxxxaxxxfTninjnnjiijn11212121)()(jiaajiijjixxiia2ixTAA 现在学习的是第4页,共67页 二、正定矩阵 定义2.1 如果二次型 对于任何一组不全为零的数恒有 则称正定,且二次型矩阵A也称为正定 简言之,一个对称矩阵A如果是正定的,则二次型 对于所有非零向量X其值总为正类似可以给出定义,若二次型 则A为半正定矩阵;若,则A为半负定矩阵;若二次型既不是半正定又不是半负定,就称矩阵A为不定的ninjTjiijnAXXxxaxxxf1121)(,nxxx,2
3、10)(21AXXxxxfTn,)(21nxxxf,)(21nxxxf,AXXT0)(21AXXxxxfTn,0AXXT现在学习的是第5页,共67页矩阵A为正定的充要条件是它的行列式的顺序主子式全部大于零,即由此可见,正定矩阵必然是非奇异的例2.1 判断矩阵 是否正定解 ,A是正定的1112121222111211212212000nnnnnnaaaaaaaaaaaaaa,201032124A42142408023013023102,现在学习的是第6页,共67页 一、方向导数 所谓方向导数的概念是作为偏导数的一个推广而引入,它主要研究函数沿任一给定方向的变化率 定义2.2 设 在点 处可微,P
4、是固定不变的非零向量,是方向P上的单位向量,则称极限 (2.1)为函数 在点 处沿P方向的方向导数,式中 是它的记号2.2 方向导数与梯度1:RRfn0XetXfteXfPXft)()(lim)(0000)(Xf0XPXf)(0现在学习的是第7页,共67页定义2.3 设 是连续函数,且 ,若存在 ,当 时都有,则称P为在点处的下降方 向若 ,则称P为在点处的上升方向 由以上两个定义可立刻得到如下的结论:若 ,则 从 出发在 附近沿P方向是下降;若 ,则从出发在附近沿P方向是上升1:RRfn0X0P0),0(t)()(00XftPXf)()(00XftPXf0)(0PXf)(Xf0X0X0)(0
5、PXf现在学习的是第8页,共67页二、梯度定义2.4 以 的n个偏导数为分量的向量称为 在X处的梯度,记为 梯度也可以称为函数 关于向量 的一阶导数以下几个特殊类型函数的梯度公式是常用的:(1)若 (常数),则 ,即 ;(2)证 设 ,则于是 的第 个分量是所以(3)(4)若Q是对称矩阵,则)(Xf)(Xf12()()()()Tnf Xf Xf Xf Xxxx,)(XfXcXf)(0)(Xf0cbXbT)(1212TTnnbb bbXx xx,niiiTxbXb1)(XbTj1()()1 2nTiijijjb Xb xbjnxx,bXbT)(XXXT2)(QXQXXT2)(现在学习的是第9页,
6、共67页 三、梯度与方向导数之间的关系 定理2.1 设 在点 处可微,则 ,其中 是 方向上的单位向量.由这个定理容易得到下列结论:(1)若 ,则P的方向是函数在点 处的下降方向;(2)若 ,则 的方向是函数在点 处的上升方向 方向导数的正负决定了函数值的升降,而升降的快慢就由它的绝对值大小决定绝对值越大,升降的速度就越快,即 1:RRfn0XeXfPXfT)()(00eP0)(0PXfT0)(0PXfT0X0XP现在学习的是第10页,共67页 =1 上式中的等号,当且仅当的方向与的方向相同时才成立由此可得如下重要结论(如图2.1所示):(1)梯度方向是函数值的最速上升方向;(2)函数在与其梯
7、度正交的方向上变化率为零;(3)函数在与其梯度成锐角的方向上是上升的,而在与其梯度成钝角的方向上是下降的;(4)梯度反方向是函数值最速下降方向 00()()Tf Xf XeP 0()f X00(cos(),)()f Xef X 1 现在学习的是第11页,共67页 对于一个最优化问题,为了尽快得到最优解,在每一步迭代过程中所选取的搜索方向总是希望它等于或者是靠近于目标函数的负梯度-图2.1的方向,这样才能使函数值下降的最快现在学习的是第12页,共67页 例2.2 试求目标函数在点处的最速下降方向,并求沿这个方向移动一个单位长后新点的目标函数值 解解 因为 所以最速下降方向是 =这个方向上的单位向
8、量是 故新点是 对应目标函数值为 112fxx222fxx0()f X12102322xxxx06000()1()f Xef X10000312XXe 221()0215f X现在学习的是第13页,共67页2.3 海色矩阵及泰勒展式 一、海色(Hesse)矩阵 前面说过,梯度 是 关于 的一阶导数,现在要问 关于 的二阶导数是什么?定义 2.5 设::,如果在点 处对于自变量的各分量的二阶偏导数 都存在,则称函数在点处二阶可导,并且称矩阵()f X()f XX()f XXf1RRnnRX 00X现在学习的是第14页,共67页 是 在点 处的Hesse矩阵 在数学分析中已经知道,当 在点 处的所
9、有二阶偏导数为连续时有 因此,在这种情况下Hesse矩阵是对称的 222000211212220002202122222000212()()()()()()()()()()nnnnnf Xf Xf Xxx xx xf Xf Xf Xf Xxxxxxf Xf Xf Xxxxxx f0Xf0X2200()()1 2ijjif Xf Xi jnx xx x ,现在学习的是第15页,共67页例2.3 求目标函数 的梯度和Hesse矩阵解 因为 所以23132221233241432)(xxxxxxxxxXf232131124xxxxxf32122246xxxxf31233246xxxxxf312332
10、1222321312464624)(xxxxxxxxxxxXf现在学习的是第16页,共67页又因为所以 22221213211213222212222331222212462fffxxxxxx xx xfffxxxx xx ,13213122122642412222212)(xxxxxxxxXf现在学习的是第17页,共67页例2.4 设 ,求线性函数在任意点X处的梯度和Hesse矩阵解:设 ,则 (2.2)由式(2.2)进而知 (阶零矩阵)1,RbRXRannbXaXfT)(1212TTnnaa aaXx xx,121()nniiif x xxa xb,1 2iifainx,aaaaXfTn,
11、)(21201 2ijfi jnx x,OXf)(2现在学习的是第18页,共67页例2.5 设 是对称矩阵,求二次函数 在任意点处的梯度和Hesse矩阵解 设 则将它对各变量 求偏导数,得 nnRa1RcRbn,()f X 12TTX AXb Xc1212()TTijn nnnAaXx xxbb bb,121111()2nnnnijijiiijif xxxa x xb xc,(1 2)ix in,111111111()()()nnjjjjjjnnnnjjnnjjjjnf Xa xba xxbf Xf Xba xba xxbAXXf)(现在学习的是第19页,共67页在上式中显然再对它们求偏导数得
12、 以上例子说明,元函数求导与一元函数的求导在形式上是一致的,即线性函数的一阶导数为常向量,其二阶导数为零矩阵;而二次函数的一阶导数为线性向量函数,二阶导数为常矩阵 最后介绍在今后的计算中要用到的向量函数的导数1()1 2nijjijif Xa xbinx,2()1 2ijijf Xai jnx x,AaaaaaaaaaXfnnnnnn2122221112112)(现在学习的是第20页,共67页定义2.6 设 ,记 如果 在点 处于自变量 的各分量的偏导数 都存在,则称向量函数 在点 处是一阶可导的,并且称矩阵1010101220202012000012()()()()()()()()()()n
13、nm nmmmnh Xh Xh Xxxxh Xh Xh XxxxH XhXhXhXxxxnmnRXRRH0,:1()()()TmH Xh XhX,(1 2)ih im,0XTnxxxX,210()(1 2)ijhXjnx,)(XH0X现在学习的是第21页,共67页是在点处的一阶导数或Jacobi矩阵,简记为 由于n元函数 的梯度是向量函数所以 的一阶导数或Jacobi矩阵为00()()m nH XH X 1RRfn:1()()()Tnf Xf Xf Xxx,)(Xf112111222212()()()()()()()()()()nn nnnnnnf Xf Xf Xxxxxxxf Xf Xf X
14、f Xxxxxxxf Xf Xf Xxxxxxx 22221121222222122222212()()()()()()()()()()nnnnnf Xf Xf Xxx xx xf Xf Xf Xf Xxxxxxf Xf Xf Xxxxxx ,现在学习的是第22页,共67页 得到112111222212()()()()()()()()()()nn nnnnnnf Xf Xf Xxxxxxxf Xf Xf Xf Xxxxxxxf Xf Xf Xxxxxxx 22221121222222122222212()()()()()()()()()()nnnnnf Xf Xf Xxx xx xf Xf X
15、f Xf Xxxxxxf Xf Xf Xxxxxx ,)()(2XfXfnn现在学习的是第23页,共67页据此,从上式得知,函数梯度的Jacobi矩阵即为此函数的Hesse矩阵下面给出今后要用到的几个公式:(1),其中 是分量全为常数的 维向量,是 阶零矩阵(2),其中 是维向量,是 阶单位矩阵(3),其中 是 阶矩阵(4)设 ,其中 ,则Oc cnOnnIX XInn()AXAAnm)()(0tPXft111nfRRRR:,:PtPXfPtPtPXftTT)()(,)()(020 现在学习的是第24页,共67页二、泰勒展开式多元函数的泰勒展开在最优化方法中十分重要,许多方法及其收敛性的证明是
16、从它出发,这里给出泰勒展开定理及其证明 定理2.2 设 具有二阶连续偏导数,则 (2.3)其中 ,而 证 设 ,于是对 按一元函数在 点展开,得到其中 令 ,于是 (2.4)1RRfn:PXfPPXfXfPXfTT)(21)()()(2PXX10)()(tPXft(0)()(1)()f Xf X P,)(t0t2)(21)0()0()(tttt 101t)(21)0()0()1(现在学习的是第25页,共67页又因为代入式(2.4)中,所以 式(2.3)还可以写成 2(0)()()()TTf XPPf XP P ,PPXfPPXfXfPXfTT)(21)()()(2)|(|)(21)()()(2
17、2PoPXfPPXfXfPXfTT现在学习的是第26页,共67页2.4 极小点的判定条件函数在局部极小点应满足什么条件?反之,满足什么条件的是局部极小点?这是我们关心的基本问题下面针对多元函数的情形给出各类极小点的定义定义2.7 对于任意给定的实数 ,满足不等式 集合称为点的邻域,记为定义2.8 设 ,若存在点 和数 ,都有 ,则称 为 局部极小点(非严格)0|0XX0,|),(00XXXXN1RRDfn:DX*0X*(,)N XD)()(*XfXf*X)(Xf现在学习的是第27页,共67页 定义2.9 设 ,若存在点 和数 ,但 ,都有 ,则称 为 的严格局部极小点 定义2.10 设 ,若存
18、在点 和数 ,都有 ,则称 为 在D上的全局极小点(非严格)定义2.11 设 ,若存在点 ,但 ,都有 ,则称 为 在D上的严格全局极小点1RRDfn:DX*0X*(,)N XD*XX)()(*XfXf*X)(Xf1RRDfn:DX*0DX)()(*XfXf*X)(Xf1RRDfn:DX*DX*XX)()(*XfXf*X)(Xf现在学习的是第28页,共67页 由以上定义看到,是局部极小点,是指在以为中心的一个邻域中在点处取得最小的值;而是全局极小点,是指在定义域D中在点处取得最小的值全局极小点可能在某个局部极小点处取得,也可能在D的边界上取得实际问题通常是求全局极小点,但是直到目前为止,最优化
19、中绝大多数方法都是求局部极小点的,解决这一矛盾的一种方法是先求出所有的局部极小点,再求全局极小点现在学习的是第29页,共67页 定理2.3 设 具有连续的一阶偏导数若 是 的局部极小点并且是D的内点,则 (2.5)证 设 是任意单位向量,因为 是 的局部极小点,所以存在 ,当 或 时总有 (2.6)引入辅助一元函数 ,此时,由式(2.6)得 又因 1RRDfn:*X)(Xf0)(*Xfe*X)(Xf0|t),(*XNteX)()(*XfteXf)()(*teXft)0()(t*X现在学习的是第30页,共67页 是D的内点,所以与它对应的 是 的局部极小点又根据一元函数极小点的必要条件,得到 ,
20、即 再由单位向量 的任意性得 这里条件(2.5)仅仅是必要的,而不是充分的例如 在点 处的梯度是 ,但 是双曲面的鞍点,而不是极小点(如图2.2所示)0t)(t0)0(0)(*eXfTe0)(*Xf2121),(xxxxf*0,0TX Tf0,0)0,0(TX0,0*现在学习的是第31页,共67页 定义2.12 设 是D的内 点若 ,则称 为 的驻点 定理2.4 设 具有连续二阶偏导数,是D的一个内点若 ,并且 是正定的,则 是 的严格局部极小点*1XRRDfn,:0)(*Xf*X)(Xf1RRDfn:*X0)(*Xf)(*2Xf*X)(Xf现在学习的是第32页,共67页 证 因为 是正定矩阵
21、,则必存在 ,使得对于所有的 都有 (参看高等代数二次型理论)现在将 在点 处按泰勒公式展开,并注意到 ,于是可得)(*2Xf0nRP 2*2|)(PPXfPT)(Xf*X0)(*Xf*2*2*2*21()()()()()(|)2|(|)2Tf Xf XXXf XXXoXXXXoXX现在学习的是第33页,共67页 当 充分接近 (但 )时,上式左端的符号取决于右端第一项,因此 一般说来,这个定理仅具有理论意义因为对于复杂的目标函数,Hesse矩阵不易求得,它的正定性就更难判定了 X*X*XX)()(*XfXf现在学习的是第34页,共67页 定理2.5 若多元函数在其极小点处的Hesse矩阵是正
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优化 问题 数学 基础
限制150内