最优化问题数学基础.doc
《最优化问题数学基础.doc》由会员分享,可在线阅读,更多相关《最优化问题数学基础.doc(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章 最优化问题数学基础为了便于学习最优化方法,本章将对与优化方法密切相关的数学知识作一简要介绍,而有些数学知识将在讲解各种算法时,随之介绍2.1 二次型与正定矩阵一、二次型与实对称矩阵二次型理论在最优化设计中应用十分广泛应用矩阵的乘法运算,二次型与实对称矩阵紧密地联系在一起了,从而二次型的基本问题又可转化成实对称矩阵问题二次型理论问题起源于化二次曲线和二次曲面的方程为标准形式的问题推广到n维空间中,二次超曲面的一般方程为用矩阵表示可简记为其中矩阵A的元素正是二次型的项的系数的一半,是二次型的项的系数因此,二次型和它的矩阵A是相互唯一决定的,且二、正定矩阵定义2.1 如果二次型对于任何一组不
2、全为零的数恒有,则称正定,且二次型矩阵A也称为正定简言之,一个对称矩阵A如果是正定的,则二次型对于所有非零向量X其值总为正类似可以给出定义,若二次型,则A为半正定矩阵;若,则A为半负定矩阵;若二次型既不是半正定又不是半负定,就称矩阵A为不定的矩阵A为正定的充要条件是它的行列式的顺序主子式全部大于零,即由此可见,正定矩阵必然是非奇异的例2.1 判断矩阵是否正定解 , A是正定的2.2 方向导数与梯度一、方向导数所谓方向导数的概念是作为偏导数的一个推广而引入的,它主要研究函数沿任一给定方向的变化率定义2.2 设在点处可微,P是固定不变的非零向量,是方向P上的单位向量,则称极限(2.1)为函数在点处
3、沿P方向的方向导数,式中是它的记号定义2.3 设是连续函数,且,若存在,当时都有,则称P为在点处的下降方向若,则称P为在点处的上升方向由以上两个定义可立刻得到如下的结论:若,则从出发在附近沿P方向是下降;若,则从出发在附近沿P方向是上升事实上,若,则当充分小时,根据式(2.1)必有,即 ,其中是从出发在P方向上的点,说明是下降的同理可以说明,若,则是上升的二、梯度定义2.4 以的n个偏导数为分量的向量称为在X处的梯度,记为梯度也可以称为函数关于向量的一阶导数以下几个特殊类型函数的梯度公式是常用的:(1)若(常数),则,即;(2) 证 设,则于是的第个分量是所以(3) (4)若是对称矩阵,则三、
4、梯度与方向导数之间的关系定理2.1 设在点处可微,则,其中是方向上的单位向量证明在相应的数学分析中可找到(故略去)由这个定理容易得到下列结论:(1) 若,则P的方向是函数在点处的下降方向;(2) 若,则的方向是函数在点处的上升方向方向导数的正负决定了函数值的升降,而升降的快慢就由它的绝对值大小决定绝对值越大,升降的速度就越快,即=,上式中的等号,当且仅当的方向与的方向相同时才成立由此可得如下重要结论(如图2.1所示):(1)梯度方向是函数值的最速上升方向;(2)函数在与其梯度正交的方向上变化率为零;(3)函数在与其梯度成锐角的方向上是上升的,而在与其梯度成钝角的方向上是下降的;(4)梯度反方向
5、是函数值的最速下降方向对于一个最优化问题,为了尽快得到最优解,在每一步迭代过程中所选取的搜索方向总是希望它等于或者是靠近于目标函数的负梯度(即)图2.1的方向,这样才能使函数值下降的最快例2.2 试求目标函数在点处的最速下降方向,并求沿这个方向移动一个单位长后新点的目标函数值解 因为,所以最速下降方向是这个方向上的单位向量是故新点是 ,对应目标函数值为2.3 海色矩阵及泰勒展式一、海色(Hesse)矩阵前面说过,梯度是关于的一阶导数,现在要问关于的二阶导数是什么?定义 2.5 设:,如果在点处对于自变量的各分量的二阶偏导数都存在,则称函数在点处二阶可导,并且称矩阵 是在点处的Hesse矩阵在数
6、学分析中已经知道,当在点处的所有二阶偏导数为连续时有因此,在这种情况下Hesse矩阵是对称的例2.3 求目标函数的梯度和Hesse矩阵解 因为,所以 又因为所以 例2.4 设,求线性函数在任意点X处的梯度和Hesse矩阵解 设,则, (2.2) 由式(2.2)进而知 (阶零矩阵)例2.5 设是对称矩阵,求二次函数在任意点处的梯度和Hesse矩阵解 设,则将它对各变量求偏导数,得在上式中显然再对它们求偏导数得 以上例子说明,元函数求导与一元函数的求导在形式上是一致的,即线性函数的一阶导数为常向量,其二阶导数为零矩阵;而二次函数的一阶导数为线性向量函数,二阶导数为常矩阵最后介绍在今后的计算中要用到
7、的向量函数的导数定义2.6 设,记,如果在点处对于自变量的各分量的偏导数都存在,则称向量函数在点处是一阶可导的,并且称矩阵是在点处的一阶导数或Jacobi矩阵,简记为由于元函数的梯度是向量函数所以的一阶导数或Jacobi矩阵为即据此,从上式得知,函数梯度的Jacobi矩阵即为此函数的Hesse矩阵下面给出今后要用到的几个公式:(1),其中是分量全为常数的维向量,是阶零矩阵(2),其中是维向量,是阶单位矩阵(3),其中是阶矩阵(4)设,其中,则二、泰勒展开式多元函数的泰勒展开在最优化方法中十分重要,许多方法及其收敛性的证明是从它出发的,这里给出泰勒展开定理及其证明定理2.2 设具有二阶连续偏导数
8、,则, (2.3)其中,而证 设,于是,对按一元函数在点展开,得到,其中令,于是 (2.4)又因为,代入式(2.4)中,所以式(2.3)还可以写成2.4 极小点的判定条件函数在局部极小点应满足什么条件?反之,满足什么条件的是局部极小点?这是我们关心的基本问题下面针对多元函数的情形给出各类极小点的定义定义2.7 对于任意给定的实数,满足不等式的的集合称为点的邻域,记为定义2.8 设,若存在点和数,都有,则称为的局部极小点(非严格)定义2.9 设,若存在点和数,但,都有,则称为的严格局部极小点定义2.10 设,若存在点,都有,则称为在D上的全局极小点(非严格)定义2.11 设,若存在点,但,都有,
9、则称为在D上的严格全局极小点由以上定义看到,是局部极小点,是指在以为中心的一个邻域中在点处取得最小的值;而是全局极小点,是指在定义域D中在点处取得最小的值全局极小点可能在某个局部极小点处取得,也可能在D的边界上取得实际问题通常是求全局极小点,但是直到目前为止,最优化中绝大多数方法都是求局部极小点的,解决这一矛盾的一种方法是先求出所有的局部极小点,再求全局极小点定理2.3 设具有连续的一阶偏导数若是的局部极小点并且是D的内点,则(2.5)证 设是任意单位向量,因为是的局部极小点,所以存在,当或时总有(2.6)引入辅助一元函数,此时,由式(2.6)得又因是D的内点,所以与它对应的是的局部极小点又根
10、据一元函数极小点的必要条件,得到,即再由单位向量的任意性得这里条件(2.5)仅仅是必要的,而不是充分的例如在点处的梯度是,但是双曲面的鞍点,而不是极小点(如图2.2所示)图2.2定义2.12 设是D的内点若,则称为的驻点定理2.4 设具有连续二阶偏导数,是D的一个内点若,并且是正定的,则是的严格局部极小点证 因为是正定矩阵,则必存在,使得对于所有的都有(参看高等代数二次型理论)现在将在点处按泰勒公式展开,并注意到,于是可得当充分接近(但)时,上式左端的符号取决于右端第一项,因此一般说来,这个定理仅具有理论意义因为对于复杂的目标函数,Hesse矩阵不易求得,它的正定性就更难判定了定理2.5 若多
11、元函数在其极小点处的Hesse矩阵是正定的,则它在这个极小点附近的等值面近似地呈现为同心椭球面簇证 设是多元函数的极小点,并设是充分靠近极小点的一个等值面,即充分小把在点展成泰勒公式,即右端第二项因是极小点有而消失如果略去第4项,那么,又因为,所以(2.7)按假设正定,由二次型理论知式(2.7)是以为中心的椭球面方程2.5 锥、凸集、凸锥在本节中,给出维Euclid空间中的锥、凸集和凸锥的定义,以及与其相关的一些概念和性质一、定义与简单性质定义2.13 集合若及任意的数,均有,则称C为锥定义2.14 设是中的个已知点若对于某点存在常数且使得,则称是的凸组合若且,则称是的严格凸组合定义2.15
12、集合若和,以及任意的数,均有则称C为凸集定义2.16 设且,则集合称为中的半空间特别地,规定空集是凸集容易验证,空间、半空间、超平面、直线、点、球都是凸集定理2.6 任意一组凸集的交仍然是凸集证 设,其中I是的下标集,都是凸集任取,则对于任意都是任取且,因是凸集,有于是,即C是凸集若集合C为锥,C又为凸集,则称C为凸锥若C为凸集,也为闭集,则称C为闭凸集若C为凸锥,也为闭集,则称C为闭凸锥由数学归纳法不难证明如下的定理2.7和2.8定理2.7 集合C为凸集的充分必要条件是,及任意数(),有定理2.8 集合C为凸锥的充分必要条件是,及任意数(),均有定义 2.17 有限个半空间的交称为多面集,其
13、中为矩阵,为维向量例2.6 集合为多面集,其几何表示如图2.3画斜线部分图2.3在多面集的表达式中,若,则多面集也是凸锥,称为多面锥在有关凸集的理论及应用中,极点和极方向的概念有着重要作用定义 2.18 设为非空凸集,若不能表示成中两个不同点的凸组合;换言之,若假设,必推得,则称是凸集的极点按此定义,图2.4中多边形的顶点和是极点,而和不是极点图2.4中圆周上的点均为极点图2.4由图2.4可以看出,在给定的两个凸集中,任何一点都能表示成极点的凸组合定义 2.19 设为中的闭凸集,为非零向量,如果对中的每一个,都有射线,则称向量为的方向又设和是的两个方向,若对任何正数,有,则称和是两个不同的方向
14、若的方向不能表示成该集合的两个不同方向的正的线性组合,则称为的极方向图2.5例2.7 如图2.5所示,对于集合,凡是与向量夹角小于或等于的向量,都是它的方向和是的两个极方向的其它方向都能表示成这两个极方向的正线性组合 例2.8 设为非空集合,是非零向量证明为的方向的充要条件是且证 按照定义2.19,为的方向的充要条件是对每一个,有 (2.8)根据集合的定义,由式(2.8)可得, (2.9) (2.10)由于,及可取任意非负数,因此由式(2.9)和式(2.10)知及对于有界多面集,它的每一个点可用极点的凸组合来表示,反之,由极点的凸组合表示的点一定属于这个多面集对此可简要说明如下:设有多面集,如
15、图2.6(a)所示若,则其中均为非负数,且,即为极点,和的凸组合反之,设,则,即如果多面集是无界的,那么对于该多面集中的任一点(极点除外),只用极点来表示是不行的,还需要用极方向如图2.6(b)所示,这时有,其中是中某个数,是某一个非负数图2.6概括起来,有下列定理:定理2.9 设为非空多面集,则有(1)极点集非空,且存在有限个极点(2)极方向集合为空集的充要条件是有界若无界,则存在有限个极方向(3)的充要条件是 ,其中, 关于上述定理的证明参见参考文献6二、凸集分离定理凸集分离定理是凸分析中最重要的定理之一,它在最优化理论和模型当中具有重要的应用所谓集合的分离是指对于两个集合C1和C2存在一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优化 问题 数学 基础
限制150内