2022年支持向量机及支持向量回归简介 .pdf
《2022年支持向量机及支持向量回归简介 .pdf》由会员分享,可在线阅读,更多相关《2022年支持向量机及支持向量回归简介 .pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3支持向量机(回归)3.1.1 支持向量机支持向量机( SVM )是美国 Vapnik 教授于 1990 年代提出的, 2000年代后成为了很受欢迎的机器学习方法。它将输入样本集合变换到高维空间使得其分离性状况得到改善。它的结构酷似三层感知器,是构造分类规则的通用方法。SVM 方法的贡献在于,它使得人们可以在非常高维的空间中构造出好的分类规则,为分类算法提供了统一的理论框架。作为副产品,SVM 从理论上解释了多层感知器的隐蔽层数目和隐节点数目的作用,因此,将神经网络的学习算法纳入了核技巧范畴。所谓核技巧,就是找一个核函数使其满足,代( , )K x y( , )( ( ),( )K x yxy
2、替在特征空间中内积的计算。因为对于非线性分类,一般是先找一( ),( )xy(个非线性映射将输入数据映射到高维特征空间,使之分离性状况得到很大改观,此时在该特征空间中进行分类,然后再返会原空间,就得到了原输入空间的非线性分类。由于内积运算量相当大,核技巧就是为了降低计算量而生的。特别,对特征空间为 Hilbert空间的情形,设是定义在输入空H( , )K x y间上的二元函数,设中的规范正交基为。如果nRH12( ),( ),.,( ), .nxxx,221( , )( ),( ),kkkkkK x yaxyal那么取即为所求的非线性嵌入映射。由于核函数的定义1( )( )kkkxax( ,
3、)K x y域是原来的输入空间,而不是高维的特征空间。因此,巧妙地避开了计算高维内积所需付出的计算代价。实际计算中,我们只要选定一个,( ), ( )xy(( , )K x y名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 12 页 - - - - - - - - - 并不去重构嵌入映射。所以寻找核函数(对称且非负)1( )( )kkkxax( , )K x y就是主要任务了。满足以上条件的核函数很多,例如可以取为 d- 阶多项式:,其中为固定元素。( , )(1)dK
4、x yx ygy可以取为径向函数:,其中为固定元素。22( , )exp | /K x yxyy可以取为神经网络惯用的核函数:,其中为固12( , )tanh()K x yc x ycgy定元素。一般地,核函数的存在性只依赖于如何寻找一个平方收敛的非负序列。这ka样的序列在空间的正锥中的序列都满足。但哪一个2l22|0,kklalak最佳还有待于进一步讨论。经验表明,分类问题对于核函数不太敏感。当然,重新构造一个核函数也不是一个简单的事。因此,实际操作中往往就在上述三类中挑出一个来使用就可以了。支持向量机的结构示意图可以表示如下:图 1 支持向量机结构示意图名师资料总结 - - -精品资料欢迎
5、下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 12 页 - - - - - - - - - 其中输入层是为了存贮输入数据,并不作任何加工运算;中间层是通过对样本集的学习,选择;最后一层就是构造分类函数( ,),1,2,3,.,iK x xiL1sgn( ,)Liiiiyy a K x xb整个过程等价于在特征空间中构造一个最优超平面。支持向量机的作用之一就是分类。根据分类的任务,可以划分为一分类,二分类以及多分类。对于多类分类问题,可以用若干种手法将其分解为若干个二分类问题叠加。因此,为了实现支持向量机分
6、类的算法,我们只要针对二分类,从头来给出它的数学原理。3.1.2 支持向量机分类的数学原理设样本集为,我们的目的是寻找一个最(,)|;1,1 ,1,.,niiiixyxRyiI优超平面使得标签为 1 和1 的两类点不仅分开且分得间隔最大。H当在维欧几里德空间中就可以实现线性分离时,也即存在超平面将样本集n按照标签 1 与1 分在两边。由于超平面在维欧几里德空间中的数学表n达式是一个线性方程,其中,为系数向量,为维变量,,0w xbwxn内积,为常数。空间中点到超平面的距离,w xbixL。欲使得最大,等价于最小。于是,|,|(,)|iiw xbd xLw( ,)id x H21|2w得到一个在
7、约束条件下的极值问题21min|2(,)1,1,2,.,iiwyw xbiI引入 Lagrange 乘子,可以解得关于该参变量的方程12(,.,)I名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 12 页 - - - - - - - - - 121,1(),IIiijijijii jQy yx x称之为 Lagrange 对偶函数。其约束条件为,10,0,1,2,.,Iiiii jyiI在此约束条件之下,使得达到最大值的的许多分量为 0,不为 0 的( )Q所对应的样本就
8、称为支持向量。这就是支持向量的来历。iix当在输入空间不能实现线性分离,假设我们找到了非线性映射将样本集映射到高维特征空间中,此时我们(,) |;1,1 ,1,.,niiiix yxRyiIH考虑在中的集合的线性分类,H( (),)|;1,1 ,1,.,niiiixyxRyiI即在中构造超平面,其权系数满足类似的极值问题。由于允许部分点Hw可以例外,那么可以引入松弛项,即改写为:211min|2(,)1,0,1,2,.,LiiiiiiwCyw xbiI最终转化为一个二次型在约束条件下的二次规划问题:11min20, 0(,.,)( ,.,)TTIDcyACC其中,为矩阵。1(,.,)TIyyy
9、( 1,.,1)Tc1,(,)ijiji jIDK x xy y是核函数。( , )K x s名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 12 页 - - - - - - - - - 一分类问题是一个极端情形但却又是非常有用的,它可以表示为如下数学模型:设为空间的有限观测点,找一个以为心,以为半径|,1,.,niixxRiInRaR的包含这些点的最小球体。因此,一分类是对于求一个化合物成分的最小包络曲面的最佳方法。与前面完全相同的手法,设是由某个核函数导出的( , )
10、K x s从输入空间到特征空间中的嵌入映射,最后可以得到二次规划问题11min20, 0(,.,)( ,.,)TTIDcyACC其中,为矩阵。1(,.,)TIyyy( 1,., 1)Tc1,(,)ijiji jIDK x xy y是核函数。此时( , )K x s111( )( , )2( ,)(,)LLLiiijijijif xK x xK x xK x x此时几乎所有的点满足。参数起着控制落在球外点的数目, 变化区2( )f xRC间为:.1/1LC3.1.3 基于线性规划的SVM 分类由于分类问题的自然推理过程都会归结到二次规划求解,计算复杂度相对较高。如果能将其简化为线性规划而且没有较
11、大的误差,那么计算量将急速减少。于是提出了基于线性规划的SVM 分类。此方法经过数学严格推理,是合理的(因为涉及泛函的知识较多,推理过程放在附录中)。因此产生了基于线性规划一分类、二分类、多分类。此处,我们仅给出基于线性规划的SVM 分类的最终形式:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 12 页 - - - - - - - - - 111min.(,),1,., ;1;,0LiiLLiijjiiiiiCstK x xjL解出与则得出决策函数以及阈值。参数控制着满
12、足1( )(,)Liijif xK x xC条件的样本数量。特别核函数取为径向函数时,参数越小,精度越( )f x2高。 另外,要提醒注意的是,在求解大规模分类问题得SVM 算法实现时,需要以下辅助手段:停机准则: 由于分类问题等价于求对偶问题在约束条件下的极值1111max(,).0, 0,1,2,.,LLLiijijijiijLiiijy y K x xstyCiL而 KKT 条件(, ()10()0,1,2,.,iiiiiiywxbCiL是收敛的充分必要条件。因此通过监控 KKT 条件来得到停机条件110, 0,1,2,.,1,0,(,)1, 0,1,LiiijiLiiiijijiyCi
13、Liyy K xxbCiCi这个条件中的不等式不必严格成立,只要在一定误差条件下成立就可以用了。选块算法分解法1.给定参数,。 选取初始工作集,记其对应的样0M00k0WT本点的下标集为。令第次更新的工作集,其对应的样本点的下0JkWTk标集为。kJ2.基于工作集, 由优化问题kWT名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 12 页 - - - - - - - - - 1111max(,).0, 0,LLLiijijijiijLiiikjy y K x xstyCi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年支持向量机及支持向量回归简介 2022 支持 向量 回归 简介
限制150内