2022年支持向量机及支持向量回归简介电子版本.pdf
《2022年支持向量机及支持向量回归简介电子版本.pdf》由会员分享,可在线阅读,更多相关《2022年支持向量机及支持向量回归简介电子版本.pdf(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、支 持 向 量 机 及 支 持 向量 回 归 简 介精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 1 页,共 16 页 - - - - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢2 3支持向量机(回归)3.1.1 支持向量机支持向量机( SVM )是美国 Vapnik 教授于 1990 年代提出的, 2000年代后成为了很受欢迎的机器学习方法。它将输入样本集合变换到高维空间使得其分离性状况得到改善。它的结构酷似三层感知器,是构造分类规则的通用方法。SVM 方法的贡献在于,
2、它使得人们可以在非常高维的空间中构造出好的分类规则,为分类算法提供了统一的理论框架。作为副产品,SVM 从理论上解释了多层感知器的隐蔽层数目和隐节点数目的作用,因此,将神经网络的学习算法纳入了核技巧范畴。所谓核技巧,就是找一个核函数( , )K x y使其满足( , )( ( ),( )K x yxy,代替在特征空间中内积( ),( )xy(的计算。因为对于非线性分类,一般是先找一个非线性映射将输入数据映射到高维特征空间,使之分离性状况得到很大改观,此时在该特征空间中进行分类,然后再返会原空间,就得到了原输入空间的非线性分类。由于内积运算量相当大,核技巧就是为了降低计算量而生的。特别, 对特征
3、空间 H 为 Hilbert空间的情形,设( , )K x y是定义在输入空间nR 上的二元函数,设H 中的规范正交基为12( ),( ),.,( ), .nxxx。如果221( ,)( ),( ),kkkkkK x yaxyal,精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 2 页,共 16 页 - - - - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢3 那么取1( )( )kkkxax即为所求的非线性嵌入映射。由于核函数( , )K x y的定义域是原来的输入空间,
4、而不是高维的特征空间。因此,巧妙地避开了计算高维内积( ),( )xy(所需付出的计算代价。实际计算中,我们只要选定一个( , )K x y,并不去重构嵌入映射1( )( )kkkxax。所以寻找核函数( , )K x y(对称且非负)就是主要任务了。满足以上条件的核函数很多,例如可以取为 d- 阶多项式:( ,)(1)dK x yx y,其中 y 为固定元素。可以取为径向函数:22( , )exp | /K x yxy,其中 y 为固定元素。可以取为神经网络惯用的核函数:12( , )tanh()K x yc x yc,其中 y 为固定元素。一般地,核函数的存在性只依赖于如何寻找一个平方收敛
5、的非负序列ka。这样的序列在2l空间的正锥22|0,kklalak 中的序列都满足。但哪一个最佳还有待于进一步讨论。经验表明,分类问题对于核函数不太敏感。当然,重新构造一个核函数也不是一个简单的事。因此,实际操作中往往就在上述三类中挑出一个来使用就可以了。支持向量机的结构示意图可以表示如下:精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 3 页,共 16 页 - - - - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢4 图 1 支持向量机结构示意图其中输入层是为了存贮输入数
6、据,并不作任何加工运算;中间层是通过对样本集的学习,选择( ,),1,2,3,.,iK x xiL;最后一层就是构造分类函数1sgn( ,)Liiiiyy a K x xb整个过程等价于在特征空间中构造一个最优超平面。支持向量机的作用之一就是分类。根据分类的任务,可以划分为一分类,二分类以及多分类。对于多类分类问题,可以用若干种手法将其分解为若干个二分类问题叠加。因此,为了实现支持向量机分类的算法,我们只要针对二分类,从头来给出它的数学原理。3.1.2 支持向量机分类的数学原理精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - -
7、 - - - -第 4 页,共 16 页 - - - - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢5 设样本集为(,)|;1, 1 ,1,.,niiiix yxRyiI,我们的目的是寻找一个最优超平面 H 使得标签为 1 和1 的两类点不仅分开且分得间隔最大。当在n维欧几里德空间中就可以实现线性分离时,也即存在超平面将样本集按照标签 1 与1 分在两边。由于超平面在n维欧几里德空间中的数学表达式是一个线性方程,0w xb,其中,w为系数向量,x为n维变量,,w x内积, b 为常数。空间中点ix到超平面 L 的距离|,|(,)|iiw xbd xLw。欲使得(
8、,)id x H最大,等价于21|2w最小。于是,得到一个在约束条件下的极值问题21min|2(,)1,1,2,.,iiwyw xbiI引入 Lagrange 乘子12(,.,)I,可以解得关于该参变量的方程121,1(),IIiijijijii jQy yx x称之为 Lagrange 对偶函数。其约束条件为,10,0,1,2,.,Iiiii jyiI精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 5 页,共 16 页 - - - - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删
9、除谢谢6 在此约束条件之下,使得()Q达到最大值的的许多分量为 0,不为 0 的i所对应的样本ix就称为支持向量。这就是支持向量的来历。当在输入空间不能实现线性分离,假设我们找到了非线性映射将样本集(,) |;1, 1 ,1,.,niiiix yxRyiI 映射到高维特征空间H 中,此时我们考虑在 H 中的集合( (),)|;1, 1 ,1,.,niiiixyxRyiI 的线性分类,即在 H 中构造超平面,其权系数w满足类似的极值问题。由于允许部分点可以例外,那么可以引入松弛项,即改写为:211min|2(,)1,0,1,2,.,LiiiiiiwCyw xbiI最终转化为一个二次型在约束条件下
10、的二次规划问题:11min20, 0(,.,)( ,.,)TTIDcyACC其中,1(,.,)TIyyy,( 1,.,1)Tc,1,(,)ijiji j IDK x xy y为矩阵。( , )K x s是核函数。一分类问题是一个极端情形但却又是非常有用的,它可以表示为如下数学模型:设|,1,.,niixxRiI为空间nR 的有限观测点,找一个以a为心,以 R为半径的包含这些点的最小球体。因此,一分类是对于求一个化合物成分的最小精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 6 页,共 16 页 - - -
11、 - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢7 包络曲面的最佳方法。与前面完全相同的手法,设是由某个核函数( , )K x s导出的从输入空间到特征空间中的嵌入映射,最后可以得到二次规划问题11min20, 0(,.,)( ,.,)TTIDcyACC其中,1(,.,)TIyyy,( 1,.,1)Tc,1,(,)ijiji jIDK x xy y为矩阵。( , )K x s是核函数。此时111( )( , )2( ,)(,)LLLiiijijijif xK x xK x xK x x此时几乎所有的点满足2( )f xR。参数 C 起着控制落在球外点的数目, 变
12、化区间为: 1/1LC. 3.1.3 基于线性规划的 SVM 分类由于分类问题的自然推理过程都会归结到二次规划求解,计算复杂度相对较高。如果能将其简化为线性规划而且没有较大的误差,那么计算量将急速减少。于是提出了基于线性规划的SVM 分类。此方法经过数学严格推理,是合理的(因为涉及泛函的知识较多,推理过程放在附录中)。因此产生了基于线性规划一分类、二分类、多分类。此处,我们仅给出基于线性规划的SVM 分类的最终形式:精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 7 页,共 16 页 - - - - -
13、- - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢8 111min.(,),1,., ;1;,0LiiLLiijjiiiiiCstK x xjL解出与则得出决策函数1( )(,)Liijif xK x x以及阈值。参数 C 控制着满足条件( )f x的样本数量。特别核函数取为径向函数时,参数2越小,精度越高。 另外,要提醒注意的是,在求解大规模分类问题得SVM 算法实现时,需要以下辅助手段:停机准则: 由于分类问题等价于求对偶问题在约束条件下的极值1111max(,).0, 0,1,2,.,LLLiijijijiijLiiijy y K x xstyCiL而 KKT 条件(
14、, ()10()0,1,2,.,iiiiiiywxbCiL是收敛的充分必要条件。因此通过监控 KKT 条件来得到停机条件110, 0,1,2,.,1,0,(,)1,0,1,LiiijiLiiiijijiyCiLiyy K xxbCiCi这个条件中的不等式不必严格成立,只要在一定误差条件下成立就可以用了。选块算法分解法精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 8 页,共 16 页 - - - - - - - - - - 精品资料仅供学习与交流,如有侵权请联系网站删除谢谢9 1.给定参数0M,0,0k。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 支持 向量 回归 简介 电子 版本
限制150内