2022年支持向量机综述 .docx
《2022年支持向量机综述 .docx》由会员分享,可在线阅读,更多相关《2022年支持向量机综述 .docx(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 上海高校 2022 2022 学年 冬 季学期争论生课程考试小论文格式课程名称:模式识别方法课程编号: 09SB59004 论文题目 : 支持向量机原理及应用争论生姓名 : 章云元学 号: 13721278 论文评语 : 成 绩: 任课老师 : 李昕评阅日期 : 名师归纳总结 - - - - - - -第 1 页,共 15 页精选学习资料 - - - - - - - - - 支持向量机原理及应用学号: 13721278 姓名:章云元日期: 2022.03.07 摘要: 支持向量机是从统计学进展而来的一种新型的机器学习方法,在解决小样本、非线性和
2、高维的 机器学习问题中表现出了很多特有的优势,但是,支持向量机方法中也存在着一些亟待解决的问题,主要包括:如何用支持向量机更有效的解决多类分类问题,如何解决支持向量机二次规划过程中存在的瓶颈问 题、如何确定核函数以及最优的核参数以保证算法的有效性等;本文具体介绍系统的阐述了统计学习理论、支持向量机理论以及支持向量机的主要争论热点,包括求解支持向量机问题、多类分类问题、参数优化问 题、核函数的挑选问题等;关键词: 机器学习;统计学习理论;SVM;VC 维;The principle and application of Support Vector Machine ABSTRACT : SVMS
3、upport Vector Machine is a novel method of machine learning evolving from Statistics. SVM presents many own advantages in solving machine learning problems such as small samples, nonlinearity and high dimension. However, SVM methods exist some problems need to be resolved, mainly including how to de
4、al with multi-classification effectively, how to solve the bottle-neck problem appearing in quadratic programming process, and how to decide kernel function and optimistical kernel parameters to guarantee effectivity of the algorithm.This paper has introduced in detail the structure, evolvement hist
5、ory, and kinds of classification of machine learning, and demonstrated system SLTStatistical Learning Theory, SVM and research hotspots of SVM, including seeking SVM problems, multi-classification, parameters optimization, kernel function selection and so on. Keywords: Machine learning, SLT, SVM, VC
6、 dimension 1. 引言1.1 支持向量机争论背景及意义随着支持向量机的不断进展,人们对支持向量机的争论也越来越细化,其主要争论方向大致可分为:求解支持向量机问题,支持向量机多类分类问题,参数的挑选和优化问题等;求解一个 SVM问题最终都转化为解一个具有线性约束的凸规划问题或其对偶问题的二次规划问题 Quadratic Programming,QP;传统的方法是利用标准二次型优化技术解决对偶问题, 这就导致算法的训练速度很慢,一方面是由于SVM需要运算和储备核函数矩阵,当样本规模较大时必定导致内存需求增加;另一方面,SVM在二次寻优过程中要进行大量的矩阵运算, 多数情形下, 寻优算法占
7、用了大部分的算法时间,这就使得储备空间和和运算时间成了求解二次规划问题的瓶颈;常用的解决方法是将一个大的二次规划问题转化为如干个小名师归纳总结 的二次规划问题以提高分类效率,如块算法、分解算法、SMO算法、增式算法等等;如船舰第 2 页,共 15 页支持向量机分类理论是针对两类分类问题提出的,然而, 现实世界的分类问题,- - - - - - -精选学习资料 - - - - - - - - - 识别、 字体识别、人脸识别等,都属于多类分类的范畴;如何将二类分类方法扩展到多类分类情形是支持向量机方法争论的重要内容之一;目前,用 SVM解决多类分类问题方法主要是通过构造或组合多个两类分类器来实现多
8、类问题的分类;子分类器的构造和组合将两类分类 扩 展 到 多 类 问 题 , 将 多 类 分 类 问 题 逐 步 转 化 为 两 类 分 类 问 题 ; 常 用 的 算 法 有“ one-against-one” 方法、“one-against-rest” 方法、“ 基于决策树的方法” 等;也加快了支持向量机方法的 支持向量机多类分类方法的引入拓展了支持向量机的应用范畴,改进和创新, 同时,支持向量机的核函数的挑选以及核参数的挑选也是一个重要的争论方向;2. 支持向量机的原理 支持向量机 Support Vector Machine ,SVM是由 Vapnik 及其合作者共同制造与进展起来的一
9、种新的机器学习方法,其核心内容在 2.1 统计学习理论1992 年至 1995 年间提出的;统计学习理论建立在一套较为坚实的理论基础之上,为解决有限样本的学习问题供应了一个统一的框架; 它能将很多现有的方法纳入其中,比如神经网络的结构挑选问题、局部最小点问题等;2.1.1 机器学习问题有望帮忙解决很多原先难以解决的问题,机器学习问题 1 可以看作是通过某种训练方法,对某一系统的输入与输出之间的依靠关系进行估量,并且期望这一估量可以对任意给定输入尽量精确地进行输出猜测;一般地,机器学习问题可以表示为:假设变量 y 与 x 之间存在肯定的未知依靠关系,即遵循某一未知的联合概率 F x y x 和
10、y 之间的确定性关系可以看作是其特例 ,机器学习问题就是依据n 个独立同分布观测样本 x y 1 , x 2 , y 2 ,., x n , y n,在一组函数 f x , 中求一个最优的函数 f x , a 对依靠关系进行估量,使得期望风险最小;R L y f x , dF x y 2-1 其中 f x , 称作猜测函数集,为函数的广义参数,f x , 可以表示任何函数集;L y f x , 为由于用 f x , 对 y 进行猜测而造成的缺失,不同类型的学习问题有不同形式的缺失函数;在上面问题的表述中,学习的目标在于使期望风险最小化,但是, 由于可以利用的信息只有样本最初的观测样本 x y
11、1 1 , x 2 , y 2 ,., x n , y n,因此,期望风险 2-1 是无法运算的;传统的学习方法是采纳了所谓体会风险最小化ERM准就 11 ,即用样本定义体会风险名师归纳总结 R emp1nLy i,fx i, 2-2 第 3 页,共 15 页n1- - - - - - -精选学习资料 - - - - - - - - - 来靠近3-1 定义的期望风险,用对参数求体会风险R emp的最小值代替求期望风险R 的最小化,这就是所谓的体会风险最小化原就;2.1.3 VC 维理论模式识别方法中 VC 维的直观定义是:对一个指示函数集,假如存在h个样本能够被函数集中的函数按全部可能的 2
12、h 种形式分开,就称函数集能够把 h个样本打散;函数集的 VC维就是它能打散的最大样本数目 h ;如对任意数目的样本都有函数能将它们打散,就函数集的 VC维是无穷大;VC 维反映了函数集的学习才能,VC 维越大就学习机器越复杂 容量越大 ;遗憾的是,目前尚没有通用的关于任意函数集 VC维运算的理论,只确定了一些特别的函数集的 VC维;比如在n维实数空间中线性分类器和线性实函数的 VC维是 n 1,对于一些比较复杂的学习机器 如神经网络 ,其 VC 维除了与函数集 神经网结构 有关外,仍受学习算法等的影响,其确定更加困难;但是,在实际应用统计学习理论时,可以通过变通的方法奇妙地躲开直接求 VC维
13、的问题;2.1.4 推广性的界统计学习理论系统地争论了对于各种类型的函数集,体会风险和实际风险之间的关系,即推广性的界;关于两类分类问题,结论是:对指示函数集中的全部函数 包括使体会风险最小的函数 ,体会风险R emp和实际风险 R之间以概率 1满意如下关系:RR emphln 2n hn1ln4 2-3 其中 h 是函数集的 VC 维, n 是样本数;这一结论从理论上说明白学习机器的实际风险是由两部分组成的:一是体会风险 训练误差 ,另一部分称作置信范畴,它和学习机器的 示为:VC维及训练样本数有关,可以简洁地表RR emph n 2-4 它说明,在有限训练样本下,学习机器的VC维越高 复杂
14、性越高 就置信范畴越大,导致真名师归纳总结 实风险与体会风险之间可能的差别越大,这就是为什么会显现过学习现象的缘由;机器学习第 4 页,共 15 页过程不但要使体会风险最小,仍要使 VC 维尽量小以缩小置信范畴,才能取得较小的实际风险,即对将来样本有较好的推广性,这一理论可以由图2.1 说明;- - - - - - -精选学习资料 - - - - - - - - - 图 2.1 置信范畴、体会风险与实际风险之间的关系由图 2.1 可以看出,当样本数目 n 固定,算法的 VC 维增大时,它对给定训练样本集合有更强的分类或拟合才能,导致了更小的体会风险 R emp,甚至使它为零;但是,VC 维增大
15、时,h n 也随之增大,即放大了置信范畴,从而减小了算法具有小的实际风险 R 的可能性;反之,如 VC 维缩小,那么它对给定的训练样本集合的分类或拟合才能减弱,导致了大的体会风险,此时,虽然置信区间h n 缩小了,但仍不能保证获得小的实际风险;可以看出 n 固定时R emp与h n 是一对冲突体, 它们不行能同时都减小,但的确存在某个 h 值使实际风险上界达到最小值;2.1.5 结构风险最小化原就体会风险最小化原就是目前绝大多数模式识别方法的基础,其定义为训练集上的平均错误率, 用于对整个样本集的期望风险进行估量,它建立在样本数目足够多的前提下,致使各种方法只有在样本数趋向无穷大时,其性能才有
16、理论上的保证;而在现实世界的应用中,这一前提并不总能被满意,这时大多数此类方法都难以取得抱负的结果;由 2.1.4节中的推广性的界可以看出,影响期望风险上界的因子有两个方面:第一是训练集的规模 n ,其次是 VC 维 h ;可见,在保证分类精度 体会风险 的同时,降低学习机器的 VC 维,可以使学习机器在整个样本集上的期望风险得到掌握,这就是结构风险最小化名师归纳总结 Structure Risk Minimization,简称 SRM的由来;把函数第 5 页,共 15 页由 VC 维的争论可以看到,体会风险和期望风险依靠于学习机器函数族的挑选;集sfx ,分解为一个函数子集序列s 1s 2.
17、s k. 2-5 使各个子集能够依据置信范畴的大小排序,即- - - - - - -精选学习资料 - - - - - - - - - h 1h 2.h k 2-6 所谓结构风险最小化,便是构造一组嵌套的函数子集,使得其 VC 维由内向外依次递增,然后在其上查找体会风险和置信范畴之和最小的子集,从而使得实际风险的上界最小化,如图 2.2 所示图 3.2 结构风险最小化示意图基于结构风险最小化准就的统计学习理论是一种特地争论小样本的统计理论,它为争论有限样本情形下的统计模式识别,并为更广泛的机器学习问题建立了一个较好的理论框架,同时也进展出了一种新的模式识别方法支持向量机,问题;2.2 支持向量机
18、理论从而能够较好地解决小样本的学习SVM方法是由Vapnik 及其合作者Boser 、Guyon、Cortes 及 Scholkopf在 AT&TBell 实验室共同制造与进展起来的一种新的学习方法;近年来, 很多关于 SVM方法的争论, 包括算法本身的改进和算法的实际应用,都间续被提了出来,其中在理论上主要以 Vapnik 及其研究小组做了大量开创性及奠基性的工作;目前 SVM正处于不断进展阶段,现在已经成为机器学习领域的标准工具之一;支持向量机是个三层网络结构,是一个多输入、单输出的学习机器,其体系结构如图2.3 所示名师归纳总结 - - - - - - -第 6 页,共 15 页精选学习
19、资料 - - - - - - - - - 图 2.3 支持向量机的体系结构其中,位于体系结构最底层的x x 2,x3,.,x 是输入样本,K x xi1,2,.,n 是样本 x与支持向量在特定空间的内积,ii1,2,.,n 是拉格朗日乘子,fx 是决策函数的输出;图 3.3 清楚的表示出支持向量机的规律概念框架,第一确定训练样本作为支持向量机的输入, 然后挑选适当的核函数,将样本从输入空间映射到高维的特点空间,依据优化问题求解出来的支持向量最终得到相应的决策函数;它与传统的神经网络的最大区分在于:神经网络结构的确定大多是凭体会选取的,有肯定的盲目性,无法确定泛化的置信空间界限,所以无法保证网络
20、的推广才能,简洁显现过学习的现象;而支持向量机网络通过结构化风险最小化归纳原理掌握学习单元的 VC 维的上界, 限制了学习单元的才能,在肯定程度上防止了过学习现象;支持向量机是建立在统计学习理论的VC 维理论和结构风险最小化原理基础上的,依据有限的样本信息在模型的复杂性和学习才能之间寻求正确折衷,以期获得最好的推广才能;支持向量机被看作是对传统分类器的一个好的进展,在解决小样本、 非线性和高维的机器学习问题中表现出了很多特有的优势;概括的说, 支持向量机是以查找最优分类面为目标、以二次规划为手段、 以非线性映射为理论基础的统计学习方法;持向量机理论进行系统的阐述;2.2.1 最优分类面下面将分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年支持向量机综述 2022 支持 向量 综述
限制150内