SVM支持向量机基本原理及应用.pptx
《SVM支持向量机基本原理及应用.pptx》由会员分享,可在线阅读,更多相关《SVM支持向量机基本原理及应用.pptx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、OutlineSVM的理论基础线性判别函数和判别面最优分类面支持向量机SVM的研究与应用第1页/共37页SVM的理论基础的理论基础传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。推广能力推广能力是指:将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。第2页/共37页过学习问题“过学习问题过学习问题”:某些情况下,当训练误差过小反而会导致推广
2、能力的下降。例如:对一组训练样本(x,y),x分布在实数范围内,y取值在0,1之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0.第3页/共37页SVM根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。Vapnik 提出的支持向量机(Support Vector Machine,SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一
3、些传统的学习方法。形成时期在19921995年。第4页/共37页SVM由于SVM 的求解最后转化成二次规划问题的求解,因此SVM 的解是全局唯一的最优解SVM在解决小样本、非线性及高维模式识别问在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中到函数拟合等其他机器学习问题中Joachims 最近采用SVM在Reuters-21578来进行文本分类,并声称它比当前发表的其他方法都好第5页/共37页OutlineSVM的理论基础线性判别函数和判别面最优分类面支持向量机SVM的研究与应用第6页/共37页线
4、性判别函数和判别面线性判别函数和判别面一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数 两类情况:对于两类问题的决策规则为如果g(x)0,则判定x属于C1,如果g(x)0;当x点在超平面的负侧时,g(x)0,则判定x属于C1,如果g(x)0,则判定x属于C2,如果g(x)=0,则可以将x任意分到某一类或者拒绝判定。第14页/共37页广义线性判别函数广义线性判别函数第15页/共37页广义线性判别函数广义线性判别函数第16页/共37页设计线性分类器设计线性分类器 第17页/共37页Fisher线性判别方法线性判别方法如:Fisher线性判别方法,
5、主要解决把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维。然而在d维空间分得很好的样本投影到一维空间后,可能混到一起而无法分割。但一般情况下总可以找到某个方向,使得在该方向的直线上,样本的投影能分开的最好。目的是降维,在低维空间中分割第18页/共37页OutlineSVM的理论基础线性判别函数和判别面最优分类面支持向量机SVM的研究与应用第19页/共37页最优分类面 SVM 是从线性可分情况下的最优分类面发展而来的,基本思想可用图2的两维情况说明.图中,方形点和圆形点代表两类样本,H 为分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SVM 支持 向量 基本原理 应用
限制150内