支持向量机分析ppt课件.ppt
《支持向量机分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《支持向量机分析ppt课件.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。第五章 支持向量机“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。内容提要n1 引言n2 统计学习理论n3 线性支持向量机n4 非线性支持向量机n5 支持向量回归n6 支持向量聚类“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为
2、重点的“群众性治安防控工程”。1 引言引言一一. SVM (Support Vector Machine)的历史的历史n神经网络分类器,Bayes分类器等是基于大样本大样本学习的分类器。nVapnik 等从19601960年开始关于统计学习理论统计学习理论的研究。统统计学习理论计学习理论是关于小样本小样本的机器学习理论。n19921992年支持向量机支持向量机首次被引入。19951995年Vapnik发展了支持向量机支持向量机理论。支持向量机支持向量机是基于统计学习理论统计学习理论的一种实用的机器学习机器学习方法。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化
3、为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。二二. SVM 的发展的发展 SVM理论的发展理论的发展: 最小二乘支持向量机(LS SVM) 多分类支持向量机(M-SVM) 支持向量回归(SVR) 支持向量聚类(SVC) SVM与计算智能的融合与计算智能的融合: 神经网络+支持向量机 模糊逻辑+支持向量机 遗传算法+支持向量机 小波分析+支持向量机 主分量分析+支持向量机 粗糙集理论+支持向量机“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程
4、”。三三. SVM的应用的应用 数据与文本分类 系统建模及预测 模式识别(图像及语音识别,生物特征识别) 异常检测(入侵检测,故障诊断) 时间序列预测“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。2 统计学习理论统计学习理论 一一. 两分类问题两分类问题n给定 l 个观测值: , i = 1, 2, ., l Rnn 每个观测值与一个标记相连: , i = 1, 2, ., l 土土1 n对于 (2-类) 分类, 建立一个函数: : 表示函数的参数 使得 f 能正确地分类未学
5、习过的样本iy 1 R :nfixixiy第 2 类第 1 类“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。二二.期望风险与实验风险期望风险与实验风险n期望风险最小化期望风险最小化 其中 x, y的联合概率 P(x, y) 是未知的n实验风险最小化实验风险最小化 实验风险是由在训练集上测得的平均误差所确定的n如果训练样本的个数是有限的,则实验风险最小化的方法不保证有高推广能力 liiiempxfylfR1 21 yxdPxfyfR,21“雪亮工程是以区(县)、乡(镇)、村(社
6、区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。三三. VC理论理论VC (Vapnik-Chervonenkis)维数维数n分类函数 的集合F的VC维数 p=VCdim(F) 定义 (VapnikChervonenkis). 函数 的集合F的VC 维数是p, 当且仅当存在点集 xipi=1 使得这些点能够被所有 2p 种可能的分类方式分开,且不存在集合 xiqi=1 ( q p )满足这一性质。n在 n 维空间中,超平面集合的VC维数等于n + 1 。nVC维数刻画了“可能近似正确”意义上的学习能力。ff“雪亮工程
7、是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例:VC维数“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。四四. 结构风险最小化结构风险最小化 VC 理论引入期望风险的边界, 它依赖于实验风险与 F的能力。
8、n这些边界的最小化导出结构风险最小化原理结构风险最小化原理:实验风险与实验风险与 VC 可信度之和可信度之和为最小为最小其中其中 h 与与VC 维数有关维数有关,是能力概念的一种测度是能力概念的一种测度n支持向量机是基于结构风险最小化原理支持向量机是基于结构风险最小化原理构造的一种学习机构造的一种学习机) 4/(log) 1)/2(log()()(lhlhfRfRemp“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。3 线性支持向量机线性支持向量机一一. 两分类问题两分类问题:
9、 线性分割情形线性分割情形第 1 类第 2 类n许多决策边界可以分割这许多决策边界可以分割这些数据点出为两类些数据点出为两类 n我们选取哪一个我们选取哪一个?“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。坏的决策边界的例子坏的决策边界的例子第 1 类第 2 类第 1 类第 2 类“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。好的决策边界好的决策边界: 间隔大
10、间隔大n决策边界离两类数据应尽可能远 n最大化间隔 m第 1 类第 2 类m“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。二二. 最优化问题最优化问题n设 x1, ., xn 为数据集, yi 1,-1 为xi 的类标记要求决策边界正确地分类所有的点 于是得到一个带有约束的优化问题“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。将上述最优化问题转换成其对偶问题
11、对偶问题:取Lagrange函数 (w,b;)=1/2w2 n i=1 i (yi(w,xi)+b 1)则对偶问题由 max W()=max (minw,b (w,b;)给出。由 minw,b (w,b;) 得 / b=0 n i=1 iyi=0 / w =0 w=n i=1 iyixi“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。于是得到于是得到对偶问题对偶问题n这是一个二次规划二次规划 (QP) 问题问题n i的全局最大值总可以求得nW的计算“雪亮工程是以区(县)、乡(镇
12、)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。解得*=argmin 1/2n i=1n i=1 i jyiyj n k =1 k w*=n i=1 iyixi, b *=1/2其中Xr 与xs满足 xr,xs 0, yr= 1,ys=1 则 f(x)= sgn( +b)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。三三. 解的性质解的性质n许多的许多的 i 为零为零nw 只是少数数据的线
13、性组合n具有非零 i 的 xi 称为支持向量支持向量 (SV)n决策边界仅由SV确定 n设 tj (j=1, ., s) 为支持向量的指标,于是 n为了检测一个新数据为了检测一个新数据 zn计算 如果 WTZ+ b 0, 则 z 属于第一类;否则,属于第二类。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。6=1.4四四. 几何解释几何解释第1类第2类1=0.82=03=04=05=07=08=0.69=010=0“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平
14、台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。4 非线性支持向量机线性支持向量机 一一. 非线性分割问题非线性分割问题“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。n关键思想关键思想: 为了解决非线性分割问题, 将 xi 变换到一个高维空间。 n输入空间: xi 所在的空间n特征空间: 变换后 f(xi) 的空间n如何变换如何变换 ?n利用一个适当的变换f, 使分类变得容易些。 n特征空间中的线性算子等价于输入空间中的非
15、线性算子。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。n变换可能出现的问题变换可能出现的问题n难以得到一个好的分类且计算开销大nSVM同时解决这两个问题同时解决这两个问题 n最小化 |w|2 能得到好的分类n利用核函数技巧可以进行有效的计算 f( )f( )f( )f( )f( )f( )f( )f( )f()f( )f( )f( )f( )f( )f( )f( )f( )f( )f( )特征空间输入空间“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、
16、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。n变换举例变换举例 定义核函数定义核函数 K (x,y) 如下如下 考虑下列变换考虑下列变换n内积可由内积可由 K 计算计算, 不必通过映射不必通过映射 f f()计算计算“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。二二. 核函数技巧核函数技巧n核函数 K 与映射 f(.) 之间的关系是n作为核函数技巧这是已知的n在应用中, 我们指定K, 从而间接地确定 f() ,以代替选取f
17、() 。n直观地, K (x,y) 表示我们对数据 x 和 y 之间相似性的一种描述, 且来自我们的先验知识 。n为了f() 存在, K (x,y) 需要满足 Mercer 条件。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。n核函数举例核函数举例nd 阶多项式核阶多项式核n具有宽度具有宽度 s s的径向基函数核的径向基函数核n相当接近于径向基函数神经网络n具有参数具有参数 k k and q q 的的Sigmoid 核核n对所有的k 和 q,它不满足 Mercer 条件 “
18、雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。三三.非线性非线性SVM算法算法n将所有的将所有的内积改为核函数内积改为核函数 n训练算法训练算法:线性的线性的 非线性的非线性的“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。n检测算法检测算法:线性的线性的非线性的非线性的n 对于一个新数据对于一个新数据z ,如果如果f 0,则分到第则分到第1类;类; 如果如果
19、f0,则分到第,则分到第2类类。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。例题例题 设有设有 5个个 1 维数据点维数据点: x1=1, x2=2, x3=4, x4=5, x5=6, 其中1, 2, 6 为第1类,而4, 5 为第2类 y1=1, y2=1, y3=-1, y4=-1, y5=1。n利用利用 2 阶多项式核阶多项式核nK(x,y) = (xy+1)2nC 取为 100n先求先求 i (i=1, , 5) :“雪亮工程是以区(县)、乡(镇)、村(社区)三级
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 支持 向量 分析 ppt 课件
限制150内