线性判别分析非参数判别分类方法.pptx
《线性判别分析非参数判别分类方法.pptx》由会员分享,可在线阅读,更多相关《线性判别分析非参数判别分类方法.pptx(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、线性判决u Fisher线性判决的基本思想是寻找一个最好的投影方向,当特征向量x从d维空间映射到这个方向上时,两类能最好地分开。u 这个方法实际上涉及特征维数的压缩问题。3.2线 性 分 类 器第1页/共59页分析w1方向之所以比w2方向优越,可以归纳出这样一个准则:即向量w的方向选择应能使两类样本投影的均值之差尽可能大些,而使类内样本的离散程度尽可能小。这就是Fisher准则函数的基本思路。第2页/共59页第一步:计算参量。(1)各类样本的均值向量i:(2)样本类内离散度矩阵Si:总类内离散度矩阵Sw:第二步:计算最优投影方向,并将样本往该方向上投影。第三步:决策。在投影空间内的决策准则为:
2、若yy0,则x 1,否则x 2。Fisher线性判决步骤第3页/共59页n采用类似于人认知错误、纠正错误、通过自学习改善自己认识事物本领的过程,随意确定判别函数初始值,该值在对样本分类训练过程中逐步修正直至最终确定。n 基本思想:寻找一个权向量,使规范化增广样本向量集的错分类样本数最少。感知准则函数 第4页/共59页一、基本概念1.1.线性可分性线性可分性 已知来自1和2两类的样本集x1,x2,xN,两类的线性判决函数为yi为增广样本向量,v为增广权向量。线性可分:如果存在一个线性分类器能把每个样本正确分类,即若存在一个权向量v,使得对于任何yi 1,都有vTyi0,而对于任何yi 2,都有v
3、Tyi0。规范化增广样本向量 经过这样的变换后,我们可以不考虑样本原来的类别标志,只要找到一个对全部样本zi都满足vTzi0(i=1,2,N)的权向量即可。样本的规范化第6页/共59页3.解向量和解区满足vTzi0(i=1,2,N)的权向量称为解向量。若把v看成是权向量空间中的一点,对于任一zi,vTzi=0在权向量空间确定了一个超平面,这个超平面把权空间分为两个半空间,该超平面的法向量为zi,超平面正侧的向量满足vTzi0。第7页/共59页 相应地,N个样本确定了N个超平面,每个超平面把权空间分为两个半空间。所以,满足vTzi0(i=1,2,N)的权向量必在这N个超平面正侧的交叠区,称这一交
4、叠区为解区,解区中的任意向量都是解向量v*。第8页/共59页二、感知准则函数感知准则函数方法利用错分类对现决策权向量进行修正直至收敛。这种方法只对线性可分情况适用,并且只适用于两类判决。感知准则函数方法的思路是:先随意找一个初始向量v,写作v(0),然后用训练样本集中的每个样本来计算。一旦发现有的zi,使vTzi0,则引入余量后的解区在原解区之内。将上式写成矩阵形式即为 第12页/共59页定义误差向量:定义平方误差准则函数:Js(v)是一个非负函数,当 有解时,Js(v)达到最小值0,此时的矢量v*满足:v*能将所有样本正确分类。若v*不能使某个样本zj正确分类,即(v*)Tzjbj,则e2j
5、=(vTzjbj)2。错分样本的结果是使Js(v)增大,因此,Js(v)越小越好,其最小值0为理想分类结果,实现所有样本的正确分类。求使Js(v)最小的v*有两种方法:梯度下降法和解析法。第13页/共59页1.1.梯度下降法对Js(v)求梯度(3-(3-78)78)相应地,梯度下降算法为 其中,k为学习速率;初值v(0)(0)可任意选取。第14页/共59页2.解析法解析法得到的是伪逆解。令Js(v)=0得(3-79)其中(3-80)ZTZ为(d+1)(d+1)方阵,一般是满秩的,因此有唯一解:(3-81)是Z的左逆矩阵,Z的右逆矩阵定义为(3-82)b的典型值为 第15页/共59页3.3 分段
6、线性分类器 线性分类器的分界面是一个超平面。当类与类之间不能用任何一个超平面实现划分时,类间的分界面应是一个超曲面。曲线可以由多个线段近似表达,曲面可以由多个平面逼近,因此,可以用多个超平面近似表达超曲面,分段线性分类器正是基于这种思路而设计的一种分类器。第16页/共59页u线性判决函数只能解决线性可分问题。u在线性不可分的情况下,可以采用分段线性判别或二次函数判别等方法。u分段线性判决函数确定的决策面是由若干段超平面组成的。分段线性分类器的定义第17页/共59页 与线性判别函数相比,分段线性判别函数设计中首先要解决的问题是分段线性判别函数的分段段数问题。u分段段数过少,其分类效果必然要差;但
7、段数又要尽可能少,以免分类判别函数过于复杂,增加分类决策的计算量。u在有些实际的分类问题中,同一类样本可以用若干个子类来描述,这些子类的数目就可作为确定分段段数的依据。u在有些情况下样本分布及合适子类划分并不知道,往往需要采用一种聚类的方法,设法将样本划分成相对密集的子类,然后用各种方法设计各段判别函数。第18页/共59页把属于类i的样本区域Ri分为li个两两不相交的子区,对每个子类定义一个线性判决函数:定义类i的判别函数:判决准则为 若 ,则x j 称gi(x)(i=1,2,m)为分段线性判决函数,相应的分类器称为分段线性分类器。第19页/共59页当类由多个子类构成时,其决策面方程是由各子类
8、的判决函数确定的,若第i类的第n个子类和第j类的第k个子类相邻,则该段决策面方程为 其中,n 1,2,li,k 1,2,lj,li和lj分别表示第i类和第j类的子类数目。第20页/共59页分段线性距离分类器 正态分布条件下,两类别问题在各特征统计独立、同方差、且先验概率相等情况下,最小错误率决策可按最小距离决策,最小距离分类器的判决函数为即这时类间的决策面为 它是两类均值点连线的垂直平分面。第21页/共59页显然最小距离判别方法只有在各类别密集地分布在其均值附近时才有效。最小距离分类器两类物体在特征空间的分布n 对右图所示的情况按最小距离计算,就会将原来类的x决策成2类,如不对类进行子类划分,
9、或采用别的决策就不会取得好的效果。第22页/共59页u右图所示情况,若企图再用每类一个均值代表点产生最小距离分类器,就会产生很明显的错误率。u在这种情况下,可以将各类别划分成相对密集的子类,每个子类以它们的均值作为代表点,然后按最小距离分类,可以有比较满意的效果。u 对样本进行子类的合适划分是分段线性距离分类器性能好坏的一个关键问题。分段线性距离分类器示意图第23页/共59页归纳起来,如果对于i有li个子类,则有li个代表点,或者说将类i的样本区域Ri分为li个子区:其中,。用mli表示Rli中的均值向量,并以此作为该子区的代表点,确定判别函数:则判决准则为 若,则x j 称这种分类器为分段线
10、性距离分类器。第24页/共59页注意:线性距离分类器使用的是马氏距离,分段线性距离分类器使用的则是欧几里德距离,由最小距离分类器的导出过程可知,仅当所有子区的协方差阵相同且等于2I时,才具有较好的分类效果。第25页/共59页设计分段线性分类器的前提条件是有一组已知类别的样本集,其关键在于解决以下两个问题:(1)根据样本集确定子类数目及各子类的划分;(2)利用样本集计算各子类判别函数的权向量和阈值权。根据已知条件的不同,可以分别采取不同的方法。分段线性分类器设计的一般考虑(1)子类数目及各子类划分已知;(2)子类数目已知,各子类划分不知;(3)子类数目未知。第26页/共59页u最初的近邻法是由C
11、over和Hart于1968年提出的,是非参数法中最重要的方法之一。u最小距离分类器将各类训练样本划分成若干子类,并在每个子类中确定代表点,一般用子类的均值或邻近均值的某一样本为代表点。实质就是将样本判属于与代表点距离最近的类。u该法的缺点是所选择的代表点并不一定能很好地代表各类,其后果将使错误率增加。3.4 近邻分类器第27页/共59页最近邻法一、最近邻法的原理及判决准则u近邻法的基本思想:以全部训练样本作为“代表点”,计算测试样本与这些“代表点”,即所有样本的距离,并以最近邻者的类别作为决策。u其主要特点就是将样本判属它的最近邻(和它距离最近的代表点)所在的类。第28页/共59页 假定有m
12、个类别1,2,m的模式识别问题,每类有Ni(i=1,2,m)个样本,规定类i的判别函数为其中,表示第i类的第k个元素。判决准则:若,则x j 第29页/共59页第30页/共59页二、错误率分析u最近邻法的错误概率比最小错误概率判决准则的错误概率要大,但是当样本数目无限时,它的错误概率不会超过后者的错误概率的一倍。u假设近邻分类器的渐近平均错误概率为P,最小错误概率判决准则的错误概率为P*e,那么它们之间存在如下关系:其中m为类别数,PN(e)是当样本数为N 时近邻分类器的平均错误概率。第31页/共59页图中曲线与直线分别是近邻法分类器当N时渐近平均错误概率的上、下界,具体的P落在图中阴影区内。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 判别分析 参数 判别 分类 方法
限制150内