模式识别_第6章_近邻法.ppt
《模式识别_第6章_近邻法.ppt》由会员分享,可在线阅读,更多相关《模式识别_第6章_近邻法.ppt(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 1第第6 6章章 近邻法近邻法6.1最近邻法最近邻法,k近邻法近邻法6.2误判概率上下界误判概率上下界6.3 改进的近邻法改进的近邻法2 2BayesBayes方法需要借助概率密度函数估计。可以看出,其方法需要借助概率密度函数估计。可以看出,其方法需要借助概率密度函数估计。可以看出,其方法需要借助概率密度函数估计。可以看出,其应用受到很大限制。事实上,非参数模式识别方法更为应用受到很大限制。事实上,非参数模式识别方法更为应用受到很大限制。事实上,非参数模式识别方法更为应用受到很大限制。事实上,非参数模式识别方法更为实用。由于能解决许多实际的模式识别问题,虽然在许实用。由于能解决许多实际的模
2、式识别问题,虽然在许实用。由于能解决许多实际的模式识别问题,虽然在许实用。由于能解决许多实际的模式识别问题,虽然在许多情况下它们不是最优的,但却是应用的最多的有效的多情况下它们不是最优的,但却是应用的最多的有效的多情况下它们不是最优的,但却是应用的最多的有效的多情况下它们不是最优的,但却是应用的最多的有效的方法。统计模式识别中常用的基本非参数方法除了前面方法。统计模式识别中常用的基本非参数方法除了前面方法。统计模式识别中常用的基本非参数方法除了前面方法。统计模式识别中常用的基本非参数方法除了前面介绍的线性判别函数外,介绍的线性判别函数外,介绍的线性判别函数外,介绍的线性判别函数外,还有将要介绍
3、的近邻法和聚类。还有将要介绍的近邻法和聚类。还有将要介绍的近邻法和聚类。还有将要介绍的近邻法和聚类。近邻法属于有监督学习,聚类属于无监督学习。近邻法属于有监督学习,聚类属于无监督学习。近邻法属于有监督学习,聚类属于无监督学习。近邻法属于有监督学习,聚类属于无监督学习。它是在它是在它是在它是在已知模式类别的训练样本的条件下,绕开概率的估计,已知模式类别的训练样本的条件下,绕开概率的估计,已知模式类别的训练样本的条件下,绕开概率的估计,已知模式类别的训练样本的条件下,绕开概率的估计,按最近距离原则对待识别模式直接进行分类。按最近距离原则对待识别模式直接进行分类。按最近距离原则对待识别模式直接进行分
4、类。按最近距离原则对待识别模式直接进行分类。3 3近邻法近邻法最近邻分类器最近邻分类器最近邻分类器最近邻分类器(nearest neighborhood classifier,(nearest neighborhood classifier,nncnnc):最小距离分类器的一种极端的情况,最小距离分类器的一种极端的情况,最小距离分类器的一种极端的情况,最小距离分类器的一种极端的情况,以全部训练样以全部训练样以全部训练样以全部训练样本作为代表点本作为代表点本作为代表点本作为代表点,计算测试样本与所有样本的距离,计算测试样本与所有样本的距离,计算测试样本与所有样本的距离,计算测试样本与所有样本的距
5、离,并以最近邻者的类别作为决策。并以最近邻者的类别作为决策。并以最近邻者的类别作为决策。并以最近邻者的类别作为决策。最初的近邻法是由最初的近邻法是由最初的近邻法是由最初的近邻法是由CoverCover和和和和HartHart于于于于19681968年提出的,随年提出的,随年提出的,随年提出的,随后得到理论上深入的分析与研究,后得到理论上深入的分析与研究,后得到理论上深入的分析与研究,后得到理论上深入的分析与研究,是非参数法是非参数法是非参数法是非参数法中最中最中最中最重要的方法之一。重要的方法之一。重要的方法之一。重要的方法之一。4 4c c类问题类问题,设设最近邻方法最近邻方法6.1 最近邻
6、决策规则最近邻决策规则1-NN1-NN最近邻分类规则最近邻分类规则:对待识别模式对待识别模式 ,分别计算它与分别计算它与个已知类别的样本个已知类别的样本 的距离的距离,将它判为距离最将它判为距离最近的那个样本所属的类。近的那个样本所属的类。如果如果则则即即5 5最近邻方法最近邻方法6.1 最近邻决策规则最近邻决策规则1-NN1-NN(1)(1)已知已知N N个已知个已知类别样本类别样本X X(2)(2)输入未知类别输入未知类别样本样本x x(3)(3)计算计算x x到到x xi i X X,(i=1,(i=1,2,2,N),N)的的距离距离d di i(x(x)(4)(4)找出最小距离找出最小
7、距离d dm m(x(x)=)=mindmindi i(x(x)(5)(5)看看x xm m属于哪属于哪一类:一类:x xm m 2 2(6)(6)判判x x 2 26 6k-NNk-NN分类思想分类思想:对待识别模式对待识别模式 ,分别计算它与分别计算它与个已知类别的样本个已知类别的样本 的距离的距离,取取k k个最近邻样本个最近邻样本,这这k k个样本中哪一类最多个样本中哪一类最多,就判属哪一类就判属哪一类。最近邻方法最近邻方法6.1 最近邻决策规则最近邻决策规则k-NNk-NN即即,令令 与与i i的距离的距离如果如果则则其中其中 表示表示k k个近邻元中属于个近邻元中属于i i的样本个
8、数的样本个数7 7最近邻方法最近邻方法6.1 最近邻决策规则最近邻决策规则k-NNk-NN(1)(1)已知已知N N个已知个已知类别样本类别样本X X(2)(2)输入未知类别输入未知类别样本样本x x(6)(6)判判x x 2 2(4)(4)找出找出x x的的k k个最近邻个最近邻元元X Xk k=x xi i,i,i=1,2,=1,2,k,k(5)(5)看看X Xk k中属于哪一类的样中属于哪一类的样本最多本最多k k1 1=3k=3k2 2=4=4(3)(3)计算计算x x到到x xi i X X,(i=1,(i=1,2,2,N),N)的的距离距离d di i(x(x)8 8下面我们先定性
9、的比较一下最近邻分类法与最小错误率下面我们先定性的比较一下最近邻分类法与最小错误率下面我们先定性的比较一下最近邻分类法与最小错误率下面我们先定性的比较一下最近邻分类法与最小错误率的的的的BayesBayes分类方法的分类能力。分类方法的分类能力。分类方法的分类能力。分类方法的分类能力。我们把我们把我们把我们把 的最近邻的最近邻的最近邻的最近邻 的类别看成是一个随机变量的类别看成是一个随机变量的类别看成是一个随机变量的类别看成是一个随机变量 ,的概率为后验概率的概率为后验概率的概率为后验概率的概率为后验概率最近邻法错误率分析最近邻法错误率分析9 9按最小错误率的按最小错误率的按最小错误率的按最小
10、错误率的BayesBayes决策法则:以概率决策法则:以概率决策法则:以概率决策法则:以概率1 1决策决策决策决策 ;按最近邻决策法则:以概率按最近邻决策法则:以概率按最近邻决策法则:以概率按最近邻决策法则:以概率 决策决策决策决策 ;最近邻法则可以看成是一个随机化决策最近邻法则可以看成是一个随机化决策最近邻法则可以看成是一个随机化决策最近邻法则可以看成是一个随机化决策 按照概率按照概率按照概率按照概率 来决定来决定来决定来决定 的类别。的类别。的类别。的类别。定义:定义:定义:定义:1010这里假设在三类问题中,这里假设在三类问题中,这里假设在三类问题中,这里假设在三类问题中,的后验概率分别
11、为的后验概率分别为的后验概率分别为的后验概率分别为按最小错误率的按最小错误率的按最小错误率的按最小错误率的BayesBayes决策法则:以概率决策法则:以概率决策法则:以概率决策法则:以概率1 1决策决策决策决策 ;按最近邻决策法则:以概率按最近邻决策法则:以概率按最近邻决策法则:以概率按最近邻决策法则:以概率 决策决策决策决策 ;以;以;以;以概率概率概率概率 决策决策决策决策 。当当当当 时,最近邻法的决策结果与最小错误率的时,最近邻法的决策结果与最小错误率的时,最近邻法的决策结果与最小错误率的时,最近邻法的决策结果与最小错误率的BayesBayes决策的决策结果相同,它们的错误率都是比较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 近邻
限制150内