模式识别 第五章 统计决策中的训练、学习与错误率测试.ppt
《模式识别 第五章 统计决策中的训练、学习与错误率测试.ppt》由会员分享,可在线阅读,更多相关《模式识别 第五章 统计决策中的训练、学习与错误率测试.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 统计决策中的训练、统计决策中的训练、学习与错误率测试、估计学习与错误率测试、估计n 统计推断概述统计推断概述n 参数估计参数估计n 概密的窗函数估计法概密的窗函数估计法本章目的:已知类别的样本(训练样本)本章目的:已知类别的样本(训练样本)学习或训练学习或训练获得类概密获得类概密在上一章的学习中在上一章的学习中,我们一直假设类的条件概我们一直假设类的条件概率密度函数是已知的率密度函数是已知的,然后去设计贝叶斯分类器。然后去设计贝叶斯分类器。但在实际中,这些知识往往是不知道的,这就需但在实际中,这些知识往往是不知道的,这就需要用已知的样本进行学习或训练。也就是说利用要用已知的样本进
2、行学习或训练。也就是说利用统计推断理论中的估计方法,从样本集数据中估统计推断理论中的估计方法,从样本集数据中估计这些参数。计这些参数。5.1 统计推断概述统计推断概述如果已知如果已知iw 类的概密类的概密)(ixp wr的函数类型,即知道的函数类型,即知道iw 类的类的概型,但不知道其中的参数或参数集概型,但不知道其中的参数或参数集,可采用参数估计的方法可采用参数估计的方法,当解得这些参数,当解得这些参数 后后)(ixp wr也就确定了。也就确定了。),(21qqq=qD qmiLr确定未知参数确定未知参数参数估计参数估计参数估计有两类方法参数估计有两类方法:1.1.将参数作为非随机量处理,如
3、将参数作为非随机量处理,如矩法估计矩法估计、最大似然估计最大似然估计;2.2.将参数作为随机变量,将参数作为随机变量,贝叶斯估计贝叶斯估计就属此就属此类。类。5.1 统计推断概述统计推断概述非参数估计非参数估计5.1 统计推断概述统计推断概述当不知道类的概型时,就要采用非参数估计的当不知道类的概型时,就要采用非参数估计的方法,这种方法也称为总体推断,这类方法有:方法,这种方法也称为总体推断,这类方法有:1.p-1.p-窗法窗法2.2.有限项正交函数级数逼近法有限项正交函数级数逼近法3.3.随机逼近法随机逼近法基本概念基本概念母体(总体):母体(总体):一个模式类称为一个一个模式类称为一个总体总
4、体或或母体母体5.1 统计推断概述统计推断概述设模式空间设模式空间 是是 维的。维的。母体的母体的子样子样:一个模式类中某些模式:一个模式类中某些模式(即母体中的即母体中的 一些元素一些元素)的集合称为这个的集合称为这个母体的子样母体的子样。母体的。母体的子样含有母体的某些信息,可以通过构造子样含有母体的某些信息,可以通过构造样本样本的函数的函数来获得。来获得。统计量:统计量:一般来说,每一个样本都包含着母体的某一般来说,每一个样本都包含着母体的某些信息,为了估计未知参数就要把有用的信息些信息,为了估计未知参数就要把有用的信息从样本中抽取出来。为此,要构造训练样本的从样本中抽取出来。为此,要构
5、造训练样本的某种函数,这种函数在统计学中称为统计量。某种函数,这种函数在统计学中称为统计量。基本概念基本概念经验分布:经验分布:由样本推断的分布称为经验分布。由样本推断的分布称为经验分布。5.1 统计推断概述统计推断概述数学期望、方差等数学期望、方差等理论量(或理论分布):理论量(或理论分布):参数空间:参数空间:在统计学中,把未知参数在统计学中,把未知参数q q的可能值的的可能值的集合称为参数空间,记为集合称为参数空间,记为Q Q。点估计、估计量:点估计、估计量:针对某未知参数针对某未知参数q q构造一个统计构造一个统计量作为量作为q q的估计的估计 ,这种估计称为点估计。,这种估计称为点估
6、计。称为称为q q的估计量。的估计量。基本概念基本概念5.1 统计推断概述统计推断概述 为了准确地对某一类的分布进行参数估计或总为了准确地对某一类的分布进行参数估计或总体推断,应只使用该类的样本。体推断,应只使用该类的样本。就是说在进行参数估计时,应对各类进行独立就是说在进行参数估计时,应对各类进行独立的参数估计或总体推断。因此在以后的论述中,如的参数估计或总体推断。因此在以后的论述中,如无必要,不特别言明类别。无必要,不特别言明类别。区间估计:区间估计:在一定置信度条件下估计某一未知参数在一定置信度条件下估计某一未知参数q q的取值范围,称之为置信区间,这类估计成为的取值范围,称之为置信区间
7、,这类估计成为区间估计。区间估计。基本概念基本概念5.1 统计推断概述统计推断概述估计估计:所谓估计就是由样本所谓估计就是由样本 按按某种规则构造的一个统计量某种规则构造的一个统计量 用以代替被估参数集用以代替被估参数集 。估计量估计量 作为随机样本作为随机样本的函数,显然也是随机量的函数,显然也是随机量。无偏估计无偏估计:估计量估计量 的数学期望等于被估量的数学期望等于被估量 的数的数学期望,即对任意的学期望,即对任意的 ,有有 。估计无估计无偏性的意义在于可以用多个估计的平均近似真值偏性的意义在于可以用多个估计的平均近似真值。基本概念基本概念5.1 统计推断概述统计推断概述渐近无偏估计渐近
8、无偏估计:即即 。当不能对所当不能对所有有 的都有的都有 时,希望估计量时,希望估计量 是渐是渐近无偏估计。近无偏估计。最小方差无偏估计量:最小方差无偏估计量:在无偏估计条件下,对任意在无偏估计条件下,对任意的的 ,则称则称 是是最小方差最小方差无偏估计量无偏估计量。我们希望在无偏的基础上,估计量随。我们希望在无偏的基础上,估计量随机摆幅越小越好,即估计量的方差越小越好。机摆幅越小越好,即估计量的方差越小越好。基本概念基本概念5.1 统计推断概述统计推断概述均方收敛均方收敛:均方逼近均方逼近:均方收敛均方收敛:又称相合估计又称相合估计一致估计一致估计:当样本无限增多时,估计量当样本无限增多时,
9、估计量 依概依概率收敛于率收敛于 ,5.2 参数估计参数估计5.2.1 5.2.1 均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计5.2.2 5.2.2 最大似然估计最大似然估计(MLE)(MLE)5.2.3 5.2.3 贝叶斯估计贝叶斯估计(BE)(BE)5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计矩法估计矩法估计是用样本是用样本(的统计的统计)矩作为总体矩作为总体(理论理论)矩的估矩的估值。若类的概型为正态分布,我们用矩法估计出类的值。若类的概型为正态分布,我们用矩法估计出类的均值矢量和协方差阵后,类的概密也就完全确定了。均值矢量和协方差阵后,
10、类的概密也就完全确定了。均值矢量均值矢量:均值无偏估计均值无偏估计:5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计协方差阵协方差阵 :5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计协方差阵协方差阵:协方差阵无偏估计协方差阵无偏估计:或或5.2 参数估计参数估计设设和和是由是由个样本算得的均矢和协方差阵,个样本算得的均矢和协方差阵,则可采用则可采用递推公式递推公式进行估算进行估算若再加入一个新的样本若再加入一个新的样本初始值初始值:)(11)(1NmxNNmNrrrrrr-+=+均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩
11、法估计5.2 参数估计参数估计协方差矩阵的递推估计式协方差矩阵的递推估计式:均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计+=+-=11)1()1(11NjjjNmNmNNxxNrrrr11)(12)()(111111+=+-+-=NNNjNjjxxNxNmNNmNmNNxxNrrrrrrrr)()(11)(111NmxNmxNNCNNNNrrrr-+-=+F=-=-=)1()1()1(111111xxxxmmxxCrrrrrrrr初始值初始值:5.2 参数估计参数估计均值矢量和协方差阵的矩法估计均值矢量和协方差阵的矩法估计 矩法估计只能用于各阶矩的估计,它对于矩法估计只能用于各阶矩
12、的估计,它对于原点原点矩矩 的估计是无偏的,对的估计是无偏的,对中心矩中心矩 的估计是相合估计量。其算法简单但优良性较差,的估计是相合估计量。其算法简单但优良性较差,因此宜用于样本容量较大的情况,以保证它的优良因此宜用于样本容量较大的情况,以保证它的优良性。性。注意注意:5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate)如同如同矩法估计矩法估计一样,一样,最大似然估计最大似然估计要求要求已知已知总体的概型总体的概型,即概密的具体函数形式,它也将被,即概密的具体函数形式,它也将被估计量作为确定性的变量对待。但最大似然估计估计量作为
13、确定性的变量对待。但最大似然估计适用范围比矩法估计更宽一些,可以用于不是正适用范围比矩法估计更宽一些,可以用于不是正态分布的情况。态分布的情况。最大似然估计最大似然估计是参数估计中最重要的方法。是参数估计中最重要的方法。5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate)似然函数似然函数:当当个随机样本取定值个随机样本取定值时,时,称为相对于称为相对于的的的的似然函数似然函数。联合概密联合概密 设一个总体设一个总体的概密为的概密为,其中,其中是一个是一个未知参数集,未知参数集,妈妈新开了个淘宝店,欢迎前来捧场妈妈新开了个淘宝店,欢
14、迎前来捧场妈妈的淘宝点开了快半年了,主要卖的是毛绒玩具、坐垫、抱枕之类的,妈妈的淘宝点开了快半年了,主要卖的是毛绒玩具、坐垫、抱枕之类的,但生意一直不是很好,感觉妈妈还是很用心的,花了不少功夫,但是就是没但生意一直不是很好,感觉妈妈还是很用心的,花了不少功夫,但是就是没有人气,所以我也来出自己的一份力,帮忙宣传一下。有人气,所以我也来出自己的一份力,帮忙宣传一下。并且妈妈总是去五亭龙挑最好的玩具整理、发货,质量绝对有保证。并且妈妈总是去五亭龙挑最好的玩具整理、发货,质量绝对有保证。另外我家就在扬州五亭龙玩具城旁边,货源丰富,质量可靠,价格便宜。另外我家就在扬州五亭龙玩具城旁边,货源丰富,质量可
15、靠,价格便宜。欢迎大家来逛逛欢迎大家来逛逛【扬州五亭龙玩具总动员扬州五亭龙玩具总动员】个人小广告:个人小广告:5.2 5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(Maximum Likelihood Estimate)由于由于是概密的一个确定性的参数集是概密的一个确定性的参数集,因此因此实际上就是条件概密实际上就是条件概密 上式中不同的上式中不同的 ,将不同。将不同。如果各个如果各个是独立抽取的,则进是独立抽取的,则进一步有:一步有:5.2 5.2 参数估计参数估计最大似然估计最大似然估计(MLE)(MLE)(Maximum Likelihood Estimate)(Maxim
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 第五章 统计决策中的训练、学习与错误率测试 第五 统计 决策 中的 训练 学习 错误率 测试
限制150内