模式识别第三章优秀PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《模式识别第三章优秀PPT.ppt》由会员分享,可在线阅读,更多相关《模式识别第三章优秀PPT.ppt(125页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别第三章你现在浏览的是第一页,共125页 解决思路:解决思路:利用已知训练样本估计利用已知训练样本估计P(i),p(x/i),分类器训练的主要任务:分类器训练的主要任务:确定类概密函数确定类概密函数p(x/i)可利用信息:可利用信息:训练样本训练样本你现在浏览的是第二页,共125页任务:任务:利用利用有限的样本集有限的样本集去设计分类器。去设计分类器。1)利用样本集估计)利用样本集估计p(x/wi)和和P(wi),得到估计值,得到估计值和和2)利用)利用 、代替贝叶斯决策中的代替贝叶斯决策中的p(x/wi)和和 P(wi),完成分类器设计,完成分类器设计 希望:希望:当样本数当样本数N
2、时,时,收敛于收敛于p(x/wi)、P(wi)你现在浏览的是第三页,共125页三个要解决的主要问题:三个要解决的主要问题:1)如何利用样本集估计)如何利用样本集估计2)估计量的性质如何(希望无偏估计)估计量的性质如何(希望无偏估计)3)利用样本集进行错误率估计)利用样本集进行错误率估计你现在浏览的是第四页,共125页基本方法基本方法:1)监督参数估计:监督参数估计:样本所属类别及类条件总体概率密度函数的形式已样本所属类别及类条件总体概率密度函数的形式已知,知,未知的未知的是表征概率密度函数的是表征概率密度函数的某些参数;某些参数;例:正态分布,未知参数例:正态分布,未知参数,2,称为:称为:监
3、督参数估计监督参数估计你现在浏览的是第五页,共125页3)监督非参数估计监督非参数估计:2)非监督参数估计:非监督参数估计:已知总体概率密度函数形式,但已知总体概率密度函数形式,但未知样本所属未知样本所属类别类别,要求推断概率密度函数的某些参数;,要求推断概率密度函数的某些参数;以上都是以上都是已知已知p(x/wi)的函数形式的函数形式 已知样本所属类别,但已知样本所属类别,但未知未知p(x/wi)形式形式,直接推断,直接推断概率密度函数概率密度函数你现在浏览的是第六页,共125页3.2 3.2 参数估计中的几个基本概念参数估计中的几个基本概念(1)统计量统计量 由样本按某种规律由样本按某种规
4、律构造的函数构造的函数 或:设样本或:设样本xk(k=1,n)都含有总体信息,为估计未都含有总体信息,为估计未知参数,把有用信息抽取出来构造样本的某函数,即为统知参数,把有用信息抽取出来构造样本的某函数,即为统计量。计量。例:对正态分布,其统计量例:对正态分布,其统计量 你现在浏览的是第七页,共125页(2)参数空间参数空间:在统计学中,把未知参数在统计学中,把未知参数 的全部可取值的集合的全部可取值的集合称参数空间,记为称参数空间,记为 你现在浏览的是第八页,共125页(3)点估计、估计量和估计值点估计、估计量和估计值 构造一个统计量构造一个统计量d(x1,xN)作为某未知参数作为某未知参数
5、 的的估计估计 ,这种估计称为,这种估计称为点估计点估计在统计学中,在统计学中,称称 为为 的的估计量估计量。将属于将属于wi的样本的样本得到第得到第i类的类的 的的具体数值具体数值,称为,称为 的的估计值估计值。代入统计量代入统计量d,这种构造统计量得到参数估计量的过程,称为点估计问这种构造统计量得到参数估计量的过程,称为点估计问题。题。你现在浏览的是第九页,共125页(4)区间估计区间估计:估计某个区间(估计某个区间(d1,d2)作为未知参数作为未知参数 的可能取值范的可能取值范围,估计的区间(围,估计的区间(d1,d2)称为置信区间,这类估计)称为置信区间,这类估计称为区间估计。称为区间
6、估计。即在一定置信度条件下估计即在一定置信度条件下估计某一未知参数某一未知参数 的取值范的取值范围围,称为置信区间,这类估计称为区间估计。,称为置信区间,这类估计称为区间估计。你现在浏览的是第十页,共125页参数估计方法的主要方法参数估计方法的主要方法:最大似然估计最大似然估计贝叶斯估计贝叶斯估计最大似然估计:最大似然估计:一种常用、有效的方法一种常用、有效的方法 把待估参数看作把待估参数看作确定性的量确定性的量,最佳估计就是,最佳估计就是使训练样本的概率为最大的那个值。使训练样本的概率为最大的那个值。两种方法的结果很接近,但本质有很大差别即:使似然函数达到最大的参数值作为估计值。其中参数是确
7、定的未知量(非随机)你现在浏览的是第十一页,共125页 贝叶斯估计的典型效果就是,每得到新的观测样贝叶斯估计的典型效果就是,每得到新的观测样本,都使后验概密函数更加尖锐,使其在待估参数的本,都使后验概密函数更加尖锐,使其在待估参数的真实值附近真实值附近形成最大尖峰形成最大尖峰,这个现象称为,这个现象称为“贝叶斯学贝叶斯学习习”过程。过程。贝叶斯估计贝叶斯估计:把待估参数把待估参数 看成符合某种先验概率分布的看成符合某种先验概率分布的随机变量随机变量,对样本进行修正的过程就是把对样本进行修正的过程就是把先验概率密度转化为后验先验概率密度转化为后验概率密度概率密度的过程。的过程。你现在浏览的是第十
8、二页,共125页1 1最大似然估计最大似然估计假设假设:(前提条件):(前提条件)1 1)待估参数)待估参数是是确定的未知量确定的未知量(非随机)(非随机)2 2)按类别把样本集分为)按类别把样本集分为C C个子集:个子集:X X1 1,X X2 2,X XC C 任意一个子集任意一个子集X Xi i的样本是从总体中独立抽取的,的样本是从总体中独立抽取的,每一个样本集每一个样本集X Xi i中中样本都是独立同分布的随机变量样本都是独立同分布的随机变量你现在浏览的是第十三页,共125页3)每个类条件概密函数)每个类条件概密函数p(x/wi)的形式已知的形式已知,未知的是未知的是参数向量参数向量
9、i的值的值 为强调为强调p(x/wi)与与 i有关,记为有关,记为p(x/wi,i)4)不同类别的参数不同类别的参数 i是独立的是独立的即即 Xi中的样本不包含中的样本不包含 j(j i)的信息,的信息,只包含只包含 i的信息(的信息(Xi与与 j无关)无关)可对可对每一每一 类样本独立进行处理类样本独立进行处理,每个参数向量只,每个参数向量只由自己类别中的样本决定。由自己类别中的样本决定。下边就只利用第下边就只利用第i类学习样本来估计第类学习样本来估计第i类的概率密度,类的概率密度,忽忽略类别标志,略类别标志,即即 p(x/wi,i)p(x/)你现在浏览的是第十四页,共125页设样本子集设样
10、本子集当样本是独立抽取的,则似然函数为当样本是独立抽取的,则似然函数为定义定义:(似然函数似然函数)(当已得到同一类样本集(当已得到同一类样本集X,可略去类别下标,可略去类别下标,可写为,可写为p(X/))当当X的的N个样本确定后,个样本确定后,p(X/)只是只是 的函数,的函数,记为记为l()。你现在浏览的是第十五页,共125页最大似然估计的基本思想:最大似然估计的基本思想:例:设例:设xN(6,1),则最可能出现的样本就是,则最可能出现的样本就是x=6,即,即l()=max p(x/(6,1)=p(6/(6,1),若若 已知,已知,当从观测值中抽取样本当从观测值中抽取样本x1,x2,xN时
11、,最可时,最可能出现的样本是能出现的样本是使使l()为最大的样本为最大的样本。若若 未知,未知,X选定。不同的选定。不同的 选择,对选择,对N个样本个样本x1,x2,xN 就有不同的就有不同的p(X/)值,应选择使值,应选择使x1,x2,xN的似然函数的似然函数l()为最大的为最大的你现在浏览的是第十六页,共125页定义最大似然估计定义最大似然估计:使p(X/)达极大值的参数向量 ,就是的最大似然估计。显然使显然使 最大的最大的 是样本是样本x x1 1,x,x2 2,x,xN N的函数,的函数,记为记为你现在浏览的是第十七页,共125页计算方法:计算方法:或或若若 有有s个分量:个分量:求求
12、即即为便于分析,为便于分析,取对数形式取对数形式求导求导你现在浏览的是第十八页,共125页则:则:s个联立方程组求解个联立方程组求解,可得可得即:即:使使对数对数似然函数最大的似然函数最大的 值,也必然使似然函数最大。值,也必然使似然函数最大。是样本的函数,若样本数是样本的函数,若样本数N时,估计值时,估计值 收敛于收敛于真值真值。你现在浏览的是第十九页,共125页 注:极值解可能有多解,有全局最大解、局部极注:极值解可能有多解,有全局最大解、局部极大点和拐点等,大点和拐点等,确定最大值点确定最大值点即可。即可。按上式对按上式对所有类型进行同样操作所有类型进行同样操作,最终完成对所有,最终完成
13、对所有类型的最大似然估计。类型的最大似然估计。p(X/)你现在浏览的是第二十页,共125页例:高斯分布例:高斯分布1)已知已知,未知未知,似然函数为:似然函数为:其中,对于正态分布其中,对于正态分布你现在浏览的是第二十一页,共125页求导:求导:你现在浏览的是第二十二页,共125页令令则则 说说明明未未知知均均值值的的最最最最大大大大似似似似然然然然估估估估计计计计正正正正好好好好是是是是训训训训练练练练样样样样本本本本的的的的算术平均算术平均算术平均算术平均你现在浏览的是第二十三页,共125页2)、均未知均未知考虑一维情况(考虑一维情况(d1)令)令 1=,2=2 似然函数似然函数其中,对于
14、一维正态分布其中,对于一维正态分布你现在浏览的是第二十四页,共125页令令求导求导 则有则有你现在浏览的是第二十五页,共125页对于多元高斯函数对于多元高斯函数(d维),则有维),则有 最大似然估计结果令人满意最大似然估计结果令人满意结论:结论:的估计即为学习样本的的估计即为学习样本的算术平均算术平均估计的协方差矩阵是矩阵估计的协方差矩阵是矩阵的的算术平均算术平均(dd阵列,阵列,dd个值)个值)你现在浏览的是第二十六页,共125页一个反例:均匀分布一个反例:均匀分布 似然函数似然函数 的的解为必要条件解为必要条件(3-11式)式)不一定有解不一定有解,即:,即:(有两个需估计的(有两个需估计
15、的参数)参数)注意:注意:注意:注意:你现在浏览的是第二十七页,共125页取对数:取对数:求导:求导:极值解为无穷大,结果无意义。极值解为无穷大,结果无意义。需用其它方法找最大值。需用其它方法找最大值。你现在浏览的是第二十八页,共125页给定给定N个观察值个观察值x1,xN,由这些样本集估计,由这些样本集估计 1,2 1x3d3,窗口为一超立方体,窗口为一超立方体窗口的选择窗口的选择:有多种选择:有多种选择 方窗函数方窗函数指数窗函数指数窗函数正态窗函数正态窗函数(u)(u)(u)hN 正态窗函数正态窗函数你现在浏览的是第九十一页,共125页若选若选(u)(u)是以原点是以原点x x为中心的超
16、立方体为中心的超立方体。在在x xi i落入方窗时,则有落入方窗时,则有在在V VN N内为内为1 1不在不在V VN N内为内为0 0落入落入V VN N的样本数等于所有为的样本数等于所有为1 1者之和者之和即即你现在浏览的是第九十二页,共125页则概率密度估计:则概率密度估计:落入窗口中的样本为落入窗口中的样本为ParzenParzen窗法估计的基本公式窗法估计的基本公式 该式是一个迭加函数,使用该式是一个迭加函数,使用K KN N个以个以x xi i为中心的窗函数为中心的窗函数迭加,对迭加,对x x处的概密进行估计。每一样本处的概密进行估计。每一样本x xi i对概率密度函数对概率密度函
17、数的贡献只在一个窗口范围,离的贡献只在一个窗口范围,离x x远近不同,贡献不同,远近不同,贡献不同,是是一种内插过程一种内插过程。你现在浏览的是第九十三页,共125页 每每个个样样本本对对估估计计所所起起的的作作用用依依赖赖于于它它到到x x的的距距离离,即即|x-x|x-xi i|h|hN N/2/2时,时,x xi i在在V VN N内为内为1 1,否则为,否则为0 0。讨论:讨论:称为窗函数,取称为窗函数,取0 0,1 1两种值两种值,但有时可取但有时可取0,0.1,0.20,0.1,0.2多种数值,例如随多种数值,例如随x xi i离离x x接近的程度接近的程度,取值可由取值可由0,0
18、.1,0.20,0.1,0.2到到1 1。你现在浏览的是第九十四页,共125页为满足这两个条件,要求为满足这两个条件,要求窗函数满足窗函数满足:(保证保证 非非负)负)窗函数的选择窗函数的选择例:例:矩形窗、正态窗、指数窗、三角窗等等矩形窗、正态窗、指数窗、三角窗等等(只要满(只要满足上述两条件,都可作为窗函数使用)足上述两条件,都可作为窗函数使用)要求估计的要求估计的 应满应满足:足:你现在浏览的是第九十五页,共125页 窗窗长长度度hN对对 的的影响影响 h hN N N N又称为平滑因子又称为平滑因子,N N有限时,有限时,h hN N影响大,影响大,既影响幅度,又影响宽度既影响幅度,又
19、影响宽度若定义若定义 则则 l h hN N太大太大,是是p(x)p(x)的一个的一个平滑估计平滑估计,不能跟上不能跟上p(x)p(x)变化,变化,分辨力太低,有平均误差分辨力太低,有平均误差。若若h hN N太大太大,N N(x)(x)幅度小,而宽度拓宽,幅度小,而宽度拓宽,变得平变得平缓缓,是由是由N N个宽的低幅缓变函数迭加个宽的低幅缓变函数迭加。你现在浏览的是第九十六页,共125页 若若h hN N太小太小,N N(x)(x)幅度很大,宽度很小幅度很大,宽度很小,是是N N个以个以xixi为中心的尖脉冲在为中心的尖脉冲在x x处的叠加处的叠加。lh hN N太太小小,是是p p(x)(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 第三 优秀 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内