模式识别课程讲义李君宝概率密函数估计学时学习教案.pptx
《模式识别课程讲义李君宝概率密函数估计学时学习教案.pptx》由会员分享,可在线阅读,更多相关《模式识别课程讲义李君宝概率密函数估计学时学习教案.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1模式识别课程讲义李君宝概率密函数估计学模式识别课程讲义李君宝概率密函数估计学时时第一页,编辑于星期二:点 五十一分。引言引言参数估计参数估计正态分布的参数估计正态分布的参数估计非参数估计非参数估计EM算法算法(期望最大化算法期望最大化算法)本章小结本章小结第1页/共70页第二页,编辑于星期二:点 五十一分。引言引言 第2页/共70页第三页,编辑于星期二:点 五十一分。【引言】贝叶斯决策公式贝叶斯决策公式 第3页/共70页第四页,编辑于星期二:点 五十一分。【引言】算法基本步骤算法基本步骤第4页/共70页第五页,编辑于星期二:点 五十一分。【引言】存在的问题:存在的问题:第5页/共70页
2、第六页,编辑于星期二:点 五十一分。【引言】问题的解决问题的解决第6页/共70页第七页,编辑于星期二:点 五十一分。【引言】参数估计的分类参数估计的分类第7页/共70页第八页,编辑于星期二:点 五十一分。【引言】参数估计的基本概念参数估计的基本概念第8页/共70页第九页,编辑于星期二:点 五十一分。参数估计参数估计 第9页/共70页第十页,编辑于星期二:点 五十一分。【参数估计】最大似然估计最大似然估计贝叶斯估计贝叶斯估计贝叶斯学习贝叶斯学习第10页/共70页第十一页,编辑于星期二:点 五十一分。【最大似然估计】基本假设基本假设第11页/共70页第十二页,编辑于星期二:点 五十一分。【最大似然
3、估计】基本概念基本概念第12页/共70页第十三页,编辑于星期二:点 五十一分。【最大似然估计】基本概念基本概念第13页/共70页第十四页,编辑于星期二:点 五十一分。【最大似然估计】基本原理基本原理第14页/共70页第十五页,编辑于星期二:点 五十一分。【最大似然估计】估计量估计量估计值估计值 第15页/共70页第十六页,编辑于星期二:点 五十一分。【最大似然估计】一元参数一元参数第16页/共70页第十七页,编辑于星期二:点 五十一分。【最大似然估计】多元参数多元参数第17页/共70页第十八页,编辑于星期二:点 五十一分。【最大似然估计】例子(梯度法不适合):不成功!不成功!第18页/共70页
4、第十九页,编辑于星期二:点 五十一分。【贝叶斯估计】采用最小风险贝叶斯决策采用最小风险贝叶斯决策第19页/共70页第二十页,编辑于星期二:点 五十一分。【贝叶斯估计】第20页/共70页第二十一页,编辑于星期二:点 五十一分。【举例】假设假设结论:结论:第21页/共70页第二十二页,编辑于星期二:点 五十一分。【贝叶斯估计】第22页/共70页第二十三页,编辑于星期二:点 五十一分。【贝叶斯学习】第23页/共70页第二十四页,编辑于星期二:点 五十一分。【三种方法总结】第24页/共70页第二十五页,编辑于星期二:点 五十一分。【三种方法总结】第25页/共70页第二十六页,编辑于星期二:点 五十一分
5、。正态分布的参数估计正态分布的参数估计 第26页/共70页第二十七页,编辑于星期二:点 五十一分。【最大似然估计】基本假设基本假设第27页/共70页第二十八页,编辑于星期二:点 五十一分。【最大似然估计】单元正态分布:多元正态分布:最大似然估计方程:其中第28页/共70页第二十九页,编辑于星期二:点 五十一分。【贝叶斯估计】第29页/共70页第三十页,编辑于星期二:点 五十一分。【贝叶斯估计】第30页/共70页第三十一页,编辑于星期二:点 五十一分。非参数估计非参数估计 第31页/共70页第三十二页,编辑于星期二:点 五十一分。【基本思想】第32页/共70页第三十三页,编辑于星期二:点 五十一
6、分。n n令令令令R R是包含样本点是包含样本点是包含样本点是包含样本点x x的一个区域,其体积为的一个区域,其体积为的一个区域,其体积为的一个区域,其体积为V V,设,设,设,设有有有有n n个训练样本,其中有个训练样本,其中有个训练样本,其中有个训练样本,其中有k k个落在区域个落在区域个落在区域个落在区域R R中,则可对概中,则可对概中,则可对概中,则可对概率密度作出一个估计:率密度作出一个估计:率密度作出一个估计:率密度作出一个估计:相当于用相当于用R区域内的平均性质来作为一点区域内的平均性质来作为一点x的估计,的估计,是一种数据的平滑。是一种数据的平滑。【基本思想】第33页/共70页
7、第三十四页,编辑于星期二:点 五十一分。n n当当当当n n固定时,固定时,固定时,固定时,V V的大小对估计的效果影响很大,过大则平的大小对估计的效果影响很大,过大则平的大小对估计的效果影响很大,过大则平的大小对估计的效果影响很大,过大则平滑过多,不够精确;过小则可能导致在此区域内无样本滑过多,不够精确;过小则可能导致在此区域内无样本滑过多,不够精确;过小则可能导致在此区域内无样本滑过多,不够精确;过小则可能导致在此区域内无样本点,点,点,点,k=0k=0。此方法的有效性取决于样本数量的多少,以及区域此方法的有效性取决于样本数量的多少,以及区域体积选择的合适。体积选择的合适。第34页/共70
8、页第三十五页,编辑于星期二:点 五十一分。n n构造一系列包含构造一系列包含构造一系列包含构造一系列包含x x的区域的区域的区域的区域R1,R2,R1,R2,,对应,对应,对应,对应n=1,2,n=1,2,,则对则对则对则对p(x)p(x)有一系列的估计:有一系列的估计:有一系列的估计:有一系列的估计:当满足下列条件时,当满足下列条件时,pn(x)收敛于收敛于p(x):第35页/共70页第三十六页,编辑于星期二:点 五十一分。n nParzenParzen窗法:区域体积窗法:区域体积窗法:区域体积窗法:区域体积V V是样本数是样本数是样本数是样本数n n的函数,如:的函数,如:的函数,如:的函
9、数,如:K-近邻法:落在区域内的样本数近邻法:落在区域内的样本数k是总样本数是总样本数n的函的函数,如:数,如:【Parzen窗法和K-近邻法】第36页/共70页第三十七页,编辑于星期二:点 五十一分。【Parzen窗法和K-近邻法】第37页/共70页第三十八页,编辑于星期二:点 五十一分。n n定义窗函数定义窗函数定义窗函数定义窗函数【Parzen窗法】第38页/共70页第三十九页,编辑于星期二:点 五十一分。n n超立方体中的样本数:超立方体中的样本数:超立方体中的样本数:超立方体中的样本数:【Parzen窗法】概率密度估计:概率密度估计:第39页/共70页第四十页,编辑于星期二:点 五十
10、一分。n n上述过程是一个内插过程,样本上述过程是一个内插过程,样本上述过程是一个内插过程,样本上述过程是一个内插过程,样本xixi距离距离距离距离x x越近,对越近,对越近,对越近,对概率密度估计的贡献越大,越远贡献越小。概率密度估计的贡献越大,越远贡献越小。概率密度估计的贡献越大,越远贡献越小。概率密度估计的贡献越大,越远贡献越小。n n只要满足如下条件,就可以作为窗函数:只要满足如下条件,就可以作为窗函数:只要满足如下条件,就可以作为窗函数:只要满足如下条件,就可以作为窗函数:【Parzen窗法】第40页/共70页第四十一页,编辑于星期二:点 五十一分。【Parzen窗法】窗函数第41页
11、/共70页第四十二页,编辑于星期二:点 五十一分。n nhn称为窗的宽度【Parzen窗法】第42页/共70页第四十三页,编辑于星期二:点 五十一分。【Parzen窗法】第43页/共70页第四十四页,编辑于星期二:点 五十一分。n n保存每个类别所有的训练样本;保存每个类别所有的训练样本;保存每个类别所有的训练样本;保存每个类别所有的训练样本;n n选择窗函数的形式,根据训练样本数选择窗函数的形式,根据训练样本数选择窗函数的形式,根据训练样本数选择窗函数的形式,根据训练样本数n n选择窗函选择窗函选择窗函选择窗函数的数的数的数的h h宽度;宽度;宽度;宽度;n n识别时,利用每个类别的训练样本
12、计算待识别样本识别时,利用每个类别的训练样本计算待识别样本识别时,利用每个类别的训练样本计算待识别样本识别时,利用每个类别的训练样本计算待识别样本x x的的的的类条件概率密度:类条件概率密度:类条件概率密度:类条件概率密度:n n采用采用采用采用BayesBayes判别准则进行分类。判别准则进行分类。判别准则进行分类。判别准则进行分类。【Parzen窗法】第44页/共70页第四十五页,编辑于星期二:点 五十一分。EM(期望最大化期望最大化)算法算法第45页/共70页第四十六页,编辑于星期二:点 五十一分。1 EM算法的介绍算法的介绍2 EM算法依据的理论算法依据的理论3 EM算法的不足和改进的
13、算法算法的不足和改进的算法4 EM算法举例算法举例【EM算法】第46页/共70页第四十七页,编辑于星期二:点 五十一分。n nEMEM英文叫英文叫expectation-maximizationexpectation-maximization,是一种,是一种聚类算法。聚类算法。(即根据给定观察数据自动对数据进行分类)即根据给定观察数据自动对数据进行分类)n nEMEM算法是算法是Dempster,LairdDempster,Laird和和Rubin(DLR)Rubin(DLR)三个人在三个人在19771977年正式提出年正式提出的,主要是用于在不完全数据的情况下计算最大似然估计。的,主要是用于
14、在不完全数据的情况下计算最大似然估计。n n在在EMEM算法正式提出以来,对算法正式提出以来,对EMEM算法的性质有更加深入的研算法的性质有更加深入的研究,并且在此基础上,提出了很多改进的算法。究,并且在此基础上,提出了很多改进的算法。n nEMEM算法在数理统计,数据挖掘,机器学习以及模式识别等领域算法在数理统计,数据挖掘,机器学习以及模式识别等领域有广泛的应用。有广泛的应用。【1 EM算法的介绍算法的介绍】第47页/共70页第四十八页,编辑于星期二:点 五十一分。n n极大拟然估计法极大拟然估计法 引例引例:某位同学与一位猎人外出打猎,一只野兔从前方窜过,某位同学与一位猎人外出打猎,一只野
15、兔从前方窜过,只听一声枪响,野兔应声倒下,如果要你推测,这一发命中的只听一声枪响,野兔应声倒下,如果要你推测,这一发命中的子弹是谁打的?你就会想,只发一枪便打中,由于猎人命中的子弹是谁打的?你就会想,只发一枪便打中,由于猎人命中的概率一般大于这位同学命中的概率,看来这一枪是猎人命中的。概率一般大于这位同学命中的概率,看来这一枪是猎人命中的。这个例子所作的推断就体现了极大拟然法的基本思想。这个例子所作的推断就体现了极大拟然法的基本思想。【2 EM算法的理论依据算法的理论依据】第48页/共70页第四十九页,编辑于星期二:点 五十一分。n n极大拟然法的定义极大拟然法的定义 观测变量观测变量X X,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 课程 讲义 李君宝 概率 密函 估计 学时 学习 教案
限制150内