统计模式识别b-参数估计-OK.pdf
《统计模式识别b-参数估计-OK.pdf》由会员分享,可在线阅读,更多相关《统计模式识别b-参数估计-OK.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 1HMMHMM模型模型HMMHMM的基本思想的基本思想 MarkovMarkov链链 HMMHMM的概念的概念HMMHMM的基本算法的基本算法 前向后向算法前向后向算法 ViterbiViterbi算法算法 BaumBaum-WelchWelch算法算法HMMHMM的基本思想的基本思想MarkovMarkov链链 随机序列在任意时刻它所处的状态,且他在时随机序列在任意时刻它所处的状态,且他在时刻所处的状态为的概率,至于他在时刻的状态刻所处的状态为的概率,至于他在时刻的状态有关,而与时刻以前他所处的状态无关即有:有关,而与时刻以前他所处的状态无关即有:3 3讲义:模式识别第三章:统计模式识别
2、(二)概率密度函数的参数估计概率密度函数的参数估计引言引言参数估计方法参数估计方法 极大似然估计极大似然估计(未知参数为一确定值)未知参数为一确定值)贝叶斯估计(未知参数为一随机变量)贝叶斯估计(未知参数为一随机变量)贝叶斯学习(未知参数为一随机变量)贝叶斯学习(未知参数为一随机变量)非参数估计非参数估计 ParzenParzen窗估计窗估计 K K-N N 近邻估计近邻估计3.3.密度函数的估计密度函数的估计BayesBayes分类分类 已知先验概率已知先验概率与类条件概率与类条件概率,可,可以设计一个最优分类器。以设计一个最优分类器。问题问题 实际情况中,实际情况中,的确切分布很难知道,这
3、的确切分布很难知道,这就需要根据已有样本作出参数估计。就需要根据已有样本作出参数估计。特定条件下,可以合理地假设特定条件下,可以合理地假设是均值是均值为为,协方差矩阵为,协方差矩阵为的正态分布,将问题缩的正态分布,将问题缩小为估计小为估计的值。的值。(|)iP X()iP(|)iP X(|)iP Xiiii密度函数的估计密度函数的估计参数估计的方法:参数估计的方法:有监督的参数估计有监督的参数估计最大似然估计最大似然估计BayesBayes估计估计 无监督的参数估计无监督的参数估计 非参数估计非参数估计ParzenParzen窗窗K K-N N 近邻近邻基础知识:基础知识:1.1.2.2.=(
4、)(|)()P A BP A BP B=()(|)()P A BP A B P B即即=(|)(|)(|)P A B CP ABC P BC(1)(1)最大似然估计最大似然估计a1a1一般原则:条件一般原则:条件 设已知样本集有样本类设已知样本集有样本类,其中,其中类类有样本有样本,是按概率密度,是按概率密度从总从总体中独立地抽取的,但是其中某一参数体中独立地抽取的,但是其中某一参数或参或参数矢量数矢量不知道,记作参数不知道,记作参数。假设假设1 1:参数:参数唯一地是由唯一地是由决定的,记决定的,记作作,即认为此概率密度是由,即认为此概率密度是由作为作为条件的条件概率密度。条件的条件概率密度
5、。假设假设2 2:在:在类的样本中不包含类的样本中不包含的信息。可的信息。可以对每一类独立地进行处理。以对每一类独立地进行处理。(|)jP X12,cLXXXjX12,nXXXL(,)jj,jj(|)jP XjXj(|,)jjP X(|,)jjP X (|)jP X 2 2(1)(1)最大似然估计最大似然估计a2a2似然函数似然函数:同一类的样本子集同一类的样本子集,它们具有,它们具有概率密度概率密度,且样本是独立,且样本是独立抽取的,因此抽取的,因此12,nXXX=LX(|),1,2,kP Xkn=L1(|)(|),nkkPP X=X(|)PX()(|)LP=Xargmax()L=(|)PX
6、O下页(1)(1)最大似然估计最大似然估计a3a3对数似然函数对数似然函数:计算:计算:log(|)PX1()log(|)log(|),nkkLPP X=Xargmax()L=()1log(|)log(|)0nkkLPP X=X1p=M最大似然估计最大似然估计a4a4问题:问题:并不一定能够得到解。并不一定能够得到解。举例:举例:x x服从均匀分布,参数服从均匀分布,参数未知未知假设从总体中独立地抽取假设从总体中独立地抽取N N个样本,则个样本,则=0L 12,=12211(|)0XP Xotherwise()=211()(|)0NLP X最大似然估计最大似然估计a5a5对数似然函数对数似然函
7、数()=21()log(|)lnLPNX=121()1LN=221()1LN=1x=2x分母越小似然函数越大,估计参数为训练样本中最小和最大的(1)(1)最大似然估计最大似然估计b1b1均值未知的均值未知的d d维正态情况维正态情况 设设中的某一样本中的某一样本具有正具有正态形式,参数态形式,参数未知,未知,若干基础知识:若干基础知识:X12(,)TkkkkdXxxx=L112211(|)exp()()2(2)|TdkkkP XXX=111log(|)log(2)|()()22dTkkkP XXX=loglog()TTTABB A=1是对称矩阵是对称矩阵是对称矩阵,则是对称矩阵,则TAA=1l
8、og(|)()().TkkkP XXX=(1)(1)最大似然估计最大似然估计b2b2进一步地进一步地结论结论111111log(|)()()()()()()1()()12 1()TkkkTTkkkkTTTkkTkP XXXXXXXXXX=+=+=12 1()0TkLX=1()0nkkX=11nkkXn=3 3(1)(1)最大似然估计最大似然估计c1c1均值、方差未知的一维正态情况均值、方差未知的一维正态情况=1,2122()11(|)exp22kkxP x=2122()11log(|)log222kkxP x=loglog=22(1)(1)最大似然估计最大似然估计c2c2均值均值2122()1
9、1log(|)log222kkxP x=111121()0nnkkkLx=11()0nkkx=111nkkxn=111221log(|)2()(1)2kkkxP xx=1(1)(1)最大似然估计最大似然估计c2c2方差:有偏估计方差:有偏估计2122()11log(|)log222kkxP x=222212221222()11log(|)(2)(1)222()122kkkxP xx=+22111122()1(1)02nnnkkkkxL=+=22111()nkkxn=2211()1nkkxn=(1)(1)最大似然估计最大似然估计c3c3多变量情况多变量情况11nkkXn=11()()nTkkkX
10、Xn=)(2)Bayes(2)Bayes估计估计a1a1已知:已知:BayesBayes分类分类 核心:类条件概率密度必须知道,但若有一批核心:类条件概率密度必须知道,但若有一批已知类别的样本已知类别的样本,则可以根据后验概率计算,则可以根据后验概率计算出条件概率。出条件概率。目的目的 求条件概率密度求条件概率密度方法方法 根据联合概率密度的积分根据联合概率密度的积分,得到后,得到后验概率和条件概率的关系。验概率和条件概率的关系。X(|)P XX(,)P Xd(2)Bayes(2)Bayes估计估计a2a2两个假设两个假设 有监督学习,样本的类别已知并且类分布独立。有监督学习,样本的类别已知并
11、且类分布独立。存在一个概率密度的分布形式已知,而参数存在一个概率密度的分布形式已知,而参数未未知的后验概率密度知的后验概率密度,从样本中得到的信,从样本中得到的信息都反映在后验密度息都反映在后验密度中。中。(|)P X(|)P X12,cLXXXij12(|,)cjP XLXXXjX12(|,)ciP XLXXX4 4(2)Bayes(2)Bayes估计估计a3a3推导推导()(,)P XP Xd=条件:样本集条件:样本集X(|)(,|)P XP Xd=XX(,)(|)()P XP XP=(|)(|,)(|)P XP XPd=XXX(|)(|)(|)P XP XPd=XX确定后,确定后,与与无
12、关无关X条件概率后验概率(2)(2)BayesBayes估计估计估计,学习示例估计,学习示例b1b1求后验密度求后验密度条件条件1 1:为已知类别为为已知类别为的的n n个同个同类样本,并且是独立抽取的。类样本,并且是独立抽取的。条件条件2 2:考虑:考虑是一维的情况。是一维的情况。条件条件3 3:把:把均看作是随机变量,遵循如下分布均看作是随机变量,遵循如下分布12,nXXX=LXjX,X2(|)(,)kP xN:200()(,)PN:(2)(2)BayesBayes估计估计估计、学习示例估计、学习示例b2b2推导过程推导过程1(|)()(|)(|)()(|)()(|)()nkkPPPPPP
13、 XPPPd=XXXX条件322022100220102222002222221000()()11(|)expexp22221exp2221exp2nkknkknkkkxPxxx=+=+X202222100111exp22nkknx=+条件1(2)(2)BayesBayes估计估计估计、学习示例估计、学习示例b3b3仍是一个正态函数,称为再生密度。仍是一个正态函数,称为再生密度。假设假设,即,即202222100111(|)exp22nkknPx=+X(|)P X2222222()11(|)exp222111exp22nnnnnnnnnP=+X2(|)(,)nnPN:X比较(2)(2)Baye
14、sBayes估计估计估计学习示例估计学习示例b4b4的求解的求解22200022222100111nnnnkknnnxm=+=+=+,nn22022022002202220nnnnmnnn=+=+11nnkkmxn=(2)(2)BayesBayes估计估计估计、学习示例估计、学习示例b5b5分析:分析:1.1.再生密度的均值是再生密度的均值是样本均值样本均值和和先验均值先验均值的线性的线性组合。组合。2.2.一般情况下一般情况下,则当,则当。极端情况极端情况1 1:,说明先验值,说明先验值十十分可靠。分可靠。极端情况极端情况2 2:,说明先验值十分,说明先验值十分没有把握。没有把握。3.3.随
15、随n n的增加而减小,说明的增加而减小,说明趋于趋于。参见下页图示参见下页图示22220022220222000nnnnmnnn=+=+00 2n2n2n,nnnm 0nnm=?000,nn=05 512(|,)nPx xxL(2)(2)BayesBayes估计估计学习学习b6b6-4 4-3 3-2 2-1 10 01 12 23 34 45 5-5 51n=4n=9n=16n=25n=2.02.01.81.81.61.61.41.41.21.21.01.00.80.80.60.60.40.40.20.20.00.0(2)(2)BayesBayes学习学习c1c1求类条件密度求类条件密度(|
16、)(|)(|)P XP XPd=XX2(|)(,)P XN:2(|)(,)nnPN:X2222222()()1111(|)expexp2222()1exp(,)2nnnnnnnxP Xdxf=+X222222222()1(,)exp2nnnnnxfd+=+其中,其中,(2)(2)BayesBayes学习学习c2c2分析分析1.1.2.2.条件概率条件概率的均值和后验概率的均值和后验概率的均值相等。的均值相等。3.3.条件概率条件概率的方差比后验概率的方差比后验概率的的方差大。方差大。4.4.多维正态分布多维正态分布222()(|)expnnxP X+X(|)P XX(|)P X(|)P XX(
17、|)P X22(|)(,)nnP XN +:X2n22n+(|)(,)nnP XN +:X目录目录2828讲义:模式识别第三章:统计模式识别(二)最大熵估计最大熵估计Maximum entropy Maximum entropy extinationextination EntropyEntropyDefinition Definition ConditionsConditionsAssume Assume p(xp(x)is unknown)is unknownRelated constraints including mean value,Related constraints inclu
18、ding mean value,variance,etcvariance,etc.are.are knownknown To maximize this entropyTo maximize this entropy Example:Example:Ref.Pattern Recognition,Page 35.Ref.Pattern Recognition,Page 35.=XdxxpxpH)(ln)(2929讲义:模式识别第三章:统计模式识别(二)Mixture ModelsMixture ModelsIdea:Idea:Unknown Unknown p(xp(x)is a linear
19、 combination of density)is a linear combination of density functions functions Procedure:Procedure:Step1:set density components Step1:set density components p(x|jp(x|j:)Step2:known training samples to compute unknown Step2:known training samples to compute unknown and and p pj j MethodsMethodsMaximu
20、m likelihood Maximum likelihood Difficult to calculateDifficult to calculate The maximization task is a nonlinear fashion,thus nonlinear The maximization task is a nonlinear fashion,thus nonlinear optimization iterative techniques have to be adoptedoptimization iterative techniques have to be adopte
21、d=xjJjjdxjxpPPjxpxp1)|(1 where)|()(13030讲义:模式识别第三章:统计模式识别(二)The Expectation Maximization Algorithm(EM)The Expectation Maximization Algorithm(EM)It is good at cases in which the available data It is good at cases in which the available data set is incomplete.set is incomplete.Procedure:Procedure:Init
22、ialize Initialize 0 0,T,iT,i=0=0DoDo i=i+1i=i+1 ExpectationExpectation step:compute Q(step:compute Q(;i i)Maximization step:Max Q(Maximization step:Max Q(;i i)?i i+1+1Until Q(Until Q(i i+1+1;i i)-Q(Q(i i;i i-1 1)=T)=T Return Return=i i+1+1Example:Example:模式识别模式识别(中文版),中文版),page 23page 230);(:);|;(ln
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 模式识别 参数估计 OK
限制150内