模式识别课件第三章概率密度估计打印.ppt
《模式识别课件第三章概率密度估计打印.ppt》由会员分享,可在线阅读,更多相关《模式识别课件第三章概率密度估计打印.ppt(96页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 概率密度估计概率密度估计u3.0 引言u3.1 参数估计u3.2 非参数估计u3.3 说明3.0 引言引言n进行Bayes决策需要事先知道两种知识:n各类的先验概率;n观测向量的类条件概率密度。n知识的获取(估计):n一些训练数据;n对问题的一般性的认识。3.0 引言引言3.0 引言引言n类的先验概率的估计(较容易):n依靠经验;n用训练数据中各类出现的频率估计。n用频率估计概率的优点:n无偏性;n相合性;n收敛速度快。n类条件概率密度的估计(非常难):n概率密度函数包含了一个随机变量的全部信息n概率密度函数可以是满足下面条件的任何函数p(x)03.0 引言引言n概率密度估计的两
2、种主要思路:n参数估计:n根据对问题的一般性的认识,假设随机变量服从某种分布,分布函数的参数通过训练数据来估计。n 非参数估计:n不用模型,而只利用训练数据本身对概率密度做估计。3.0 引言引言n“Curse of dimensionality”:We need lots of training data to determine the completely unknown statistics for multi-D problems.nA rule of thumb:“use at least 10 times as many training samples per class as
3、the number of features(i.e.D)”nHence,with some a priori information,it is possible to estimate the parameters of the known distribution by using less number of Samples3.1 3.1 参数估计参数估计3.1 3.1 参数估计参数估计n最大似然估计把参数看作是确确定定而未知的。最好的估计值是在获得实际观察样本的概率为最大的条件下得到的。n贝叶斯估计把未知的参数当作具有某种分布的随随机机变量,样本的观察结果使先验分布转化为后验分布,再
4、根据后验分布修正原先对参数的估计。3.1 3.1 参数估计参数估计n最大似然估计(Maximum Likelihood),需做以下假设:n参数是确定(非随机)而未知的量。n按类别把样本集分开,假定有c个类,则可分成c个样本集X1,X2,Xc,其中Xj中的样本都是从概率密度为p(x|j)的总体中独立抽取出来的。3.1 3.1 参数估计参数估计n类条件概率密度p(x|j)具有某种确定的函数形式,但其参数向量 j 未知。n假定Xi中的样本不包含关于j(ji)的信息。也就是说不同类别的参数在函数上是独立的。这样就可以分别对每一类进行处理。也就是说Xi中的样本只对i 提供有关信息,而没有关于j(ji)的
5、任何信息。3.1 3.1 参数估计参数估计n在假设前提下,可以分别处理c个独立的问题。独立地按照概率密度抽取样本集X,用X去估计出未知参数。n已知某一类样本集X包含有N个样本,即X=x1,x2,xN 3.1 3.1 参数估计参数估计n由于假设样本是独立抽取的,所以相对于样本集X的的似然函数。3.1 3.1 参数估计参数估计似然函数:对数似然函数:等价参数求解:梯度为0。3.1 3.1 参数估计参数估计最大似然估计就是上式的解。最大似然估计示意图3.1 3.1 参数估计参数估计Find value of unknown parameter maximizesFor different,theob
6、served samples givesdifferent p(X|)valuesfor p(xk|)densitiesThe argument for themaximum of suchproducts is ML estimatelog p(X|)will notdiffer the argument ofthis maximan单变量正态分布3.1 3.1 参数估计参数估计n正态分布假设下的极大似然参数估计:其中 和 为未知参数。由n单变量正态分布知3.1 3.1 参数估计参数估计n正态分布假设下的极大似然参数估计:3.1 3.1 参数估计参数估计以 和 代入上式,解上述方程组,得 n
7、多元正态分布似然函数:3.1 3.1 参数估计参数估计设x1,x2,xn是从p(x|,)选取的特征向量,其联合分布为 n多元正态分布均值估计:均值的最大似然估计均值的最大似然估计与与无关!无关!3.1 3.1 参数估计参数估计n多元正态分布协方差矩阵的估计:3.1 3.1 参数估计参数估计令 A=-1 n正态分布假设下的极大似然参数估计:n多元正态分布协方差矩阵的估计:协方差矩阵的极大似然估计与ML有关!3.1 3.1 参数估计参数估计n正态分布假设下的极大似然参数估计:n多元正态分布协方差矩阵的极大似然估计是有偏估计:无偏估计:3.1 3.1 参数估计参数估计nBayes估计:最大后验概率估
8、计(maximum a posteriori)设有一个样本X(而不是x),要求找出估计量 (而不是选出最佳决策 ),用来估计X所属总体的分布的某个真实参数 (而不是真实状态k)使带来的贝叶斯风险最小,就是贝叶斯估计。3.1 3.1 参数估计参数估计nBayes估计:n贝叶斯决策和贝叶斯估计两者都立足于使贝叶斯风险最小,只是要解决的问题不同:一是要决策x的真实状态,而另一个则是估计X所属总体分布的参数。n二者的各变量之间存在一一对应的关系 3.1 3.1 参数估计参数估计nBayes估计:贝叶斯决策贝叶斯决策贝叶斯估计贝叶斯估计决策问题估计问题样本x样本集X决策估计量真实状态i真实参数状态空间A
9、是离散空间参数空间是连续空间先验概率P(i)参数的先验分布p()3.1 3.1 参数估计参数估计nBayes估计:n根据贝叶斯公式n设为代替所造成的损失。3.1 3.1 参数估计参数估计nBayes估计:可得 、x的联合分布 3.1 3.1 参数估计参数估计nBayes估计:为 可能取值的参数空间。为给定x条件下估计量 的期望损失(条件风险),与贝叶斯决策中给定x时决策 的条件风险 是对应的。3.1 3.1 参数估计参数估计nBayes估计:因此同贝叶斯决策一样:使条件风险 极小时的估计量 也一定使贝叶斯风险R最小。如果 的估计量 使条件风险最小,则称 是关于 的贝叶斯估计量。若求解贝叶斯估计
10、量 必须定义适当的损失函数。3.1 3.1 参数估计参数估计nBayes估计:一般地,损失函数可定义成不同的形式,因而得到不同的贝叶斯估计量 。以二次函数作为损失函数,即平方误差损失函数3.1 3.1 参数估计参数估计nBayes估计:定理定理:如果损失函数为二次函数,即 则 的贝叶斯估计量 是在给定x时 的条件期望。即3.1 3.1 参数估计参数估计nBayes估计:证证明明:由于贝叶斯估计使贝叶斯风险R达到最小,要使贝叶斯风险达到最小,相当于被积函数(条件风险)3.1 3.1 参数估计参数估计nBayes估计:3.1 3.1 参数估计参数估计nBayes估计:3.1 3.1 参数估计参数估
11、计nBayes估计:与 无关与 有关选择 ,使第二项为零,从而使条件风险 最小,所以贝叶斯估计量为 3.1 3.1 参数估计参数估计nBayes估计:确定 的先验分布 利用此定理,可以对平方误差损失函数求解贝叶斯估计量 ,步骤如下:由样本集X=x1,x2,,xn求出样本联合分布 ,它是 的函数 利用贝叶斯公式,求出 的后验分布 3.1 3.1 参数估计参数估计nBayes估计:利用定理求出贝叶斯估计量 3.1 3.1 参数估计参数估计nBayes估计举例:n以单变量正态分布为例,并假定总体方差为已知,待估计的仅是均值。n设总体分布密度为 3.1 3.1 参数估计参数估计nBayes估计举例:假
12、定关于 的先验知识可用一个已知的先验密度 来表示,并假定 服从均值为 方差为 的正态分布,即其中 和 是已知的。表示 的最好的先验推测,度量了对这个推测的不确定性。3.1 3.1 参数估计参数估计nBayes估计举例:设样本集X=x1,x2,xn是取自 正态分布,其中 是未知参数,且假定 为随机参数,具有先验分布,要求用贝叶斯估计方法求出 的估计量 。3.1 3.1 参数估计参数估计nBayes估计举例:n对于二次损失函数的贝叶斯估计,根据定理,有可得 3.1 3.1 参数估计参数估计nBayes估计举例:由 求得。从上式可看出,首先是求 的后验分布,由于其先验分布 为已知,可应用贝叶斯公式3
13、.1 3.1 参数估计参数估计nBayes估计:其中是一个比例因子,仅与X有关而与无关。由于3.1 3.1 参数估计参数估计nBayes估计:3.1 3.1 参数估计参数估计nBayes估计:和 无关的因子全部吸收到 和 中,这样 是 的二次函数的指数函数,仍是正态密度,可以把 写成即3.1 3.1 参数估计参数估计nBayes估计:应用待定系数法,令上面两式对应的系数相等,即求得 和3.1 3.1 参数估计参数估计nBayes估计:n解前面方程得3.1 3.1 参数估计参数估计3.1 3.1 参数估计参数估计nBayes估计:求 的贝叶斯估计得出 的贝叶斯估计值3.1 3.1 参数估计参数估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 课件 第三 概率 密度 估计 打印
限制150内