统计模式识别-贝叶斯分类器h课件.ppt
《统计模式识别-贝叶斯分类器h课件.ppt》由会员分享,可在线阅读,更多相关《统计模式识别-贝叶斯分类器h课件.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计模式识别(二)贝叶斯分类器内容n贝叶斯分类的基本原理n最小错误率贝叶斯分类n最小风险贝叶斯分类n最大似然比贝叶斯分类n正态分布中的贝叶斯分类回顾:n线性分类器设计思路n梯度下降法n感知器法哈哈统计 有一个从没带过小孩的统计学家,因为妻子出门勉强答应照看三个年幼好动的孩子。妻子回家时,他交出一张纸条,写的是:“擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次,累计15次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿马路26次;我还要再过这样的星期六0次”。统计学真的这样呆板吗?仅仅收集数据,整理分析,累加平均 n统计学以数据为研究内容,但仅仅收集数据,决不构成统
2、计学研究的全部。n统计学是面对不确定情况寻求决策、制定方法的一门科学n人力、财力、时间等的限制,只有部分或少量数据,要推断所有数据的的特征nPR中的分类问题是根据识别对象特征的观测值,将其分到相应的类别中去。1、贝叶斯公式及其意义:一、贝叶斯分类原理:P(Bk k|A)是事件A发生时事件Bk发生的条件概率;P(Bk)是事件Bk发生的概率;p(A|Bk)是事件Bk发生时事件A发生的条件概率密度;p(A)是事件A发生的条件概率密度;贝叶斯公式表达了两个相关事件在先后发生时的推理关系2、作为统计判别问题的模式识别:以两类分类问题来讨论:设有两个类别1和2,理想情况,1和2决定了特征空间中的两个决策区
3、域。确定性分类:我们任取一个样本x x,当它位于1的决策区域时,我们判别x x 1;当它位于2的决策区域时,我们判别x x 1。也可以说:当x x位于1的决策区域时,它属于1的概率为1,属于2的概率为0。随机性统计分类:如我们任取一个样本x x,当它位于1的决策区域时,它属于1的概率为小于1,属于2的概率大于0,确定性分类问题就变成了依照概率判决规则进行决策的统计判别问题。3、先验概率和后验概率:先验概率:根据大量样本情况的统计,在整个特征空间中,任取一个特征向量x x,它属于类j的概率为P P(j j),也就是说,在样本集中,属于类j的样本数量于总样本数量的比值为P P(j j)。我们称P
4、P(j j)为先验概率。显然,有:P P(1 1)P P(2 2)P P(c c)1 1后验概率:当我们获得了某个样本的特征向量x x,则在x x条件下样本属于类j的概率P(P(j j|x)|x)称为后验概率。后验概率就是我们要做统计判别的依据。4、后验概率的获得:后验概率是无法直接得到的,因此需要根据推理计算,由已知的概率分布情况获得。根据贝叶斯公式可得:其中:p p(x|j j)为类为类j所确定的决策区域中,特征向量x出现的概率密度,称为类条件概率密度,又称为似然函数。p p(x)p(x)为全概率密度,可由全概率公式计算得到。以细胞识别为例:n细胞切片的显微图像经过一定的预处理后,抽取出d
5、个特征。每一细胞可用一个d维的特征向量x表示。希望根据x的值分到正常类1或异常类2中去。n假定可以得到Pr(1)、Pr(2),Pr(1)+Pr(2)=1,和p(x|1)、p(x|2)。n如果只有先验概率,那么合理的选择是把x分到Pr(1)、Pr(2)大的一类中去。一般由于Pr(1)Pr(2),这样就把所有的细胞分到了正常的一类。失去了意义。如果有细胞的观测信息,那么可以改进决策的方法。为了简单起见,假定x x是一维的特征(如胞核的总光强度)。p(x x|1)和p(x x|2)已知:利用贝叶斯公式:得到的Pr(i|x x)称为状态(正常、异常)的后验概率。上述的贝叶斯公式,通过观测到的x,把先验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 模式识别 贝叶斯 分类 课件
限制150内