贝叶斯决策理论与统计判别方法.pptx
《贝叶斯决策理论与统计判别方法.pptx》由会员分享,可在线阅读,更多相关《贝叶斯决策理论与统计判别方法.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习指南理解本章的关键要正确理解先验概率,类概率密度函数,后验概率这三种概率对这三种概率的定义,相互关系要搞得清清楚楚Bayes公式正是体现这三者关系的式子,要透彻掌握。第2页/共81页2.1引言统计决策理论是模式分类问题的基本理论之一贝叶斯决策理论是统计决策理论中的一个基本方法第3页/共81页物理对象的描述在特征空间中讨论分类问题假设一个待识别的物理对象用其d个属性观察值描述,称之为d个特征,记为x=x1,x2,xdT这组成一个d维的特征向量,而这d维待征所有可能的取值范围则组成了一个d维的特征空间。第4页/共81页贝叶斯决策理论方法讨论的问题讨论的问题总共有c类物体已知各类在这d维特征空间
2、的统计分布,各类别i=1,2,c的先验概率P(i)类条件概率密度函数p(x|i)问题:如何对某一样本按其特征向量分类已知d维特征空间的统计分布,如何对某一样本分类最合理第5页/共81页基于最小错误率的贝叶斯决策 基于最小风险的贝叶斯决策在限定一类错误率条件下使另一类错误率为最小的两类别决策最小最大决策序贯分类方法2.2 几种常用的决策规则第6页/共81页基于最小错误率的贝叶斯决策分类识别中为什么会有错分类?当某一特征向量值X只为某一类物体所特有,即 对其作出决策是容易的,也不会出什么差错 问题在于出现模棱两可的情况 任何决策都存在判错的可能性。第7页/共81页基于最小错误率的贝叶斯决策 基本思
3、想使错误率为最小的分类规则称之为基于最小错误率的贝叶斯决策 第8页/共81页例两类细胞识别特征-后验概率-分类两类鱼识别特征-后验概率-分类天气预报中的后验概率特征后验概率分类第9页/共81页例细胞识别,加入更多类别?鱼识别,加入更多种类?存在问题后验概率直接用来分类后验概率不易直接得到后验概率不易联合考虑第10页/共81页例另一种概率:类条件概率正常细胞特征的概率分布异常细胞特征的概率分布 salmon的概率分布 sea bass的概率分布分类中如何使用类条件概率?什么是先验概率?第11页/共81页条件概率 P(*|#)是条件概率的通用符号即在某条件#下出现某个事件*的概率P(K|X):X出
4、现条件下,样本为K类的概率P(*|#)与P(*)不同第12页/共81页几个重要概念先验概率P(1)及P(2)概率密度函数P(x|i)后验概率P(i|X)第13页/共81页贝叶斯决策理论先验概率,后验概率,概率密度函数假设总共有c类物体,用i(i=1,2,c)标记每个类别,x=x1,x2,xdT,是d维特征空间上的某一点,则P(i)是先验概率p(x|i)是i类发生时的条件概率密度函数P(i|x)表示后验概率第14页/共81页基于最小错误率的贝叶斯决策 例:癌细胞的识别假设每个要识别的细胞已作过预处理,并抽取出了d个特征描述量,用一个d维的特征向量X表示,识别的目的是要依据该X向量将细胞划分为正常
5、细胞或者异常细胞。这里我们用表示是正常细胞,而则属于异常细胞。第15页/共81页基于最小错误率的贝叶斯决策先验概率 P(1)和P(2)含义:每种细胞占全部细胞的比例 P(1)+P(2)=1一般情况下正常细胞占比例大,即P(1)P(2)第16页/共81页基于最小错误率的贝叶斯决策salmon”or“sea bass”判别中的先验概率P(salmon)P(sea bass)第17页/共81页基于最小错误率的贝叶斯决策先验概率根据先验概率决定这种分类决策没有意义表明由先验概率所提供的信息太少 第18页/共81页基于最小错误率的贝叶斯决策概率密度函数利用对细胞作病理分析所观测到的信息,也就是所抽取到的
6、d维观测向量。为简单起见,我们假定只用其一个特征进行分类,即d=1得到两类的类条件概率密度函数分布P(x|1)是正常细胞的属性分布P(x|2)是异常细胞的属性分布第19页/共81页基于最小错误率的贝叶斯决策 类条件概率密度函数概率密度函数性质第20页/共81页基于最小错误率的贝叶斯决策salmon”or“sea bass”判别中的类条件概率密度函数第21页/共81页基于最小错误率的贝叶斯决策类条件概率密度函数直接用来分类是否合理?具有一定的合理性不满足最小错误率要求没有考虑先验概率第22页/共81页基于最小错误率的贝叶斯决策后验概率含义 P(1|X)当观测向量为X值时,该细胞属于正常细胞的概率
7、。P(2|X)当观测向量为X值时,该细胞属于异常细胞的概率。第23页/共81页基于最小错误率的贝叶斯决策 后验概率第24页/共81页基于最小错误率的贝叶斯决策“salmon”or“sea bass”判别中的后验概率第25页/共81页基于最小错误率的贝叶斯决策类条件概率和后验概率区别后验概率:P(1|x)和P(|x)同一条件x下,比较1与2出现的概率两类1和2,则有P(1|x)+P(2|x)=1如P(1|x)P(2|x)则可以下结论,在x条件下,事件1出现的可能性大类条件概率:P(x|1)和P(x|2)是在不同条件下讨论的问题即使只有两类1与2,P(x|1)+P(x|1)1P(x|1)与P(x|
8、2)两者没有联系第26页/共81页基于最小错误率的贝叶斯决策贝叶斯公式先验概率,后验概率,概率密度函数之间关系根据先验概率和概率密度函数可以计算出后验概率第27页/共81页基于最小错误率的贝叶斯决策问题为什么先验概率和类条件概率密度函数可以作为已知?而后验概率需要通过计算获得?第28页/共81页基于最小错误率的贝叶斯决策为什么后验概率要利用Bayes公式从先验概率和类条件概率密度函数计算获得?计算概率都要拥有大量数据 估计先验概率与类条件概率密度函数时都可搜集到大量样本 对某一特定事件(如x)要搜集大量样本是不太容易 只能借助Bayes公式来计算得到 第29页/共81页基于最小错误率的贝叶斯决
9、策问题根据最小错误率,如何利用先验概率、类条件概率密度函数和后验概率进行分类?第30页/共81页基于最小错误率的贝叶斯决策贝叶斯决策理论前提各类别总体的概率分布是已知的;要决策分类的概率分布是已知的。贝叶斯决策理论方法所讨论的问题是:已知:总共有c类物体,以及先验概率P(i)及类条件概率密度函数p(x|i)问题:如何对某一样本按其特征向量分类的问题。第31页/共81页基于最小错误率的贝叶斯决策基于最小错误率的贝叶斯决策规则:如果P(1|X)P(2|X),则X归为1类别如果P(1|X)P(2|X),则X归为2类别第32页/共81页基于最小错误率的贝叶斯决策几种等价形式:后验概率形式:如果 则 x
10、归为i先验概率及类条件概率密度函数表示:如果 则 x归为i第33页/共81页基于最小错误率的贝叶斯决策几种等价形式:比值的方式表示,如果 则x归为1,否则x归为2 第34页/共81页基于最小错误率的贝叶斯决策几种等价形式:对数形式若 则x归为1,否则x归为2第35页/共81页基于最小错误率的贝叶斯决策例2.1 假设在某地区切片细胞中正常(1)和异常()两类的先验概率分别为P(1)=0.9,P(2)=0.1。现有一待识别细胞呈现出状态x,由其类条件概率密度分布曲线查得p(x|1)=0.2,p(x|)=0.4,试对细胞x进行分类。第36页/共81页基于最小错误率的贝叶斯决策例2.1解:利用贝叶斯公
11、式,分别计算出状态为x时1与的后验概率 第37页/共81页基于最小错误率的贝叶斯决策例2.1根据贝叶斯决策有P(1|x)0.818P(|x)0.182分析:错误概率是多少?判断为正常细胞,错误率为0.182判断为异常细胞,错误率为0.818因此判定该细胞为正常细胞比较合理。第38页/共81页最小错误率的证明最小错误率贝叶斯准则使得错误率最小证明:从平均的意义上的错误率在连续条件下,平均错误率,以P(e)表示,应有:第39页/共81页最小错误率的证明最小错误率贝叶斯准则使得错误率最小证明:分析两类别问题按贝叶斯决策规则,当P(w2|x)p(w1|x)时决策为w2。显然这个决策意味着,对观测值x有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 决策 理论 统计 判别 方法
限制150内