模式识别_二章贝叶斯决策理论.pdf
《模式识别_二章贝叶斯决策理论.pdf》由会员分享,可在线阅读,更多相关《模式识别_二章贝叶斯决策理论.pdf(133页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别 第二讲:贝叶斯决策理论 2 新闻一则 在中国,知道Autonomy公司及其技术的人不多。但实际上,Autonomy及其CEO迈可林奇(Mike Lynch)在知识管理界的知名度很高。迈可林奇1991年毕业于剑桥大学,主修神经网络。他受模式识别所用的概率算法的启发,创立了Neurodynamics公司,以概率论中的贝叶斯公式和香农的信息论作为其技术的理论基础,开发出文本挖掘产品。1998年,Autonomy公司看中林奇的技术,以400万美元并购了林奇的公司,林奇也成为Autonomy公司的CEO。3 Autonomy最核心的产品是Concept Agents。在经过训练以后,它能自动地
2、从文本中抽取概念。在林奇看来,按照香农的信息论,文档中除有效概念外,还有大量的冗余信息。而词或短语是否为冗余可根据它在文档中的随机度(概率)来判定。如果能滤去冗余,就可从文档中自动抽取出表达文档主题的概念。新闻一则 4 在林奇的方案中,先要对系统进行训练,处理一些文档,由使用者对非冗余概念做出认定和识别。按照贝叶斯概率理论,这一步实际上是让系统获得关于概念的先验概率。系统在随后的自动处理中根据这些概念在文档中出现的实际情况,按贝叶斯公式求出后验概率,以此作为冗余过滤的依据。这一方法与语种无关,由于每个用户都要对系统进行个别训练,因而系统的文本挖掘天然就具有高度个性化的特点。新闻一则 5 新闻一
3、则 到目前为止,包括报业巨头默多克的新闻集团在内的一批知名公司已经成为Autonomy的客户,Compaq公司也已经将Autonomy的技术和产品纳入其知识管理解决方案并在客户中推广。6 贝叶斯决策理论 BAYES DECISION THEORYBAYES DECISION THEORY 7 2.1 引 言 贝叶斯决策:统计模式识别的一个基本方法;理论上理论上的最优性能;分类错误率与风险最小分类错误率与风险最小 衡量其它分类器设计方法的标准衡量其它分类器设计方法的标准 贝叶斯决策的要求:要决策分类的类别数是一定的 各类别总体的概率分布是已知的 8 数学家贝叶斯(Bayes,Thomas)(17
4、021761)贝叶斯是英国数学家.1702年生于伦敦;1761年4月17日卒于坦布里奇韦尔斯.贝叶斯是一位自学成才的数学家.曾助理宗教事务,后来长期担任坦布里奇韦尔斯地方教堂的牧师.1742年,贝叶斯被选为英国皇家学会会员.9 贝叶斯定理贝叶斯定理 1763年,贝叶斯逝后发表的论机会学说论机会学说问题的求解问题的求解中,提出了一种归纳推理归纳推理的理论,其中的“贝叶斯定理(或贝叶斯公贝叶斯定理(或贝叶斯公式)式)”给出了在已知结果E后,对所有原因C计算其条件概率(后验概率)的公式,可以看作最早的一种统计推断统计推断程序,以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法贝叶斯方法.
5、采用这种方法作为统计推断所得的全部结果,构成贝叶斯贝叶斯统计方法统计方法的内容.10 贝叶斯统计方法贝叶斯统计方法 贝叶斯统计贝叶斯统计在理论上的进展以及它在应用上的方便和效益,使其观点为许多的人所了解,并对一些统计学者产生吸引力.而认为贝叶斯方法是唯一合理的统计推断方法的统计学者,形成数理统计学中的贝叶斯学派贝叶斯学派.如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计等等.11 Thomas BayesThomas Bayes,一位伟大的数学大师,他,一位伟大的数学大师,他的理论照亮了今天的计算领域,和他
6、的同的理论照亮了今天的计算领域,和他的同事们不同:他认为上帝的存在可以通过方事们不同:他认为上帝的存在可以通过方程式证明,他最重要的作品被别人发行,程式证明,他最重要的作品被别人发行,而他已经去世而他已经去世241241年了。年了。搜索巨人搜索巨人GoogleGoogle使用了贝叶斯定理为数据搜使用了贝叶斯定理为数据搜索提供近似的(但是技术上不确切)结果。索提供近似的(但是技术上不确切)结果。12 贝叶斯理论的一个出名的倡导者就是微软。该公司把概率用于它的Notification Platform。该技术将会被内置到微软未来的软件中,而且让计算机和蜂窝电话能够自动地过滤信息,不需要用户帮助,自
7、动计划会议并且和其他人联系。如果成功的话,该技术将会导致“context server”-一种电子管家的出现,它能够解释人的日常生活习惯并在不断变换的环境中组织他们的生活。13 全概率公式全概率公式 14 贝叶斯定理贝叶斯定理 Bayes Rule 15 事件A发生的可能原因是事件B(B1BN),B为一个完备事件集 如果原因B值已经给定,很显然能确定事件A发生的概率;如果已经产生了(观测到)结果A,那么我们无法确定导致结果A的原因是哪个Bi,然而我们可以根据贝叶斯公式可知,只要知道先验概率P(Bi)及条件概率条件概率P(A|Bi)此结果A是由某个原因Bi所导致的概率。模式分类问题:模式类别“原
8、因”,观测到的特征值“结果”看作“原因”如果把),(21NBBBB看作“结果”把A16 模式识别中的贝叶斯公式模式识别中的贝叶斯公式 17 evidencepriorlikelihoodposterior证据因子先验概率似然函数后验概率18 计算实例1 原因模式类:原因模式类:加工加工A零件零件/加工加工B零件零件 结果特征值:结果特征值:观测到停机观测到停机/正常正常 19 计算实例1答案 20 计算实例2 原因模式类:原因模式类:第一台车床生产第一台车床生产/第二台车床生产第二台车床生产 结果特征值:结果特征值:观测到零件合格品观测到零件合格品/废品废品 21 计算实例2答案 22 计算实
9、例3 原因模式类:原因模式类:火车火车/轮船轮船/汽车汽车/飞机飞机 结果特征值:结果特征值:迟到迟到/正常正常 23 计算实例3答案 24 问题 Clinical Problem 25 2.2几种常用的决策规则 最小错误率贝叶斯决策最小错误率贝叶斯决策 最小风险贝叶斯决策最小风险贝叶斯决策 在限定一类错误率条件下使另一类错误率为最小的两类别决策 最大最小决策 序贯分类方法 分类器设计 26 统计模式识别的基本模型(黑箱模型)Black Box Decision 3x27 Black Box xcicxxxxxxdiTdd,2,1,2121表示,个类别,各类别状态用在数学上表示为个特征参数x1
10、,.,21212121caUnknowncapPPdcciiiac,类条件概率密度函数先验概率,维欧氏空间的点是xx)(Xf28 海鱼分类例子 sea bass/salmon 自然分布状态 prior 自然分布是一个随机 如实际捕到的 salmon和bass数目相等,则可假定 P(1)=P(2)(相等的先验概率)P(1)+P(2)=1(两类问题)29 仅根据先验概率信息作出判断 Decide 1 if P(1)P(2)otherwise decide 2 如仅做一次判断尚可,如需进行多次判断,感到困惑:P(1)=P(2)增加判断的依据信息!30 使用鱼的光泽度指标信息x来提高分类器性能 不同的
11、鱼产生不同的光泽度,其分布取决于鱼的种类,可使用使用“类条件概率密度”函数表示(class conditional probability density)P(x|1)and P(x|2)sea bass 和 salmon 两类鱼间的光泽度的区别。31 32 根据贝叶斯公式:后验概率Posterior,似然likelihood,证据evidence P(j|x)=P(x|j).P(j)/P(x)其中对于两类问题 Posterior=(LikelihoodPrior)/Evidence 2j1jjj)(P)|x(P)x(P 33 34 根据后验概率进行决策判断 X 为观测值特征:if P(1|x
12、)P(2|x)判为 1 if P(1|x)P(2|x),判别为1;否则,判别为2 因此,方法的判别错误率:P(error|x)=min P(1|x),P(2|x)(贝叶斯决策)36 不同的准则要求,导致不同的决策规则 Black Box Decision x2.2.1 基于最小错误率的贝叶斯决策 “模式识别结果的错误率最小”“模式识别结果的错误率最小”作为分类决策规则 37 细胞切片识别,用x表示每个切片的参数(特征(特征模式)模式)用表示模式的状态(模模式类式类)=1表示正常 =2表示异常(癌细胞)P(1),P(2)先验概率 假设P(1)=0.95,P(2)=0.05。在没得到x 之前,因P
13、(1)P(2),所以决策=1,犯错的概率小。P(1)+P(2)=1 例:38 p(x|1)正常状态下观测x的类条件概率密度 p(x|2)异常状态下观测x的类条件概率密度 状态先验概率P(i),i=1,2 类条件概率p(x|i),i=1,2 后验概率:(根据贝叶斯公式)x p(x|1)x p(x|2)39 1,2)(i 21jjjiiiPxpPxpxPx P(1|x)1.0 P(2|x)ab40 最小错误率的贝叶斯决策规则:称为似然比阈值。否则则若似然比否则则若则如果则如果122121122112212,12,1 lnlnln)(maxmaxPPxxPPxpxpxhxxPPxpxpxlxPxpP
14、xpxxPxPijjjiiijji 似然比阈值 41 平均错误概率 7)-(2 ,6)-(2 ,212121xPxPxPxPxPxPxePdxxpxePdxxePeP当当 ePP11 ePP2211Pxp22Pxpt 1R2Rx)x(i的条件错误概率时,作出决策42 页最小?书为什么决策规则使)得)代入(是两类的分界面,将(设12)(,627211221122112221122111221221ePePPePPdxxpPdxxpPPRxPPRxPRxPRxPePdxPxpdxPxpdxxpxPdxxpxPePtRRtttt43 基于最小错误率的贝叶斯决策规则,对于每个x,都使条件错误概率最小,
15、因此使平均错误率P(e)的积分计算式(26)积分项值达到最小,因此使平均错误率最小。推广到多类决策过程。44 举例 45 举例 46 如果先如果先验概验概率不相等的情率不相等的情况况下,分下,分类类决决策策 47 2.2.2 基于最小风险贝叶斯决策 xxxx,2,1,x,x1dpRRaiPERcjjjijiiClassifierixjz(条件风险)期望风险,平均风险 导致的代价为我们选择了决策,并得到观测当产生了ijx,48 最小风险贝叶斯决策规则:kiaikRR则,xminx,.,2,1 kiaikcjjjiijjjRRPRPcjpP则计算后验概率和及已知,xminx)4(x,x)3(x)2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 二章贝叶斯 决策 理论
限制150内