模式识别第二章优秀PPT.ppt
《模式识别第二章优秀PPT.ppt》由会员分享,可在线阅读,更多相关《模式识别第二章优秀PPT.ppt(109页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别第二章你现在浏览的是第一页,共109页贝叶斯决策理论贝叶斯决策理论 统计模式识别的统计模式识别的主要方法主要方法之一之一 随机模式随机模式分类方法的基础分类方法的基础 采用贝叶斯决策理论分类的采用贝叶斯决策理论分类的前提前提:目标(事物)的目标(事物)的观察值是随机的,服从一定的概观察值是随机的,服从一定的概 率分布。率分布。率分布。率分布。即:即:模式不是一个确定向量,模式不是一个确定向量,而是一个随机向量。而是一个随机向量。你现在浏览的是第二页,共109页用贝叶斯决策理论分类的用贝叶斯决策理论分类的要求要求:各类别总体各类别总体概率分布是已知概率分布是已知概率分布是已知概率分布是已
2、知的的 P(wi)及及p(x/wi)已知,或已知,或P(wi/x)已知已知决策分类的决策分类的类别确定类别确定类别确定类别确定你现在浏览的是第三页,共109页特征向量、特征空间:特征向量、特征空间:设某个样本(模式),可用设某个样本(模式),可用d d个特征量个特征量x x1 1,x x2 2,x,xd d来刻化,即来刻化,即x=xx=x1 1,x,x2 2,x,xd d T T 表示样本的特征向量表示样本的特征向量特征空间:特征空间:这些特征的取值范围构成的这些特征的取值范围构成的d d维空间,维空间,为特征空间。为特征空间。每一个样本可看作每一个样本可看作d d维空间的维空间的向量或点向量
3、或点特征向量特征向量:你现在浏览的是第四页,共109页相关统计量:相关统计量:nP(wP(wi i)类别类别w wi i出现的出现的先验概率先验概率n p p(x/w(x/wi i)类条件概率密度类条件概率密度,即类别状态为,即类别状态为w wi i类时,类时,出现模式出现模式x x的条件概率密度,也称的条件概率密度,也称似然函数似然函数。np p(x)(x)全概率密度全概率密度nP(wP(wi i/x)/x)后验概率后验概率,即给定输入模式,即给定输入模式x x时,该模式属于时,该模式属于w wi i类的条件概率。类的条件概率。nP(wP(wi i,x),x)联合概率联合概率 你现在浏览的是
4、第五页,共109页n相互关系:相互关系:n n贝叶斯公式:贝叶斯公式:你现在浏览的是第六页,共109页需解决的问题:需解决的问题:设:样本集设:样本集X,有,有C类别,各类别状态为类别,各类别状态为wi,i=1,C。已知。已知P(wi)及及p(x/wi)要解决的问题是:要解决的问题是:要解决的问题是:要解决的问题是:当观察样本当观察样本x=xx=x1 1,x,x2 2,x,xd d T T 出现时,出现时,如何将如何将x x划归划归为某一类为某一类。你现在浏览的是第七页,共109页方法:方法:已知类别的已知类别的P(P(w wi i)及及x x的的p(x/p(x/w wi i),利用贝叶斯公式
5、,利用贝叶斯公式,可得类别的后验概率可得类别的后验概率P(P(w wi i/x)/x)再基于再基于最小错误概率准则、最小风险准则等最小错误概率准则、最小风险准则等最小错误概率准则、最小风险准则等最小错误概率准则、最小风险准则等,就可统计判决分类。就可统计判决分类。你现在浏览的是第八页,共109页2.2 2.2 几种常用的决策规则几种常用的决策规则1 1基于最小错误率的贝叶斯决策基于最小错误率的贝叶斯决策分类准则:分类准则:错误率最小错误率最小讨论讨论两类问题两类问题的决策:的决策:w w1 1,w,w2 2例如:癌细胞检查、产品质量等例如:癌细胞检查、产品质量等你现在浏览的是第九页,共109页
6、合理决策依据:合理决策依据:根据后验概率决策根据后验概率决策 已知已知后验概率后验概率P(wP(w1 1|x),P(w|x),P(w2 2|x)|x),决策规则决策规则:当当P(wP(w1 1|x)P(w|x)P(w2 2|x)x|x)x w w1 1,当当P(wP(w1 1|x)P(w|x)11,12 22下面给出下面给出 R与与P(w)的函数关系的函数关系:你现在浏览的是第五十一页,共109页平均风险(即总风险、也称期望风险):平均风险(即总风险、也称期望风险):根据根据R(R(i i/x)/x)定义定义及贝叶斯公式及贝叶斯公式 1 1的决策区域的决策区域 2 2的决策区域的决策区域(将(
7、将 R R表示成表示成P(w)P(w)的函数)的函数)你现在浏览的是第五十二页,共109页利用利用 代入上式代入上式,整理得:整理得:其中:其中:目的:需要目的:需要分析平均风险分析平均风险R R与与P(wP(w1 1)的关系的关系用用P(wP(w1 1)表示表示平均风险平均风险R:R:你现在浏览的是第五十三页,共109页可见:可见:1)一旦决策区域一旦决策区域R1,R2确定确定,即即a,b为常数为常数,平均风,平均风险险R就是就是P(w1)的的线性函数线性函数线性函数线性函数;即;即P(w1)变化时,变化时,R1,R2不不作调整,则平均风险作调整,则平均风险R与与P(w1)呈呈线性关系。线性
8、关系。2)P(w1)变化时,变化时,决策区域决策区域R1,R2划分也变化,即划分也变化,即a,b变化,变化,则平均风险则平均风险R与与P(w1)是非线性关系。是非线性关系。求求R与与P(w1)的关系曲线:的关系曲线:即即R=fP(w1)你现在浏览的是第五十四页,共109页先先取定取定P(wP(w1 1)求求R R P(wP(w1 1)曲线:曲线:按按最最小小风风险险贝贝叶叶斯斯决决策策确确定定分分类类面面,即即确确定定决决策策区区域域R1R1,R2R2利用上式求相应的利用上式求相应的最小风险最小风险R R*P(wP(w1 1)从从0 01 1取若干个值取若干个值,重复上述过程,得到,重复上述过
9、程,得到R R*P P(w(w1 1)关系曲线关系曲线见图见图2.42.4你现在浏览的是第五十五页,共109页 R与与P(w1)是非线性关系是非线性关系,且曲线上,且曲线上R值都对应每个值都对应每个P(w1)值的值的最小风险损失最小风险损失。图中图中R*是当是当P(w1)P*(w1)时的最小风险值时的最小风险值。R=fP(w1)你现在浏览的是第五十六页,共109页 如果区域如果区域R1、R2确定(确定(a,b为常数),为常数),意味意味判别门限判别门限判别门限判别门限固定。当固定。当固定。当固定。当P(wP(w1 1)变化时,变化时,变化时,变化时,R R与与与与P(wP(w1)为线性关系。为
10、线性关系。为线性关系。为线性关系。显然,显然,得不到最佳结果得不到最佳结果,因,因CD直线在曲线上方直线在曲线上方,且,且a R a+b这时这时R最大可能的风险值为最大可能的风险值为:R=a+b (图中(图中D点)点)不希望!不希望!见图中见图中CD直线直线你现在浏览的是第五十七页,共109页 取不同的固定门限,有不同直线,对应的取不同的固定门限,有不同直线,对应的R最最大值不同大值不同。直线。直线EF的最大值的最大值R=a+b P(w1)是不知或变化的,是不知或变化的,考虑如何使最大可能考虑如何使最大可能考虑如何使最大可能考虑如何使最大可能风险为最小风险为最小风险为最小风险为最小你现在浏览的
11、是第五十八页,共109页 如果有某个如果有某个P(w1),使最小风险决策得到的区域,使最小风险决策得到的区域R1、R2能能使使b=0,则,则 这时这时R与与P(w1 1)无关,即最大可能的风险达到最小无关,即最大可能的风险达到最小无关,即最大可能的风险达到最小无关,即最大可能的风险达到最小值为值为值为值为a a你现在浏览的是第五十九页,共109页1)以总风险)以总风险R对对P(w1)求极值求极值,即,即方法:方法:2)找出极值点找出极值点后,该点的切线就为水平线,后,该点的切线就为水平线,这时总风这时总风险险R与与P(w1)无关;无关;b=0b=0,意味,意味决策区域的划分使平均风险决策区域的
12、划分使平均风险R达到曲线的极达到曲线的极大值大值(最小风险的极大值)。(最小风险的极大值)。由由2-34求导,得求导,得令其为令其为0,得极大值,得极大值,你现在浏览的是第六十页,共109页见图见图2-4b,当,当P(w1)=P*M(w1)时,时,R=R*M为最大值。为最大值。对应决策区域不变时,对应决策区域不变时,R与与P(w1)的关系为的关系为一条平行线一条平行线C D,即不管即不管P(w1)如何变化,风险不再变化如何变化,风险不再变化。使最大风险达到了最小化!使最大风险达到了最小化!使最大风险达到了最小化!使最大风险达到了最小化!你现在浏览的是第六十一页,共109页总结:当当P(w1)变
13、化时,变化时,应选使风险应选使风险R达最大值(达最大值(b0)时的)时的P*(w1)来设计分类器来设计分类器。在这种分类决策区域,。在这种分类决策区域,能保证不管能保证不管P(w1)如何变化,最大风险为最小值如何变化,最大风险为最小值a。最小最大决策任务就是寻找最小最大决策任务就是寻找使使R最大时的决策域最大时的决策域R1,R2,即即求求b=0的决策域的决策域,由,由2-35求解。求解。你现在浏览的是第六十二页,共109页2.2.5 序贯分类方法序贯分类方法 实际中,为得到实际中,为得到x的的d个观测值,要个观测值,要花费代价花费代价。考虑每个特征值提取所花的代价,最优分类结果不一考虑每个特征
14、值提取所花的代价,最优分类结果不一定将定将d个特征值全部使用;个特征值全部使用;另外,虽然特征数目增多,一般判决风险另外,虽然特征数目增多,一般判决风险R(i/x)降降低,但每个低,但每个特征值贡献不同。特征值贡献不同。排队从大排队从大小小,每投入一新特征,计算一次,每投入一新特征,计算一次R,同时,同时计算获取新特征应付出的代价与该特征对计算获取新特征应付出的代价与该特征对R的贡献之的贡献之和,和,比较后决定是否加入新特征。比较后决定是否加入新特征。序贯分类方法序贯分类方法你现在浏览的是第六十三页,共109页2.2.6 分类器设计分类器设计 c类分类决策问题:按决策规则把类分类决策问题:按决
15、策规则把d维特征空间分维特征空间分为为c个决策区域。个决策区域。决策面:决策面:划分决策域的划分决策域的边界面边界面称为决策面。称为决策面。数学上用决策面方程表示。数学上用决策面方程表示。几个概念几个概念判别函数判别函数:表达决策规则的函数表达决策规则的函数,称为判别函数。,称为判别函数。你现在浏览的是第六十四页,共109页1)定义一组)定义一组判别函数判别函数根据根据决策规则决策规则若若 ,将将x归于归于wi 类类即即讨论具体的讨论具体的判别函数、决策面方程、分类器设计判别函数、决策面方程、分类器设计你现在浏览的是第六十五页,共109页例:基于最小错误率贝叶斯判决规则,显然其例:基于最小错误
16、率贝叶斯判决规则,显然其 可可定义为:定义为:判别函数判别函数 有多种形式有多种形式你现在浏览的是第六十六页,共109页例:基于最小风险贝叶斯判决规则,判别函数例:基于最小风险贝叶斯判决规则,判别函数 可定义为:可定义为:显然,依据显然,依据最大值判别法最大值判别法,且,且 选择选择不是唯一不是唯一若将若将 都都乘以相同乘以相同的正常数或的正常数或加相同加相同的常量,的常量,不影响判决结果不影响判决结果你现在浏览的是第六十七页,共109页一般地一般地 是是单调递增函数单调递增函数,则分类结果不变,则分类结果不变 2)决策面方程决策面方程(即(即判决边界判决边界)若类型若类型wi与与wj的的 区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 第二 优秀 PPT
限制150内