第2章 随机模式的分类方法1优秀PPT.ppt
《第2章 随机模式的分类方法1优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第2章 随机模式的分类方法1优秀PPT.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第2章章 随机模式的分随机模式的分类方法方法1现在学习的是第1页,共38页Made in CV&PRLab of Shandong University 目目 录录2.1 引言引言12.2 最小错误率判决规则(最简单的最小错误率判决规则(最简单的Bayes分类方法)分类方法)22.3 最小风险判决规则最小风险判决规则32.4 最大似然比判决规则最大似然比判决规则42.5 Neyman-Pearsen判决规则判决规则-有时不知道先验概率,仅知道类概率密度有时不知道先验概率,仅知道类概率密度52.6 最小最大判决规则最小最大判决规则-先验概率是变化的先验概率是变化的62.7 分类器设计分类器设计
2、6现在学习的是第2页,共38页Made in CV&PRLab of Shandong University2.1 引言引言随机模式随机模式 在可以觉察到的客观世界中,存在着大量的物体和事件,他们在基本条件不变时,具有在可以觉察到的客观世界中,存在着大量的物体和事件,他们在基本条件不变时,具有某种不确定性,每一次观测的结果没有重复性,这种模式就是随机模式。某种不确定性,每一次观测的结果没有重复性,这种模式就是随机模式。虽然随机模式样本测量值具有不确定性,但同类抽样实验的大量样本的观测值具有某种统计特性,这虽然随机模式样本测量值具有不确定性,但同类抽样实验的大量样本的观测值具有某种统计特性,这个
3、统计特性是建立各种分类方法的基本依据。个统计特性是建立各种分类方法的基本依据。先看一下确定性模式判决函数的问题。先看一下确定性模式判决函数的问题。现在学习的是第3页,共38页Made in CV&PRLab of Shandong University2.1 引言引言 通过判决函数,特征空间通过判决函数,特征空间被区分界面划分成两种类型的区域被区分界面划分成两种类型的区域A和和B。由于模式样。由于模式样本的观测值是确定性的,经常被正确分配到类型本的观测值是确定性的,经常被正确分配到类型区域区域A、B之中。之中。假如我们用概率的形式来表达,就是:在类型假如我们用概率的形式来表达,就是:在类型A的
4、条的条件下观测模式样本件下观测模式样本x,则,则x位于区域位于区域A的概率为的概率为1,而位于区域而位于区域B的概率为的概率为0。同样,在类型同样,在类型B的条件下观测模式样本的条件下观测模式样本x,情况,情况正好相反,正好相反,x位于区域位于区域A的概率为的概率为0,而位于区域,而位于区域B的的概率为概率为1。这实际上是将概率的方法引入到确定模式,对。这实际上是将概率的方法引入到确定模式,对于大多数实际情况,这是非常理想的概率分布于大多数实际情况,这是非常理想的概率分布。现在学习的是第4页,共38页Made in CV&PRLab of Shandong University 许多实际情况,
5、即使在类型许多实际情况,即使在类型A的条件下,模式样本的条件下,模式样本x位于区域位于区域A的概率也往往小于的概率也往往小于1,而位于区,而位于区域域B的概率也不为的概率也不为0。对于类型。对于类型B的条件也一样。这种交错分布的样本使分类发生错误,是的条件也一样。这种交错分布的样本使分类发生错误,是模式随机性的一种表现。此时,分类方法就从确定性模式转到随机模式。模式随机性的一种表现。此时,分类方法就从确定性模式转到随机模式。“如何使分类错误率尽可能小,是研究各种分类方法的中心议题。”2.1 引言引言现在学习的是第5页,共38页Made in CV&PRLab of Shandong Unive
6、rsityBayes决策理论是随机模式分类方法最重要的基础。决策理论是随机模式分类方法最重要的基础。其中几个重要的概念:先验概率先验概率 先验概率是预先已知的或者可以估计的模式识别系统位于某种类型的概率。先验概率是预先已知的或者可以估计的模式识别系统位于某种类型的概率。类(条件)概率密度类(条件)概率密度 它是系统位于某种类型条件下,模式样本它是系统位于某种类型条件下,模式样本x出现的概率密度分布函数出现的概率密度分布函数 后验概率后验概率 后验概率可以根据贝叶斯公式计算出来,可直接用作分类判决的依据。后验概率可以根据贝叶斯公式计算出来,可直接用作分类判决的依据。2.1 引言引言现在学习的是第
7、6页,共38页Made in CV&PRLab of Shandong University1.先验概率先验概率 先验概率是预先已知的或者可以估计的模式识别系统位于某种类型的概率。先验概率是预先已知的或者可以估计的模式识别系统位于某种类型的概率。若仍然用两个类型若仍然用两个类型A和和B为例,可用为例,可用 和和 表示各自的先验概率,此时满足表示各自的先验概率,此时满足 。推广到一般的推广到一般的c类问题中,用类问题中,用 表示类型,则各自的先验概率用表示类型,则各自的先验概率用 表示,且满足:表示,且满足:其实,在处理实际问题时,有时不得不以先验概率的大小作为判决的依据。如:有一批木其实,在处
8、理实际问题时,有时不得不以先验概率的大小作为判决的依据。如:有一批木材,其中桦木占材,其中桦木占70,松木占,松木占30,A桦木,桦木,B松木,则,如果从中任取一块木材,松木,则,如果从中任取一块木材,而又要用先验概率作出判决,那就判为桦木。而又要用先验概率作出判决,那就判为桦木。先验概率不能作为判决的唯一依据,先验概率不能作为判决的唯一依据,但当先验概率相当大时,它也能成为主要因素。但当先验概率相当大时,它也能成为主要因素。2.1 引言引言现在学习的是第7页,共38页Made in CV&PRLab of Shandong University2.1 引言引言2类(条件)概率密度类(条件)概
9、率密度 它是系统位于某种类型条件下,模式样本x出现的概率密度分布函数,常用 ,以及 来表示。先验概率密度在分类方法中起至关重要的作用,它的函数形式及主要参数或者是已知的,或者是可通过大量抽样实验估计出来。3.后验概率后验概率 它是系统在某个具体的模式样本x条件下,位于某种类型的概率,常以 ,以及 表示。后验概率可以根据贝叶斯公式计算出来,可直接用作分类判决的依据。例如:一个2类问题,w1表示诊断为无癌症,w2诊断为有癌症。P(w1)表示诊断正常的概率,P(w2)表示某地区的人被诊断出患上癌症的概率,该值可以通过大量的统计得到,x表示“试验反应呈阳性”。那么,P(x|w1)表示诊断为无癌症且试验
10、反应为阳性,P(w1|x)表示试验为阳性,而且没有癌症。同样,可以有w2的类概率密度和后验概率。现在学习的是第8页,共38页Made in CV&PRLab of Shandong University2.2 最小错误率判决规则最小错误率判决规则(最简单的(最简单的Bayes分类方法)分类方法)分析一个分析一个“两类问题两类问题”。以上一个例子为例,用以上一个例子为例,用w1和和w2表示两种不同的类型,如表示两种不同的类型,如w1表示诊断正常,表示诊断正常,w2表示表示诊断出患有癌症。诊断出患有癌症。用用 和和 分别表示先验概率。如:分别表示先验概率。如:诊断正常的概率,诊断正常的概率,表示某
11、地表示某地人患癌症的概率,可通过大量的统计得到。人患癌症的概率,可通过大量的统计得到。用用 和和 表示两个类概率密度。表示两个类概率密度。样本x表示“试验反应阳性”,则 诊断为无癌症且试验反应为阳性,试验为阳性且没有癌症。根据全概率公式,模式样本x出现的全概率密度为:(2.21)根据Bayes公式,在模式样本x出现的条件下,两个类型的后验概率为:(2.22)现在学习的是第9页,共38页Made in CV&PRLab of Shandong University此时,样本归属于“后验概率较高”的那种类型。也就是:,则偶然决定,或(2.23),则,则根据(2.22)式,上述判决规则等价于:,则,
12、则(2.24),则偶然决定,或 上面只是给出了最小错误率贝叶斯决策规则,但没有证明按这种规则进行分类确实使错误率最小。2.2 最小错误率判决规则最小错误率判决规则现在学习的是第10页,共38页Made in CV&PRLab of Shandong University下面用一维情况来证明最小错误率贝叶斯决策规则,其结果不难推广到多维。如下图所示,在一维特征空间里,判决门限t把空间划分为两个类型区域R1,R2 在R1中,则在R2中,则;阴影区域是两类样本的交错分配区域,阴影面积就是这种分类方法的错误概率。2.2 最小错误率判决规则最小错误率判决规则现在学习的是第11页,共38页Made in
13、CV&PRLab of Shandong University总错误率有两种情况:,而判为,斜线区域。,而判为所以,总错误率:,纹线区域。其中,表示在整个d维特征空间上的积分。对上述两类问题:当时,则显然作出决策w2时,x的条件错误概率为,反之为。也就是:=2.2 最小错误率判决规则最小错误率判决规则现在学习的是第12页,共38页Made in CV&PRLab of Shandong University若令t为两类分界面,特征向量x为一维时,t为x轴上的一个点,如上图所示:也可写为:2.2 最小错误率判决规则最小错误率判决规则现在学习的是第13页,共38页Made in CV&PRLab
14、of Shandong University 所以要使 最小,判决门限应如上图所示,否则就会有多余的阴影面。而(2.2-3)、(2.2-4)表达的判决规则,判决门限正好如上图所示,所以称之为“最小错误概率判决规则”。2.2 最小错误率判决规则最小错误率判决规则现在学习的是第14页,共38页Made in CV&PRLab of Shandong University可以把上述两类问题导出的最小错误率判决规则一般化,推广到c类问题中,表达为:若:,则等价于:,则2.2 最小错误率判决规则最小错误率判决规则例1:为了对癌症进行诊断,对一批人进行一次普查,各每个人打试验针,观察反应,然后进行统计,规
15、律如下:这一批人中,每1000个人中有5个癌症病人;这一批人中,每100个正常人中有一个试验呈阳性反应;这一批人中,每100个癌症病人中有95人试验呈阳性反应。问:若某人(甲)呈阳性反应,甲是否正常?现在学习的是第15页,共38页Made in CV&PRLab of Shandong University2.2 最小错误率判决规则最小错误率判决规则解:假定x表示实验反应为阳性,(1)人分为两类:w1正常人,w2癌症患者,(2)由已知条件计算概率值:先验概率:类条件概率密度:(3)决策过程 由最小错误判决规则,可知:由于 比 大很多,所以先验概率起了较大作用。现在学习的是第16页,共38页Ma
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2章 随机模式的分类方法1优秀PPT 随机 模式 分类 方法 优秀 PPT
限制150内