模式识别-3-贝叶斯决策理论.ppt
《模式识别-3-贝叶斯决策理论.ppt》由会员分享,可在线阅读,更多相关《模式识别-3-贝叶斯决策理论.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 贝叶斯决策理论贝叶斯决策理论v基础知识基础知识v贝叶斯决策分类贝叶斯决策分类v正态分布决策理论正态分布决策理论v几种常用决策规则几种常用决策规则v基于最小风险的贝叶斯决策基于最小风险的贝叶斯决策v聂曼皮尔逊决策聂曼皮尔逊决策v最小最大决策最小最大决策v序贯分类序贯分类v关于分类器的错误率分析关于分类器的错误率分析v贝叶斯决策分类算法的实例贝叶斯决策分类算法的实例3-1 基础知识基础知识v贝叶斯决策理论是统计模式识别中的基本理论之一,用其进行分类时要求:v各类别总体的概率分布是已知的;v要决策分类的类别数是一定的。说明:说明:若要研究的分类问题有c个类别,各类别状态用 表示,对应于
2、各个类别的先验概率为 ,类的条件密度函数为 。对于 称为d维随机特征向量随机特征向量,通过对被识别对象的多次观察和测量(即采样过程)得到;并将其作为某一个判决规则的输入,按此规则来对样本进行分类。v确定性特征向量与随机特征向量确定性特征向量与随机特征向量v确定性特征向量确定性特征向量 在获取模式的观测值时,有些事物具有确定的因果关系,即在一定条件下,存在必然会发生或必然不发生的确定性,这样获得的特征向量称为确定性特征向量。v例如识别一块模板是不是直角三角形,只要凭“三条直线边闭合连线和一个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完全可以确定它是不是直角三角形。v这种现象
3、是确定性的现象,比如上一讲的线性模式判别就是基于这种现象进行的。高性价比安卓智能手机排行榜_热门促销智能手机推荐v随机特征向量随机特征向量 在现实世界中,对于许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性。只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性。此时,特征向量不再是一个确定的向量,而是一个随机向量。因此,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小。v样本概率、先验概率、条件概率与后验概率样本概率、先验概率、条件概率与后验概率 若模式空间样本为x,分为类别 ,则有:v样本概率:样本概率:模式
4、空间的样本x x是通过多次观察得到的,样本点的出现具有随机性,P(x)表示样本x x出现的概率,也就是在全体样本中出现的概率。v先验概率:先验概率:对于多类问题,类别状态 出现的概率,称为先验概率v条件概率:条件概率:在类别 中,样本x出现的概率,称为条件概率v后验概率:后验概率:对于样本x,其来自于类别 的概率,称为后验概率 对x再观察:有细胞光密度特征,有类条件概率密度:P(x/i)i=1,2,,如右上图所示。v利用贝叶斯公式利用贝叶斯公式:3-2 贝叶斯决策分类器贝叶斯决策分类器最优分类、最佳分类最优分类、最佳分类一、两类问题一、两类问题例如:某地区,细胞识别问题:1正常细胞,2异常细胞
5、。经大量统计获得先验概率为:P(1),P(2)。若取该地区某人细胞x属何种细胞,只能由先验概率决定。设N个样本分为两类1,2。每个样本抽出n个特征,x=(x1,x2,x3,xn)T 通过对细胞的再观察,就可以把先验概率转化为后验概率,利用后验概率可对未知细胞x进行识别。1.判别函数:判别函数:若已知先验概率P(1),P(2),类条件概率密度P(x/1),P(x/2)。则可得贝叶斯判别函数四种形式:判别函数:判别函数:2.决策规则:决策规则:3.决策面方程:决策面方程:x为一维时,决策面为一点,x为二维时决策面为曲线,x为三维时,决策面为曲面,x大于三维时决策面为超曲面。例例:某地区细胞识别;P
6、(1)=0.9,P(2)=0.1 未知细胞x,先从类条件概率密度分布曲线上查到:解解:该细胞属于正常细胞还是异常细胞,先计算后验概率:P(x/1)=0.2,P(x/2)=0.4g(x)阈值单元4.分类器设计:分类器设计:说明:说明:所所定义的决策规则实际上是使对每个样本的分类错误取小,即使分类的平均错误率P(e)达到最小。因此,贝叶斯决策分类器具有最小错误率,称为贝叶斯意义下的最优分类。二、多类情况:二、多类情况:i=(1,2,m),x=(x1,x2,xn)1.判别函数:M类有M个判别函数g1(x),g2(x),gM(x).每个判别函数有上面的四种形式。2.决策规则:另一种形式:3.决策面方程
7、:4.分类器设计:g1(x)Max(g(x)g2(x)gn(x)一、正态分布判别函数一、正态分布判别函数1、为什么采用正态分布:a、正态分布在物理上是合理的、广泛的。b、正态分布数学上简单,N(,)只有均值和方差两个参数。2、单变量正态分布:3-3 正态分布决策理论正态分布决策理论3、(多变量)多维正态分布(1)函数形式:(2)、性质:、与对分布起决定作用P(x)=N(,),由n个分量组成,由n(n+1)/2元素组成。多维正态分布由n+n(n+1)/2个参数组成。、等密度点的轨迹是一个超椭球面。区域中心由决定,区域形状由决定。、不相关性等价于独立性。若xi与xj互不相关,则xi与xj一定独立。
8、、边缘分布与条件分布的正态性。、线性变换的正态性Y=AX,A为线性变换矩阵。若X为正态分布,则Y也是正态分布。、线性组合的正态性。判别函数:判别函数:类条件概率密度用正态来表示:决策面方程决策面方程:二、最小错误率二、最小错误率(Bayes)分类器:分类器:从最小错误率这个角度来分析Bayes 分类器1.第一种情况:第一种情况:各个特征统计独立,且同方差情况。判别函数:判别函数:最小距离分类器:最小距离分类器:未知样本x与i相减,找最近的i把x归类如果M类先验概率相等:讨论:对于未知样本x,把x与各类均值相减,把x归于最近一类,即为最小距离分类器。2.第二种情况:第二种情况:i 相等,即各类协
9、方差相等。几何上看,相当于各类样本集中于以均值点为中心的同大小和形状的超椭球内。讨论:讨论:针对1,2二类情况,如图:3.第三种情况第三种情况(一般情况):i为任意,各类协方差矩阵不等,二次项xT i x与i有关,所以判别函数为二次型函数判别函数为二次型函数。讨论:讨论:在给定的三个条件下,不同的决策面只是由于方差项的差异而引起的,图中用等概率轮廓线表征相应类别的方差。对于(a)图,的方差比 小,因此来自 的样本更加可能在该类的均值附近找到,且由于圆的对称性,决策面是包围 的一个圆;若把 轴伸展,图(b)的决策面就伸展为一个椭圆;若两类的条件概率在 方向上具有相同的方差,但在 方向上 的方差比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 贝叶斯 决策 理论
限制150内