最近邻分类器置信度估计的理论分析.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《最近邻分类器置信度估计的理论分析.pdf》由会员分享,可在线阅读,更多相关《最近邻分类器置信度估计的理论分析.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、最近邻分类器置信度估计的理论分析林晓帆 丁晓青 吴佑寿(清华大学电子工程系,北京 100084)摘要 分类器的置信度是模式识别中的一个重要参量,它在决定拒识门限和多分类器集成中起着关键作用.最近邻分类器是最经典、最常见的非参数统计模式识别方法.但是,如何确定它的分类结果的置信度?最近距离与置信度有何联系?在以往的文献中没有对这个问题做明确理论分析.对几个常见经验公式进行了理论分析,并论证了其中一种置信度度量的数学期望符合本文提出的广义置信度的要求;同时,在手写字符识别的实际应用中,这种置信度度量在用于拒识判决时,确实表现出了比其他度量更好的性能.关键词 最近邻分类器 置信度 最优拒识 手写字符
2、识别对于任何一个模式分类器,除了希望它有尽可能高的识别率外,还希望能比较准确地估计它的分类结果的准确性,即置信度.置信度的主要用途有:(1)为拒识提供依据.在很多应用场合下,我们不仅希望识别率尽可能高,还希望误识率低,在一定的分类器下,这只能通过拒识部分样本实现.这样就需要决定拒识哪一部分样本,如果拒识的样本总是识别置信度最低的样本,系统的误识率就会在拒识率一定的情况下获得最大幅度的下降.(2)为多方案集成提供根据.现在,多方案集成是模式识别的一个重要趋势.人们已不再满足于简单的表决,而希望能充分利用单个分类器的各种信息.其中,每个分类器的置信度是一种重要信息1.其意义是明显的:当多个分类器的
3、结果不同时,应当选择置信度比较大的分类器的结果,至少应给予较大的权重.鉴于置信度的重要地位,基本上各种应用系统都以某种方式给出置信度的估计.对于基于前向神经网络的分类器,文献 2 中证明了在使用均方误差或交叉熵做代价函数时,神经网输出的期望值是各个类别的后验概率,这就为用神经网的输出估计置信度提供了强有力的理论根据.而对于早在 60 年代就已提出、并在几十年的模式识别实践中得到广泛应用的最近邻分类器3,尽管人们在实践中采用了各种置信度估计的经验公式,未见有对这些估计的理论阐述.本文将从理论上分析各种经验公式的内涵,并指出其中一种估计量在物理概念上是优于其他估计量的.1 分类器的置信度和广义置信
4、度 设有一模式分类器 S,x 为从输入模式提取的特征向量,S 对x 的判决为es(x)(为 M 个类别之一),x 的真实类别为 X(x),则定义 es(x)正确的概率:cs(x)=P(es(x)=X(x)(1)为 S 在特征向量空间内点x 处的置信度.需要指出的是,置信度与我们常说的识别正确率之间是局部与整体的关系,即:置信度反映的是 S 在某点的判决可信度,而识别正确率是置信度在 x 定义域上的平均值.同时,若存在函数 fs(x)与 cs(x)对特征空间内任意两点 x1,x2总满足:fs(x1)fs(x2)Z cs(x1)cs(x2),(2)则称 fs(x)为 S 的广义置信度.显然,置信度
5、 cs(x)也是广义置信度.第43 卷 第 3 期科 学 通 报1998 年 2 月研究简报322 定理 对于模式分类器 S,给定拒识率 Pr,选择不同的拒识区域时,若拒识区域为 R=x cs(x)TH(Pr),则使分类器误识率 Pe 达到最低,其中 TH(Pr)是与 Pr 有关的一个门限值.推论 fs(x)是广义置信度,对于模式分类器 S,给定拒识率 Pr,选择不同的拒识区域时,拒识区域为 R=x fs(x)v 的概率:P(c1(x)v)=P(min(d1(x),d2(x)v)=P(d1(x)v 且d2(x)v)=P(d1(x)v)P(d2(x)v)=(1-P1(x-v,x+v)m(1-P2
6、(x-v,x+v)n,其中P1(y1,y2)=Qy2y1p(t X1)dt,P2(y1,y2)=Qy2y1p(t X2)dt,当 v 很小时,第43 卷 第 3 期科 学 通 报1998 年 2 月研究简报323 P(c1(x)v)=exp(mln(1-P1(x-v,x+v)+nln(1-P2(x-v,x+v)U exp(-mP1(x-v,x+v)-nP2(x-v,x+v)U exp(-2vmp(x X1)-2vnp(x X2).所以,c1(x)的概率密度q(v)=-dP(c1(x)v)/dv=2(mp(x X1)+np(x X2)exp(-2vmp(x X1)-2vnp(x X2).E(c1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 近邻 分类 置信 估计 理论 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内