误差分析数据判别分析幻灯片.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《误差分析数据判别分析幻灯片.ppt》由会员分享,可在线阅读,更多相关《误差分析数据判别分析幻灯片.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、误差分析课件数据判别分析第1页,共52页,编辑于2022年,星期二判别分析概念及应用o概念o应用第2页,共52页,编辑于2022年,星期二判别分析概念o在自然科学与社会科学等众多领域中,研究对象往往用某种方式已划分为若干类型,当得到一个新的样品,要确定该样品属于已知类型的哪一类,这类问题就属于判别分析.第3页,共52页,编辑于2022年,星期二判别分析的应用o在工业生产中判断产品的等级;o在经济发展中判断一个国家经济发展程度;o医学中根据化验结果判断病人的疾病类型等.第4页,共52页,编辑于2022年,星期二相似性测度o判断样品之间的相似性常采用近邻准则,就是把待分类样品与标准模版进行比较,看
2、和哪个模版匹配程度更好,从而确定待测样品的分类。o计算模式相似性测度有欧式距离、马氏距离、夹角余弦距离、Tanimoto测度等多种距离算法。第5页,共52页,编辑于2022年,星期二近邻准测分类的两种计算方法o1 通过与样品库所有样品特征分别作相似性测度,找出最接近的样品,取该样品所属类别作为待测样品的类别。o2 待测样品与样品库中不同类别的中心或重心作相似性测度,找出最接近类的中心,以该类作为待测样品的类别。第6页,共52页,编辑于2022年,星期二距离算法o样品与样品之间的距离o样品与类之间的距离o类内距离o类与类之间的距离第7页,共52页,编辑于2022年,星期二样品间距离示意图o同类内
3、样品间的距离o不同类内样品间的距离第8页,共52页,编辑于2022年,星期二样品与样品之间的距离oA:oB:第9页,共52页,编辑于2022年,星期二样品间的距离计算公式第10页,共52页,编辑于2022年,星期二样品与类之间的距离oW为代表某类样品的集合,其中有n个样品,x为待测样品。第11页,共52页,编辑于2022年,星期二样品与类的距离的计算方法o1 计算待测样品和类中每个样品之间的距离后求平均值。o2 计算类的中心点,以类中所有的样品特征的平均值作为类的中心,然后计算待测样品到中心点的距离。第12页,共52页,编辑于2022年,星期二类内距离o同一个类内任意样品之间距离之和的平均值第
4、13页,共52页,编辑于2022年,星期二类与类之间的距离o最短距离法、最长距离法、重心法、平均距离法第14页,共52页,编辑于2022年,星期二数据判别的方法模版匹配o把未知样品和一个标准模版相比,看它们是否相同或者相似。o两类别o多类别第15页,共52页,编辑于2022年,星期二两类别o有两个标准样品模版为A和B,其特征向量分别为X和Y,任何一个待识别的样品为M,可以用距离判别来判断它属于A或者B,如果M和A的距离近则属于A,否则属于B。这就是最小距离判别法。第16页,共52页,编辑于2022年,星期二多类别o多种类别,每类有N个样品,计算待测样品到各类中心的马氏距离,比较各距离,取最小的
5、距离值,则待测样品就属于该类。第17页,共52页,编辑于2022年,星期二马氏距离o在判别分析中最常用到马氏距离,此方法考虑到了欧式分布中没有考虑到的总体分布的分散性信息。o设x,y是来自均值向量为 、协方差矩阵 的总体G的两个样品,则x,y之间的马氏距离是o 而两个总体G1和G2,其均值向量分别为和 ,G1和G2的协方差距阵相等,皆为,则总体G1和G2间的马氏距离是 第18页,共52页,编辑于2022年,星期二马氏距离的性质o1o2o3第19页,共52页,编辑于2022年,星期二马氏距离判别的合理性o设G1为正态总体o它们的概率密度为:oG2为正态总体第20页,共52页,编辑于2022年,星
6、期二马氏距离判别的合理性o两个总体的协方差矩阵相等,对于新产品X,要判别X属于哪个总体,根据统计学似然比准则,很自然应将X判归在该样品观测处其概率密度较大的那个总体。o即有下列判别准则:第21页,共52页,编辑于2022年,星期二马氏距离判别的合理性o而 的充分必要条件是:o即,(马氏距离)因此,当两个总体G1和G2为正态总体且其协方差矩阵相等时,采用马氏距离判别准则和似然比准则时一致的。第22页,共52页,编辑于2022年,星期二具体讨论两个总体协方差矩阵相等或不等的情况o1当两个总体协方差矩阵相等时,考虑样品X到两总体的马氏平方距离的差:第23页,共52页,编辑于2022年,星期二具体讨论
7、两个总体协方差矩阵相等或不等的情况o记o则第24页,共52页,编辑于2022年,星期二具体讨论两个总体协方差矩阵相等或不等的情况o这样,距离判别准则化为o其中W1和W2都是线性判别函数,在实际问题中,通常以来自总体的训练样本的均值和协方差来估计线性判别函数。第25页,共52页,编辑于2022年,星期二具体讨论两个总体协方差矩阵相等或不等的情况o2 当两个总体协方差矩阵不等的时候第26页,共52页,编辑于2022年,星期二多个总体的距离判别oN个总体均值向量和协方差矩阵已知,计算待测样品X到各总体的马氏距离,比较这N个距离,判断X属于其马氏距离最小的总体,如果最小距离在不止一个总体达到,则可将X
8、判给具有最小距离总体的任何一个。第27页,共52页,编辑于2022年,星期二判别准则的评价o1 误判率回代估计法o2 误判率的交叉确认估计法第28页,共52页,编辑于2022年,星期二误判率回代估计法o设G1和G2为两个总体,容量分别为n1、n2,以全体训练样本作为n1n2个新样品,逐个代入已建立的判别准则中判别其归属。第29页,共52页,编辑于2022年,星期二误判率回代估计法o其中n12是将属于G1的样品误判为属于G2的个数,n21是将属于G2的样品误判为属于G1的个数,总的误判个数是n12n21,而总体n1n2,误判率回代估计为第30页,共52页,编辑于2022年,星期二误判率的交叉确认
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差 分析 数据 判别分析 幻灯片
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内