第四章 判别分析优秀PPT.ppt





《第四章 判别分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章 判别分析优秀PPT.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 判别分析第一页,本课件共有55页内容和要求内容和要求l内容内容:判别分析简介、基本原理、判别分析方法判别分析简介、基本原理、判别分析方法l要求要求:l1、熟悉判别分析基本原理。、熟悉判别分析基本原理。l2、掌握常用的判别分析准则。、掌握常用的判别分析准则。3、能熟练使用软件进行判别分析,并能对判、能熟练使用软件进行判别分析,并能对判别结果作深入讨论。别结果作深入讨论。第二页,本课件共有55页第一节第一节 判别分析简介判别分析简介关于判别分析基本概念和基本原理关于判别分析基本概念和基本原理第三页,本课件共有55页一、什么是判别分析?一、什么是判别分析?l判别分析是在已知分类情况的条件下根
2、判别分析是在已知分类情况的条件下根据一定的指标对未知类别的数据进行归据一定的指标对未知类别的数据进行归类的方法。判别分析在生物学、医学、类的方法。判别分析在生物学、医学、地质学、石油、气象等领域得到较为广地质学、石油、气象等领域得到较为广泛的应用,在经济分析和市场研究中也泛的应用,在经济分析和市场研究中也是我们认知事物的重要方法。是我们认知事物的重要方法。l举例举例 第四页,本课件共有55页例 中小企业的破产模型为了研究中小企业的破产模型,选定4个经济指标:X1总负债率(现金收益/总负债)X2收益性指标(纯收入/总财产)X3短期支付能力(流动资产/流动负债)X4生产效率性指标(流动资产/纯销售
3、额)对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料:第五页,本课件共有55页总负债率总负债率收益性指标收益性指标短期支付能力短期支付能力生产效率指标生产效率指标类别类别-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.03
4、1.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532第六页,本课件共有55页.38.38.11.113.273.27.55.552 2.19.19.05.052.252.25.33.332 2.32.32.07.074.244.24.63.632 2.31.31.05.054.454.45.69.692 2.12.12.05.052.522.52.69.692 2-.02-.02.02.022.052.05.35.352 2.22.22.08.082.352.35.40.402 2.17
5、.17.07.071.801.80.52.522 2.15.15.05.052.172.17.55.552 2-.10-.10-1.01-1.012.502.50.58.582 2.14.14-.03-.03.46.46.26.262 2.14.14.07.072.612.61.52.522 2-.33-.33-.09-.093.013.01.47.472 2.48.48.09.091.241.24.18.182 2.56.56.11.114.294.29.45.452 2.20.20.08.081.991.99.30.302 2.47.47.14.142.922.92.45.452 2.17
6、.17.04.042.452.45.14.142 2.58.58.04.045.065.06.13.132 2.04.04.01.011.501.50.71.71待判待判-.06-.06-.06-.061.371.37.40.40待判待判第七页,本课件共有55页.07.07-.01-.011.371.37.34.34待判待判-.13-.13-.14-.141.421.42.44.44待判待判.15.15.06.062.232.23.56.56待判待判.16.16.05.052.312.31.20.20待判待判.29.29.06.061.841.84.38.38待判待判.54.54.11.112
7、.332.33.48.48待判待判第八页,本课件共有55页企业序号判别类型判别函数得分判别为1的概率判别为2的概率11-.56509.69479.3052121-.89817.80234.1976631-.59642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.6799572.27925.34442.65558821.24010.09012.90988第九页,本课件共有55页 判别分析利用已知类别的样本培训模型,为未知样本判类的一种统计方法。它产生于本世纪30年代。近年来,在自然科学、社会学及经济管理学
8、科中都有广泛的应用。判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。然后,当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。第十页,本课件共有55页二、判别分析原理二、判别分析原理l原理:原理:判判别别分分析析是是利利用用原原有有的的分分类类信信息息,得得到到体体现现这这种种分分类类的的函函数数关关系系式式(即即判判别别函函数数,一一般般是是与与分分类类相相关关的的若若干干个个指指标标的的线线性性关关系系式式),然然后后利利用用该该函函数数去去判判断断未未知知样样品属于哪一类品属于哪一类l
9、要点:要点:1、判别分析需要明确所研究样本共有几个类别、判别分析需要明确所研究样本共有几个类别 2、判判别别分分析析需需要要从从现现有有已已知知类类别别的的样样本本数数据据中中提提练练出出一一个个判判别函数别函数第十一页,本课件共有55页三、三、常用判别方法常用判别方法l距离判别法距离判别法lFisher判别法判别法l贝叶斯判别法贝叶斯判别法l典型判别与逐步判别法典型判别与逐步判别法第十二页,本课件共有55页第二节第二节 距离判别法距离判别法第十三页,本课件共有55页一、基本思想一、基本思想l由训练样本得出每个分类的重心(中心)坐标,然后对新样品求出它们离各个类别重心的距离远近,从而归入离得最
10、近的分类。最常用的距离是马氏距离。第十四页,本课件共有55页(一)马氏距离马氏距离距离判别的最直观的想法是计算样品到距离判别的最直观的想法是计算样品到第第i i类总体的平均数的距离,哪个距离最类总体的平均数的距离,哪个距离最小就将它判归哪个总体,所以,我们首小就将它判归哪个总体,所以,我们首先考虑的是是否能够构造一个恰当的距先考虑的是是否能够构造一个恰当的距离函数,通过样本与某类别之间距离的离函数,通过样本与某类别之间距离的大小,判别其所属类别。大小,判别其所属类别。第十五页,本课件共有55页 设设 是是从从期期望望=和方差阵和方差阵=的总体的总体G抽得的两个观测值,则称抽得的两个观测值,则称
11、 为为X与与Y之间的之间的Mahalanobis距离距离 样本样本X X和和G Gi i类之间的马氏距离定义为类之间的马氏距离定义为X X与与G Gi i类重类重心间的距离:心间的距离:第十六页,本课件共有55页 (二)两个总体距离判别法(二)两个总体距离判别法 先先考考虑虑两两个个总总体体的的情情况况,设设有有两两个个协协差差阵阵 相相同同的的p p维维正正态态总总体体和和,对对给给定定的的样样本本Y Y,判判别别一一个个样样本本Y Y到到底底是是来来自自哪哪一一个个总总体体,一一个个最最直直观观的的想想法法是是计计算算Y Y到到两两个个总总体体的的距距离离。故故我我们们用用马马氏氏距距离离
12、来来指指定定判判别别规规则则,有:有:1、方差相等、方差相等第十七页,本课件共有55页第十八页,本课件共有55页则前面的判别法则表示为则前面的判别法则表示为 当当 和和 已已知知时时,是是一一个个已已知知的的p维维向向量量,W(y y)是是y y的的线线性性函函数数,称称为为线线性性判判别别函函数数。称称为为判判别别系系数数。用用线线性性判判别别函函数数进进行行判判别别分分析析非非常常直直观观,使使用用起起来来最方便,在实际中的应用也最广泛。最方便,在实际中的应用也最广泛。常数项常数项第十九页,本课件共有55页 例例 4.1 在企业的考核中,可以根据企业的生产经营情况把企业在企业的考核中,可以
13、根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的指标有:分为优秀企业和一般企业。考核企业经营状况的指标有:资金利润率资金利润率=利润总额利润总额/资金占用总额资金占用总额 劳动生产率劳动生产率=总产值总产值/职工平均人数职工平均人数 产品净值率产品净值率=净产值净产值/总产值总产值 三个指标的均值向量和协方差矩阵如下。现有二个企三个指标的均值向量和协方差矩阵如下。现有二个企业,观测值分别为业,观测值分别为 (7.8,39.1,9.6)和()和(8.1,34.2,6.9),问这两个企业),问这两个企业应该属于哪一类?应该属于哪一类?第二十页,本课件共有55页变量均值向量协方
14、差矩阵优秀一般资金利润率13.55.468.3940.2421.41 劳动生产率 40.729.840.2454.5811.67 产品净值率 10.76.221.4111.677.90第二十一页,本课件共有55页第二十二页,本课件共有55页线性判别函数:线性判别函数:由此可以判断第一个企业属于优秀企业,第二个企由此可以判断第一个企业属于优秀企业,第二个企业属于一般企业业属于一般企业第二十三页,本课件共有55页 2、当总体的协方差已知,且不相等、当总体的协方差已知,且不相等第二十四页,本课件共有55页 当总体的方差未知时,应该用样本的协方差矩阵代当总体的方差未知时,应该用样本的协方差矩阵代替。步
15、骤如下(假如两个总体):替。步骤如下(假如两个总体):(1)分别计算各组的离差矩阵)分别计算各组的离差矩阵S1和和S2;(2)计算)计算 (3)计算类的均值)计算类的均值 (4)计算)计算 (5)计算)计算从而计算从而计算 (6)生成判别函数,将检验样本代入,得分,判类。生成判别函数,将检验样本代入,得分,判类。第二十五页,本课件共有55页 随随着着计计算算机机计计算算能能力力的的增增强强和和计计算算机机的的普普及及,距距离离判判别别法法的的判判别函数也在逐步改进,一种等价的距离判别为:别函数也在逐步改进,一种等价的距离判别为:设设有有个个K总总体体,分分别别有有均均值值向向量量i(i=1,2
16、,k)和和协协方方差差阵阵i=,各各总总体体出出现现的的先先验验概概率率相相等等。又又设设Y是是一一个个待待判判样样品品。则距离为(即判别函数)则距离为(即判别函数)(三三)多总体的距离判别法多总体的距离判别法 上式中的第一项上式中的第一项Y-1Y与与i无关,则舍去,得一个等价的函数无关,则舍去,得一个等价的函数第二十六页,本课件共有55页 将上式中提将上式中提-2,得,得则距离判别法的判别函数为:则距离判别法的判别函数为:判别规则为判别规则为注:这与前面所提出的距离判别是等价的注:这与前面所提出的距离判别是等价的.第二十七页,本课件共有55页(三三)、判别分析效果检验、判别分析效果检验l良好
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 判别分析优秀PPT 第四 判别分析 优秀 PPT

限制150内