4.判别分析.ppt
《4.判别分析.ppt》由会员分享,可在线阅读,更多相关《4.判别分析.ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、判判 别别 分分 析析距离判别Bayes判别Fisher判断逐步判别例例 中小企业的破产模型中小企业的破产模型为了研究为了研究中小企业的破产模型,选定中小企业的破产模型,选定4 4个经济指标:个经济指标:X1X1总负债率(现金收益总负债率(现金收益/总负债)总负债)X2X2收益性指标(纯收入收益性指标(纯收入/总财产)总财产)X3X3短期支付能力(流动资产短期支付能力(流动资产/流动负债)流动负债)X4X4生产效率性指标(流动资产生产效率性指标(流动资产/纯销售额)纯销售额)对对1717个破产企业(个破产企业(1 1类)和类)和2121个正常运行企业个正常运行企业(2 2类)进行了调查,得如下
2、资料:类)进行了调查,得如下资料:1 什么是判别分析什么是判别分析总负债率总负债率收益性指标收益性指标短期支付能力短期支付能力生产效率指标生产效率指标类别类别-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.
3、601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532.38.38.11.113.273.27.55.552 2.19.19.05.052.252.25.33.332 2.32.32.07.074.244.24.63.632 2.31.31.05.054.454.45.69.692 2.12.12.05.052.522.52.69.692 2-.02-.02.02.022.052.05.35.352 2.22.22.08.082.352.35.40.402 2.17.17.07.071.801.80.52.522 2.15.1
4、5.05.052.172.17.55.552 2-.10-.10-1.01-1.012.502.50.58.582 2.14.14-.03-.03.46.46.26.262 2.14.14.07.072.612.61.52.522 2-.33-.33-.09-.093.013.01.47.472 2.48.48.09.091.241.24.18.182 2.56.56.11.114.294.29.45.452 2.20.20.08.081.991.99.30.302 2.47.47.14.142.922.92.45.452 2.17.17.04.042.452.45.14.142 2.58.5
5、8.04.045.065.06.13.132 2.04.04.01.011.501.50.71.71待判待判-.06-.06-.06-.061.371.37.40.40待判待判.07.07-.01-.011.371.37.34.34待判待判-.13-.13-.14-.141.421.42.44.44待判待判.15.15.06.062.232.23.56.56待判待判.16.16.05.052.312.31.20.20待判待判.29.29.06.061.841.84.38.38待判待判.54.54.11.112.332.33.48.48待判待判企业序号判别类型判别函数得分判别为1的概率判别的为2
6、概率11-.56509.69479.3052121-.89817.80234.1976631-.59642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.6799572.27925.34442.65558821.24010.09012.90988 判判别别分分析析利利用用已已知知类类别别的的样样本本培培训训模模型型,为为未未知样本判类的一种统计方法。知样本判类的一种统计方法。它它产产生生于于本本世世纪纪3030年年代代。近近年年来来,在在自自然然科科学学、社社会会学学及及经经济济管管理理学学科科中中都都有
7、有广广泛泛的的应应用用。判判别别分分析析的的特特点点是是根根据据已已掌掌握握的的、历历史史上上每每个个类类别别的的若若干干样样本本的的数数据据信信息息,总总结结出出客客观观事事物物分分类类的的规规律律性性,建建立立判判别别公公式式和和判判别别准准则则。然然后后,当当遇遇到到新新的的样样本本点点时时,只只要要根根据据总总结结出出来来的的判判别别公公式式和和判判别别准准则则,就能判别该样本点所属的类别。就能判别该样本点所属的类别。2 距离判别 (一)(一)马氏距离马氏距离 距离判别的最直观的想法是计算样品到第距离判别的最直观的想法是计算样品到第i i类类总体的平均数的距离,哪个距离最小就将它判总体
8、的平均数的距离,哪个距离最小就将它判归哪个总体,所以,我们首先考虑的是是否能归哪个总体,所以,我们首先考虑的是是否能够构造一个恰当的距离函数,通过样本与某类够构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。别之间距离的大小,判别其所属类别。设设 是是从从期望期望=和方差和方差阵阵=的总体的总体G抽得的两个观测值,则称抽得的两个观测值,则称 为为X与与Y之间的之间的Mahalanobis距离距离 样本样本X X和和G Gi i类之间的马氏距离定义为类之间的马氏距离定义为X X与与G Gi i类重类重心间的距离:心间的距离:(二)两个总体距离判别法(二)两个总体距离判别法
9、先先考考虑虑两两个个总总体体的的情情况况,设设有有两两个个协协差差阵阵 相相同同的的p p维维正正态态总总体体和和,对对给给定定的的样样本本Y Y,判判别别一一个个样样本本Y Y到到底底是是来来自自哪哪一一个个总总体体,一一个个最最直直观观的的想想法法是是计计算算Y Y到到两两个个总总体体的的距距离离。故故我我们们用用马马氏氏距距离离来来指指定定判判别别规则,有:规则,有:1、协方差阵已知且相等、协方差阵已知且相等则前面的则前面的判别法则判别法则表示为表示为当当 和和 已已知知时时,是是一一个个已已知知的的p维维向向量量,W(y y)是是y y的的线线性性函函数数,称称为为线线性性判判别别函函
10、数数。称称为为判判别别系系数数。用用线线性性判判别别函函数数进进行行判判别别分分析析非非常常直直观观,使用起来最方便,在实际中的应用也最广泛。使用起来最方便,在实际中的应用也最广泛。判别函数判别函数:例例 在企业的考核种,可以根据企业的生产经营情况在企业的考核种,可以根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的把企业分为优秀企业和一般企业。考核企业经营状况的指标有:指标有:资金利润率资金利润率=利润总额利润总额/资金占用总额资金占用总额 劳动生产率劳动生产率=总产值总产值/职工平均人数职工平均人数 产品净值率产品净值率=净产值净产值/总产值总产值 三个指标的均值向量和
11、协方差矩阵如下。现有二三个指标的均值向量和协方差矩阵如下。现有二个企业,观测值分别为个企业,观测值分别为 (7.87.8,39.139.1,9.69.6)和()和(8.18.1,34.234.2,6.96.9),问),问这两个企业应该属于哪一类?这两个企业应该属于哪一类?变量均值向量协方差矩阵优秀一般资金利润率13.55.468.3940.2421.41 劳动生产率 40.729.840.2454.5811.67 产品净值率 10.76.221.4111.677.90线性判别函数:2、当总体的协方差已知,且不相等、当总体的协方差已知,且不相等判别函数判别函数 y的二次函数的二次函数判别法则判别
12、法则3.当总体的方差相等但未知当总体的方差相等但未知时,应该用样本的协方差时,应该用样本的协方差矩阵代替。步骤如下(假如两个总体):矩阵代替。步骤如下(假如两个总体):(1)分别计算各组的离差矩阵)分别计算各组的离差矩阵S1和和S2;(2)计算计算 (3)计算类的均值)计算类的均值 (4)计算)计算 (5)计算)计算 (6)生成判别函数,将检验样本代入,得分,判类。)生成判别函数,将检验样本代入,得分,判类。(三三)多总体的距离判别法多总体的距离判别法1.协方差阵已知且相等协方差阵已知且相等方法一:方法一:设有设有K个总体,分别有均值向量个总体,分别有均值向量i(i=1,2,k)和协和协方差阵
13、方差阵i=.判别函数判别函数 判别法则判别法则方法二:方法二:随随着着计计算算机机计计算算能能力力的的增增强强和和计计算算机机的的普普及及,距距离离判判别别法法的的判判别别函函数数也也在在逐逐步步改改进进,一一种种等等价价的的距距离离判别为:判别为:设设有有K个个总总体体,分分别别有有均均值值向向量量i(i=1,2,k)和和协协方方差差阵阵i=,各各总总体体出出现现的的先先验验概概率率相相等等。又又设设Y是一个待判样品。则与的距离为(即判别函数)是一个待判样品。则与的距离为(即判别函数)上式中的第一项上式中的第一项y-1y与与i无关,则舍去,得一个等价的函数无关,则舍去,得一个等价的函数将上式
14、中提-2,得则距离判别法的判别函数判别函数为:判别规则判别规则为注注:这与前面所提出的距离判别是等价的.2.协方差阵已知但不相等协方差阵已知但不相等判别函数判别函数 判别法则判别法则3.协方差阵相等但未知协方差阵相等但未知判别函数判别函数 判别法则判别法则3.协方差阵不相等且未知协方差阵不相等且未知判别函数判别函数 判别法则判别法则(四)错判概率(四)错判概率 由上面的分析可以看出,马氏距离判别法是合理的,但是由上面的分析可以看出,马氏距离判别法是合理的,但是这并不意谓着不会发生误判。这并不意谓着不会发生误判。距离判别只要求知道总体的数字特征,不涉及距离判别只要求知道总体的数字特征,不涉及总体
15、的分布函数,当参数未知和协方差时,就用样总体的分布函数,当参数未知和协方差时,就用样本的均值和协方差矩阵来估计。距离判别方法简单本的均值和协方差矩阵来估计。距离判别方法简单实用,但没有考虑到每个总体出现的机会大小,即实用,但没有考虑到每个总体出现的机会大小,即先验概率,没有考虑到错判的损失。先验概率,没有考虑到错判的损失。贝叶斯判别法贝叶斯判别法正是为了解决这两个问题提出的判别分析方法。正是为了解决这两个问题提出的判别分析方法。办公室新来了一个雇员小王,小王是好人还是坏人大家办公室新来了一个雇员小王,小王是好人还是坏人大家都在猜测。按人们主观意识,一个人是好人或坏人的概率均为都在猜测。按人们主
16、观意识,一个人是好人或坏人的概率均为0.50.5。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏事,一般好人做好事的概率为事,一般好人做好事的概率为0.90.9,坏人做好事的概率为,坏人做好事的概率为0.20.2,一天,小王做了一件好事,小王是好人的概率有多大,你现在一天,小王做了一件好事,小王是好人的概率有多大,你现在把小王判为何种人。把小王判为何种人。3 贝叶斯判别法贝叶斯判别法一一 、标准的、标准的Bayes判别判别 距距离离判判别别简简单单直直观观,很很实实用用,但但是是距距离离判判别别的的方方法法把把总总体体等等同同看看待待,没
17、没有有考考虑虑到到总总体体会会以以不不同同的的概概率率(先先验验概概率率)出出现现,也也没没有有考考虑虑误误判判之之后后所所造造成成的的损损失的差异。失的差异。一一个个好好的的判判别别方方法法,既既要要考考虑虑到到各各个个总总体体出出现现的的先先验验概概率率,又又要要考考虑虑到到错错判判造造成成的的损损失失,Bayes判判别别就就具有这些优点,其判别效果更加理想,应用也更广泛。具有这些优点,其判别效果更加理想,应用也更广泛。贝叶斯公式是一个我们熟知的公式贝叶斯公式是一个我们熟知的公式 设设有有总总体体 ,具具有有概概率率密密度度函函 数数 。并并且且根根据据以以往往的的统统计计分分析析,知知道
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别分析
限制150内