判别分析的原理及其操作(共4页).doc
《判别分析的原理及其操作(共4页).doc》由会员分享,可在线阅读,更多相关《判别分析的原理及其操作(共4页).doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上判别分析的原理及其操作1 判别分析的原理11 判别分析的涵义判别分析(Discriminant Analysis,简称DA)技术是由费舍(RAFisher)于1936年提出的。它是根据观察或测量到的若干变量值判断研究对象如何分类的方法。具体地讲,就是已知一定数量案例的一个分组变量(grouping variable)和这些案例的一些特征变量,确定分组变量和特征变量之间的数量关系,建立判别函数(discriminant function),然后便可以利用这一数量关系对其他已知特征变量信息、但未知分组类型所属的案例进行判别分组。沿用多元回归模型的称谓,在判别分析中称分组变
2、量为因变量,而用以分组的其他特征变量称为判别变量(discriminant variable)或自变量。判别分析技术曾经在许多领域得到成功的应用,例如医学实践中根据各种化验结果、疾病症状、体征判断患者患的是什么疾病;体育选材中根据运动员的体形、运动成绩、生理指标、心理素质指标、遗传因素判断是否选入运动队继续培养;还有动物、植物分类,儿童心理测验,地理区划的经济差异,决策行为预测等。12 判别分析的假设条件判别分析的基本条件是:分组变量的水平必须大于或等于2,每组案例的规模必须至少在一个以上;各判别变量的测度水平必须在间距测度等级以上,即各判别变量的数据必须为等距或等比数据;各分组的案例在各判别
3、变量的数值上能够体现差别。判别分析对判别变量有三个基本假设。其一是每一个判别变量不能是其他判别变量的线性组合。否则将无法估计判别函数,或者虽然能够求解但参数估计的标准误很大,以致于参数估计统计性不显著。其二是各组案例的协方差矩阵相等。在此条件下,可以使用很简单的公式来计算判别函数和进行显著性检验。其三是各判别变量之间具有多元正态分布,即每个变量对于所有其他变量的固定值有正态分布。13 判别分析的过程131 对已知分组属性案例的处理 此过程为判别分析的第一阶段,也是建立判别分析基本模型的阶段,即分析和解释各组指标特征之间的差异,并建立判别函数。1311 判别分析的基本模型及其估计过程判别分析的基
4、本模型就是判别函数,它表示为分组变量与满足假设的条件的判别变量的线性函数关系,其数学形式为:y=b0b1x1b2x2bkxk,其中,y是判别函数值,又简称为判别值(discriminant score);xi为各判别变量;bi为相应的判别系数(dicriminant coefficient or weight),表示各判别变量对于判别函数值的影响,其中b0是常数项。判别模型对应的几何解释是,各判别变量代表了k维空间,每个案例按其判别变量值称为这k维空间中的一个点。如果各组案例就其判别变量值有明显不同,就意味着每一组将会在这一空间的某一部分形成明显分离的蜂集点群。我们可以计算此领域的中心以概括这
5、个组的位置。中心的位置可以用这个组别中各案例在每个变量上的组平均值作为其坐标值。因为每个中心代表了所在组的基本位置,我们可以通过研究它们来取得对于这些分组之间差别的理解。模型估计的过程可简略描述如下:在k维空间中寻找某个角度使各组平均值的差别尽可能大,将其作为判别的第一维度,对应函数为第一判别函数。这一维度可以代表或解释原始变量组间方差中最大的部分。然后依照同样原则建立第二判别函数。建立后续判别函数的条件是,后一个函数必须与前面所有的函数正交,即判别函数之间完全独立。建立判别函数的数目为min(k,g1),每一个函数都反映判别变量组间方差的一部分,比例之和为100%。1312 建立判别函数的方
6、法 全模型法这是SPSS系统的默认方法。它是把用户指定的变量全部放入判别函数中,而不管变量对判别函数是否起作用,作用大小如何。当对反映研究对象特征的变量认识比较全面时可以选择此种方法。其缺点是不能剔除对判别贡献很小的变量。 向前选择法向前选择法是从判别模型中没有变量开始,每一步把一个对判别模型的判断能力贡献最大的变量引入模型。直到没有被引入模型的变量没有一个符合进入模型的条件(判据)时,变量引入过程结束。当希望比较多的变量留在判别函数中时使用此方法。 向后选择法此方法与向前选择法相反。它从全模型开始,每一步把一个对模型的判断能力贡献最小的变量剔除出模型,直到模型中的所有变量都符合留在模型中的判
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别分析 原理 及其 操作
限制150内