地理数学方法判别分析精选PPT.ppt
《地理数学方法判别分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《地理数学方法判别分析精选PPT.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、地理数学方法判别分析第1页,此课件共57页哦判别分析判别分析1.基本原理基本原理2.基本操作基本操作3.选项设置选项设置4.实例分析实例分析第2页,此课件共57页哦1.基本原理基本原理 定义:判别分析是先根据已知类别的事物定义:判别分析是先根据已知类别的事物的性质(自变量),建立函数式(自变量的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知的类别的新事物进行判断以将之归入已知的类别中。类别中。第3页,此课件共57页哦判别分析有如下的假定:判别分析有如下的假定:预测变量服从正态分布。预测变量服从正态分布
2、。预测变量之间没有显著的相关。预测变量之间没有显著的相关。预测变量的平均值和方差不相关。预测变量的平均值和方差不相关。预测变量应是连续变量,因变量(类别预测变量应是连续变量,因变量(类别或组别)是间断变量。或组别)是间断变量。两个预测变量之间的相关性在不同类中两个预测变量之间的相关性在不同类中是一样的。是一样的。第4页,此课件共57页哦 在分析的各个阶段应把握如下的原则:在分析的各个阶段应把握如下的原则:事前组别(类)的分类标准(作为判别事前组别(类)的分类标准(作为判别分析的因变量)要尽可能准确和可靠,否则分析的因变量)要尽可能准确和可靠,否则会影响判别函数的准确性,从而影响判别分会影响判别
3、函数的准确性,从而影响判别分析的效果。析的效果。所分析的自变量应是因变量的重要影响所分析的自变量应是因变量的重要影响因素,应该挑选既有重要特性又有区别能力因素,应该挑选既有重要特性又有区别能力的变量,达到以最少变量而有高辨别能力的的变量,达到以最少变量而有高辨别能力的目标。目标。初始分析的数目不能太少。初始分析的数目不能太少。第5页,此课件共57页哦判别分析是一种有效的对个案进行分类分析判别分析是一种有效的对个案进行分类分析的方法的方法,组别的特征已知。组别的特征已知。如银行为了对贷款进行管理,需要预测哪些如银行为了对贷款进行管理,需要预测哪些类型的客户可能不会按时归还贷款。已知过类型的客户可
4、能不会按时归还贷款。已知过去几年中,去几年中,900个客户的贷款归还信誉度,据个客户的贷款归还信誉度,据此可以将客户分成两组:可靠客户和不可靠此可以将客户分成两组:可靠客户和不可靠客户。客户。第6页,此课件共57页哦 再通过收集客户的一些资料,如年龄、工资再通过收集客户的一些资料,如年龄、工资收入、教育程度、存款等,将这些资料作收入、教育程度、存款等,将这些资料作为自变量。通过判别分析,建立判别函数。为自变量。通过判别分析,建立判别函数。那么,如果有那么,如果有150个新的客户提交贷款请求,个新的客户提交贷款请求,就可以利用创建好的判别函数,对新的客就可以利用创建好的判别函数,对新的客户进行分
5、析,从而判断新的客户是属于可户进行分析,从而判断新的客户是属于可靠客户类,还是不可靠客户类。靠客户类,还是不可靠客户类。第7页,此课件共57页哦 判别分析的目的是得到体现判别分析的目的是得到体现分类的函数关系式分类的函数关系式,即判别函数。,即判别函数。基本思想是在已知观测对象的分类和特征变量值的前提下,从中基本思想是在已知观测对象的分类和特征变量值的前提下,从中筛筛选出选出能提供较多信息的能提供较多信息的变量变量,并,并建立判别函数建立判别函数;目标是使得到的判;目标是使得到的判别函数在对观测量进行判别其所属类别时的错判率最小。别函数在对观测量进行判别其所属类别时的错判率最小。判别函数的一般
6、形式是:判别函数的一般形式是:其中,其中,为判别函数判别值;为判别函数判别值;为反映研究对象为反映研究对象特征的变量;特征的变量;为为各各变变量的系数,即判量的系数,即判别别系数。系数。常用的判别法有常用的判别法有距离判别法距离判别法、Fisher(费歇尔费歇尔)判别法判别法和和Bayes(贝叶(贝叶斯)判别法。斯)判别法。第8页,此课件共57页哦 例例1 人文发展指数是联合国开发计划署于人文发展指数是联合国开发计划署于1990年年5月发表的月发表的第一份人类发展报告中公布的。该报告建议,目前对人文发第一份人类发展报告中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人
7、生三大要素的指展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指示分别采用出生时的示分别采用出生时的预期寿命预期寿命、成人识字率成人识字率和和实际人均实际人均GDP,将以上,将以上三个指示指标的数值合成为一个复合指数,即为三个指示指标的数值合成为一个复合指数,即为人文发展指数人文发展指数。资料。资料来源来源UNDP人类发展报告人类发展报告1995年。年。今从今从1995年世界各国人文发展指数的排序中,选取高发展水平、中年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为两组样品,另选四个国家作为待判样品作等发展水平的国家各五个作为两组样品,另选四个国家作为待判样品
8、作判别分析。判别分析。使用三种判别方法进行判别,并进行研究三者之间的关系。使用三种判别方法进行判别,并进行研究三者之间的关系。第9页,此课件共57页哦第10页,此课件共57页哦本例中变量个数本例中变量个数p3,两类总体各有,两类总体各有5个样品,即个样品,即n1n25,有,有4个个待判样品,假定两总体协差阵相等。待判样品,假定两总体协差阵相等。两组线性判别的计算过程如下:两组线性判别的计算过程如下:(1)计算两类样本均值计算两类样本均值(2)计算样本协差阵,从而求出计算样本协差阵,从而求出第11页,此课件共57页哦类似地类似地经计算经计算第12页,此课件共57页哦(3)求线性判别函数求线性判别
9、函数W(X)解线性方程组解线性方程组得得第13页,此课件共57页哦(4)对已知类别的样品判别分类对已知类别的样品判别分类 对已知类别的样品对已知类别的样品(通常称为训练样品通常称为训练样品)用线性判别函数进行判别归类,用线性判别函数进行判别归类,结果如下表,全部判对。结果如下表,全部判对。第14页,此课件共57页哦(5)对判别效果作检验对判别效果作检验 判别分析是假设两组样品取自不同总体,如果两个总体的均值向量在判别分析是假设两组样品取自不同总体,如果两个总体的均值向量在统计上差异不显著,作判别分析意义就不大:所谓判别效果的检验就是统计上差异不显著,作判别分析意义就不大:所谓判别效果的检验就是
10、检验两个检验两个正态总体的均值向量正态总体的均值向量是是否相等,取检验的统计量为:否相等,取检验的统计量为:其中其中将上边计算结果代人统计量后可得:将上边计算结果代人统计量后可得:第15页,此课件共57页哦函数有效。函数有效。故在故在检验水平下,两总体间差异显著,即判别检验水平下,两总体间差异显著,即判别(6)对待判样品判别归类结果如下表:对待判样品判别归类结果如下表:第16页,此课件共57页哦 2、继续用前面距离判别法例、继续用前面距离判别法例1的人文发展指数的的人文发展指数的数据作数据作Bayes判别分析。判别分析。贝叶斯准则:一种概率方法把已知的地理数据分成几类,计算出未知地理类型或者区
11、域归属于各已知类型的概率值,它归属于哪一类的概率值最大,就把它划归为该类。第17页,此课件共57页哦这里组数这里组数k2,指标数,指标数p3,n1n25代人判别函数:代人判别函数:第18页,此课件共57页哦得两组的判别函数分别为:得两组的判别函数分别为:将原各组样品进行回判结果如下一灯片表:将原各组样品进行回判结果如下一灯片表:待判样品判别结果如下:待判样品判别结果如下:第19页,此课件共57页哦3、利用距离判别法中例、利用距离判别法中例l的人文发展指数的数据的人文发展指数的数据作作Fisher判别分析:判别分析:费歇尔准则较优的判别函数应该能根据待判断对的n个指标最大限度地将它所属的类与其它
12、类区分开来一般采用线性判别函数基本方法:首先假定判别函数(线性函数),然后根据已知信息对判别函数进行训练,得到函数关系式中的关系值,从而最终确定判别函数第20页,此课件共57页哦 (1)建立判别函数建立判别函数利用前例计算的结果,可得利用前例计算的结果,可得Fisher判别函数的系数判别函数的系数第21页,此课件共57页哦所以判别函数为所以判别函数为(2)计算判别临界值计算判别临界值y0。由于由于所以所以第22页,此课件共57页哦(3)判别准则判别准则(4)对已知类别的样品判别归类对已知类别的样品判别归类第23页,此课件共57页哦第24页,此课件共57页哦 上述回判结果表明:总的回代判对率为上
13、述回判结果表明:总的回代判对率为100,这与统计资料的结果相符,这与统计资料的结果相符,而且与前面用距离判别法的结果也一致。而且与前面用距离判别法的结果也一致。(5)对判别效果作检验对判别效果作检验 由于由于所以在所以在检验水平下判别有效。检验水平下判别有效。(6)待判样品判别结果如下:待判样品判别结果如下:判别结果与实际情况吻合。判别结果与实际情况吻合。第25页,此课件共57页哦2.基本操作基本操作 SPSS利用利用“Discriminate”过程进行判别分析操作,下面给出基过程进行判别分析操作,下面给出基本操作步骤。本操作步骤。Step1:打开主对话框。:打开主对话框。选择选择“Analy
14、ze”“Classify”“Discriminate”命令,打开命令,打开“Discriminate Analysis”对话框,如图对话框,如图1.1所示所示图图1.1“Discriminate Analysis”对话框,对话框,第26页,此课件共57页哦Step2:选择分组变量和自变量:选择分组变量和自变量 在变量列表中选择指定分组变量,单击右向箭头按钮,将其移动至右在变量列表中选择指定分组变量,单击右向箭头按钮,将其移动至右侧的侧的“Grouping Variable”(分组)文本框中,并单击(分组)文本框中,并单击“Define Range”(定义范围)按钮,出现图(定义范围)按钮,出现
15、图1.2所示的所示的“Discriminant Analysis:Define Range”(判别分析定义范围)对话框,在(判别分析定义范围)对话框,在“Minimum”文本框文本框中输入该分组变量的最小值,在中输入该分组变量的最小值,在“Maximum”文本框中输入该分组变量的文本框中输入该分组变量的最大值,单击最大值,单击“Continue”按钮,返回主对话框。按钮,返回主对话框。图图1.2“Discriminate Analysis:Define Range”对话框对话框第27页,此课件共57页哦 在变量列表中选择判别分析的变量,单击右向箭头按钮,在变量列表中选择判别分析的变量,单击右向
16、箭头按钮,将其移动至将其移动至“Independents”(自变量)列表框中。(自变量)列表框中。Step3:选择判别分析方法。:选择判别分析方法。在主对话框中,自变量列表框下侧显示两个单选框,用在主对话框中,自变量列表框下侧显示两个单选框,用于指定选择判别分析的方法。于指定选择判别分析的方法。Enter independents together 默认选项。当认为所有自变量都能对观默认选项。当认为所有自变量都能对观测特性提供丰富的信息时,使用该选项,选择该项将不加测特性提供丰富的信息时,使用该选项,选择该项将不加uanz地使用所有地使用所有自变量进行判别分析,建立全模型,且不需要进一步选择。
17、自变量进行判别分析,建立全模型,且不需要进一步选择。Use stepwise method 逐步分析方法。当认为不是所有自变逐步分析方法。当认为不是所有自变量都能对观测量特性提供丰的信息时,选择该项,因此需要判别量都能对观测量特性提供丰的信息时,选择该项,因此需要判别贡献的大小再进行选择。选中该单选按钮时,贡献的大小再进行选择。选中该单选按钮时,“Method”按钮被按钮被激活,可以进一步选择判别分析方法。激活,可以进一步选择判别分析方法。第28页,此课件共57页哦Step4:选择变量值标识。:选择变量值标识。如果需要使用一部分个案参与判别函数的推导,而且有一个变量的某个如果需要使用一部分个案
18、参与判别函数的推导,而且有一个变量的某个值可以作为这些观测量的标识,则用值可以作为这些观测量的标识,则用Select Variable功能进行选择。方法功能进行选择。方法为在变量列表中选择变量,单击右向箭头按钮,将其移动至为在变量列表中选择变量,单击右向箭头按钮,将其移动至“Selection”(选择变量)文本框;然后单击(选择变量)文本框;然后单击“Selection”文本框右侧文本框右侧的的“Value”按钮,显示按钮,显示“Discriminant Analysis:Set Value”(判别分(判别分析:设定值)子对话框,如图析:设定值)子对话框,如图1.3所示,输入选择变量的标识。单
19、击所示,输入选择变量的标识。单击“Continue”按钮,返回主对话框。按钮,返回主对话框。图图1.3“Discriminant Analysis:Set Value”第29页,此课件共57页哦Step5:执行操作。:执行操作。选择完毕后,单击选择完毕后,单击“OK”按钮,执行判别分析操作。按钮,执行判别分析操作。第30页,此课件共57页哦3.选项设置选项设置3.1 Method选项选项 选择选择“Use stepwise method”方法进行判别分析时,方法进行判别分析时,“Method”(方法)按钮将被激活,单击(方法)按钮将被激活,单击“Method”按钮,打开按钮,打开“Discri
20、minant Analysis:Stepwise Method”(判别分析:逐步分析方法)对话框,(判别分析:逐步分析方法)对话框,如图如图1.4所示所示第31页,此课件共57页哦 在在“Method”选项组中选择进行逐步判别分析的方法,可供选择选项组中选择进行逐步判别分析的方法,可供选择的判别分析方法有的判别分析方法有5种:种:1.Wilkslambda Wilkslambda方法。默认选项,每步都是方法。默认选项,每步都是Wilk的概计的概计量最小的进入判别函数。量最小的进入判别函数。2.Unexplained variance 不可解释方差方法。选择该项,表示每步都是不可解释方差方法。选
21、择该项,表示每步都是使各类不可解释的方差和最小变量进入判别函数。使各类不可解释的方差和最小变量进入判别函数。3.Mahalanobisdistance Mahalanobis距离方法。选择该项,表距离方法。选择该项,表示每步都使靠的最近的两类间示每步都使靠的最近的两类间Mahalanobis距离最大的变量进入判别函距离最大的变量进入判别函数。数。4.Smallest F ratio最小最小F值方法。选择该项,表示每步都使任何两类值方法。选择该项,表示每步都使任何两类间的最小的间的最小的F值最大变量进入判别函数。值最大变量进入判别函数。第32页,此课件共57页哦 5.Raos V Rao V统计
22、量。选择该项,表示每步都使统计量。选择该项,表示每步都使Rao V统统计量产生最大增量的变量进入判别函数,可以对一个要加入到模型计量产生最大增量的变量进入判别函数,可以对一个要加入到模型中的变量的中的变量的V值指定一个最小增量。选择该方法时需要在该项下面的值指定一个最小增量。选择该方法时需要在该项下面的“V-to-enter”(输入(输入V值)文本框中输入这个增量的指定值,当某值)文本框中输入这个增量的指定值,当某变量导致的变量导致的V值增量大于指定值的变量进入判别函数。值增量大于指定值的变量进入判别函数。“Criteria”(准则准则)选项组用于选择逐步判别停止的判据,可供选择的判选项组用于
23、选择逐步判别停止的判据,可供选择的判据包括以下几项:据包括以下几项:第33页,此课件共57页哦 Use F value 默认选项。使用默认选项。使用F值是系统默认的判据,当加值是系统默认的判据,当加入一个变量(或剔除一个变量)后,对判别分析的变量进行方入一个变量(或剔除一个变量)后,对判别分析的变量进行方差分析。当计算的差分析。当计算的F值大于指定的值大于指定的Entry值时,该变量保存在函值时,该变量保存在函数中,默认数中,默认Entry值是值是3.84;当该变量使计算的;当该变量使计算的F值小于指定的值小于指定的Removal值时,该变量从函数中剔除,默认值时,该变量从函数中剔除,默认Re
24、moval值是值是2.71。即当被加入的变量即当被加入的变量F值为值为3.84时,才把该变量加入到模型中,否时,才把该变量加入到模型中,否则变量不能进入模型;或者当要从模型中移出的变量则变量不能进入模型;或者当要从模型中移出的变量F值为值为2.71时,该变量才被移出模型,否则模型中的变量不会被移出。设时,该变量才被移出模型,否则模型中的变量不会被移出。设置这两个值时应该注意置这两个值时应该注意Entry值和值和Removal值。值。Use probability of F 选择该项,表示用选择该项,表示用F检验的概率决定变检验的概率决定变量是否被加入函数或被剔除,而不是用量是否被加入函数或被剔
25、除,而不是用F值加入变量的,值加入变量的,F值概率值概率的默认值是的默认值是0.05,移出变量的,移出变量的F值概率是值概率是0.10。Removal值是移出值是移出变量的变量的F值概率;值概率;Entry值是加入变量的值是加入变量的F值概率。值概率。第34页,此课件共57页哦 “Display”(显示)选项组的选项用于显示逐步变量判别法的(显示)选项组的选项用于显示逐步变量判别法的过程设置。有以下两个复选项:过程设置。有以下两个复选项:Summary of step要求在逐步选择变量过程中的每一步之要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。后显示每个变量的统计量。F for
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 地理 数学 方法 判别分析 精选 PPT
限制150内