第七章相关和回归.ppt
《第七章相关和回归.ppt》由会员分享,可在线阅读,更多相关《第七章相关和回归.ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章 相关和回归Spearman秩相关检验秩相关检验1235Kendall秩相关系数检验秩相关系数检验Theil非参数回归和几种稳健回归非参数回归和几种稳健回归v一、适用范围一、适用范围vSpearman秩相关系数是最早、最著名评秩统计量秩相关系数是最早、最著名评秩统计量,主要用于研究两变量间的相关程度及其显著性检主要用于研究两变量间的相关程度及其显著性检验验,其资料要求两变量都至少是以定序尺度测量的。其资料要求两变量都至少是以定序尺度测量的。v二、理论依据和方法二、理论依据和方法v1理论依据:理论依据:vSpearman秩相关系数,用秩相关系数,用rs代表。是对容量为代表。是对容量为n的的
2、xi和和yi的秩的秩(i=1,2,n)进行相关性测量。如两变进行相关性测量。如两变量量x与与y完全正相关,则应有完全正相关,则应有xi=yi;如完全负相关,;如完全负相关,应有应有x1=yn,x2=yn-1,xn=y1。Spearman秩相秩相关系数通过关系数通过di=xiyi研究总的偏离程度研究总的偏离程度。第一节 Spearman秩相关v在计算相关系数时,直接研究在计算相关系数时,直接研究di是不合适的,是不合适的,因为正的因为正的di与负的与负的di相互抵消,因此采用相互抵消,因此采用di2,当,当di越大时,越大时,di2也越大。也越大。vrs的计算公式为的计算公式为:v(7.1)v当
3、当di2为为0时,时,rs=1,可认为两个变量完全,可认为两个变量完全正相关。正相关。rs所量度的是两个等级之间的联系强所量度的是两个等级之间的联系强度,度,rs处于处于+1和和-1之间。之间。第一节 Spearman秩相关v2.显著性检验显著性检验v假设组假设组Ho:X和和Y相互独立相互独立(X和和Y正或负相关正或负相关)vH1:X与与Y相互不独立相互不独立(X与与Y负或正相关负或正相关)v检验检验rs的显著性的显著性,在小样本情况下,即在小样本情况下,即n从从4到到30时,可查附表时,可查附表13来检验。该表列出了在来检验。该表列出了在H0成立时相伴概率分别为成立时相伴概率分别为a0.05
4、和和a0.01的的rs值。这是一个单尾表适合用于检验单侧假值。这是一个单尾表适合用于检验单侧假设。即当设。即当rs大于或等于表中临界值时,拒绝大于或等于表中临界值时,拒绝Ho。第一节 Spearman秩相关v在大样本情况下,即在大样本情况下,即n10时,在零假设成立时,在零假设成立时得到的时得到的rs的显著性可用统计量的显著性可用统计量t来检验:来检验:vvt统计量近似服从统计量近似服从df=n-2的的T分布。分布。v如如n很大时,即很大时,即n30,还可用统计量还可用统计量Z来检验。来检验。近似服从正态分布。近似服从正态分布。(7.2)v3.耦合修正。耦合修正。v两变量的秩相等即耦合。这时用
5、它们的平均两变量的秩相等即耦合。这时用它们的平均秩作耦合项的秩。秩作耦合项的秩。第一节 Spearman秩相关v在耦合现象出现的比例不大时,可以忽略它们在耦合现象出现的比例不大时,可以忽略它们对对rs的影响;但当其比例较大时,的影响;但当其比例较大时,rs用下式来修用下式来修正:正:(7.3)vv式中式中,Tx=(t3-t)/12,t等于等于x变量中同一个秩的耦合数变量中同一个秩的耦合数;Ty=(t3-t)/12,t代表代表y变量中耦合的观察数。变量中耦合的观察数。第一节 Spearman秩相关v三、检验步骤三、检验步骤v1.据题意,作正确假设;据题意,作正确假设;v2.将变量将变量X和和Y的
6、观察值分别从的观察值分别从1到到n评秩,如观察值评秩,如观察值相同,用平均秩代替。相同,用平均秩代替。v3.将两样本配对成将两样本配对成(xi,yi),xi,yi分别代表两变量的秩。分别代表两变量的秩。v4.定出定出di=xi-yi;算出;算出di2。v5.如无耦合现象或比例较小时,用公式如无耦合现象或比例较小时,用公式(7.1)算出算出rs,如耦合现象比例较大,则用,如耦合现象比例较大,则用(7.3)公式计算公式计算rs。v6.小样本小样本4n30时时,查附表查附表13;大样本时大样本时,N30用公用公式式(7.2)。第一节 Spearman秩相关v四、例四、例7.1(小样本举例小样本举例)
7、学习时间长短与学生考试成学习时间长短与学生考试成绩间是否有关。调查某大学绩间是否有关。调查某大学10个学生每周学习的时个学生每周学习的时间与期末平均成绩的资料如表间与期末平均成绩的资料如表7-1所示所示v解:假设解:假设H0:学习时间:学习时间X与平均成绩等级与平均成绩等级Y之间是相之间是相互独立的;互独立的;H1:学习时间:学习时间X与平均成绩等级与平均成绩等级Y之间是之间是正相关。根据正相关。根据(9.22)式计算得到式计算得到:v取取a=0.05的显著性水平,样本容量的显著性水平,样本容量n10,查附表,查附表13临界值临界值rs(n,a)=0.5515第一节 Spearman秩相关v表
8、表7-1大学生的学习时间与期末成绩调查表大学生的学习时间与期末成绩调查表变量变量秩次秩次di=xdi=xi i-y-yi id di i2 2周学习时周学习时期末平均成绩期末平均成绩时间排秩时间排秩成绩等级成绩等级(x x)(y y)(x xi i)(y yi i)242484846 67.57.5-1.5-1.52.252.25171740402.52.51 11.51.52.252.25202058584 44 40 00 0414184848 87.57.50.50.50.250.255252858510109 91 11 1232380805 55 50 00 0464690909 9
9、1010-1-11 1171755552.52.53 3-0.5-0.50.250.25151548481 12 2-1-11 1292982827 76 61 11 1合计合计9.009.00第一节 Spearman秩相关v因为因为rs=0.9460.5515(临界值)故拒绝(临界值)故拒绝Ho假假设设,而接受而接受H1假设,即学生的学习时间与学生的假设,即学生的学习时间与学生的平均成绩等级之间存在着正相关关系。平均成绩等级之间存在着正相关关系。v这里变量这里变量x和和y中都分别有一对存在耦合即中都分别有一对存在耦合即t2,所占比例不大,可以不必进行修正。但为说明,所占比例不大,可以不必进行
10、修正。但为说明方法,在此作一修正。方法,在此作一修正。v用公式用公式(7.3),首先要算出首先要算出v代入公式得:代入公式得:v修正后比修正前略有减小。修正后比修正前略有减小。第一节 Spearman秩相关v例例7.2(大样本举例大样本举例)从一个大企业的生产线上抽出从一个大企业的生产线上抽出15名雇员组成一个随机样本,然后让这些雇员的同事和管名雇员组成一个随机样本,然后让这些雇员的同事和管理人员根据他们对工作的兴趣及合作精神分别对他们进理人员根据他们对工作的兴趣及合作精神分别对他们进行排序,结果列于表行排序,结果列于表7-2,企业当局想知道同事和管理,企业当局想知道同事和管理人员的看法是否正
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 相关 回归
限制150内