《6.2Kendall 相关性检验.ppt》由会员分享,可在线阅读,更多相关《6.2Kendall 相关性检验.ppt(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6.2Kendall 相关检验相关检验 Spearman(斯斯伯伯曼曼/斯斯皮皮尔尔曼曼)秩秩相相关关分分析析模模仿仿了了Pearson(皮皮尔尔逊逊)相相关关的的思思想想,Kendall(肯肯德德尔尔)于于1938年年提提出出了了另另一一种种与与Spearman秩秩相相关关相相似似的的检检验验方方法法,他他从从两两个个变变量量 是是否否协协同同一一致致的的角角度度出出发发检检验验两两变变量量之之间间是是否否存存在在相相关关性,其适用条件和性,其适用条件和Spearman秩相关检验相同秩相关检验相同.首先引入协同的概念首先引入协同的概念定定义义:假假设设n对对观观测测值值 ,如如果果乘乘积积
2、对对于于 ,则则称称数数对对 与与 满满足足协协同同性性,或或者者说说它它们们的的变变化化方向一致方向一致.反之,则称数对不协同,表示变化方向相反反之,则称数对不协同,表示变化方向相反.协协同同性性测测量量了了前前后后两两个个数数对对的的秩秩大大小小变变化化为为同同向还是反向向还是反向.Kendall 检验统计量检验统计量 全部的数据所有可能前后对数共有全部的数据所有可能前后对数共有对对,用用 表表示示同同向向数数对对的的数数目目,表表示示反反向向数数对对的的数目,则数目,则Kendall相关系数统计量由二者的平均差定义如下:相关系数统计量由二者的平均差定义如下:其中,其中,1)若所有的数对协
3、同一致,则若所有的数对协同一致,则表示两组数据正相关表示两组数据正相关2)若所有的数对都相反,则)若所有的数对都相反,则表示两组数据负相关表示两组数据负相关3)Kendall 为为零零时时,表表示示数数据据中中同同向向或或反反向向的的数数对对势势力力均均衡衡,没没有有明明显显趋趋势势,这这与与相相关关性性的的含含义义是是一一致的致的.如果定义如果定义则则Kendall 相关系数相关系数统计量又可定义为统计量又可定义为式式中中,是是 的的核核估估计计量量,因而因而 为为U统计量统计量定理:定理:在零假设成立的条件下,在零假设成立的条件下,1)2)关于原点)关于原点O对称对称大样本计算大样本计算
4、当样本容量当样本容量n较大时,较大时,对于打结的情况,对于打结的情况,Kendall给出了调整后的结果为给出了调整后的结果为其其中中,是是X观观测测值值中中第第i组组打打结结的的个个数数,为为Y观观测测值中第值中第j组打结的个数组打结的个数.当样本容量当样本容量n较大时,相应的大样本近似公式为较大时,相应的大样本近似公式为其中其中易得,在没有打结的情况下,易得,在没有打结的情况下,且大样本近似也一,且大样本近似也一样样 在在实实际际问问题题中中,不不失失一一般般性性,假假定定 已已从从小小到到大大排列,因此排列,因此协同性问题就转化为协同性问题就转化为 的秩的变化问题的秩的变化问题.令令 为为
5、 的的秩秩,因因而而x,y的的秩秩形成形成 ,若记,若记令令 ,则,则Kendall 统计量的值为统计量的值为 也就是说,对于每一个也就是说,对于每一个 ,求当前位置后比,求当前位置后比 大大的的数数据据的的个个数数,将将这这些些数数相相加加所所得得就就是是 ,同同理理可计算可计算 .Kendall 还还经经常常用用于于分分析析列列联联表表数数据据,度度量量两两个个有有序序变变量量的的相相关关性性,当当列列联联表表中中的的行行列列数数目目r和和c较大时,使用较大时,使用 Kendall 更合适更合适.Kendall 检验结果检验结果 当当 时时拒拒绝绝零零假假设设,当当 时时不不能能拒拒绝绝零
6、零假设假设.临临界界值值 满满足足 ,由由对对称称性性得得,K小于小于0时,取绝对值查表即可时,取绝对值查表即可.例例:现现在在想想研研究究体体重重和和肺肺活活量量的的关关系系,调调查查了了某某地地10名名女女初初中中生生的的体体重重和和肺肺活活量量的的数数据据如如下下所所示示,进行相关性检验进行相关性检验.学生体重和肺活量比较表学生体重和肺活量比较表 指标指标学生编号学生编号 1 2 3 4 5 6 7 8 9 10体重体重x 75 95 85 70 76 68 60 66 80 88 肺活量肺活量y2.62 2.91 2.94 2.11 2.17 1.98 2.04 2.20 2.65 2
7、.69解:解:建立假设检验问题为建立假设检验问题为 体重和肺活量没有相关关系体重和肺活量没有相关关系 体重和肺活量有相关关系体重和肺活量有相关关系计算每个变量的秩如下表:计算每个变量的秩如下表:秩秩学生编号学生编号 7 8 6 4 1 5 9 3 10 2 体重体重x的秩的秩 1 2 3 4 5 6 7 8 9 10肺活量肺活量y y的秩的秩 2 5 1 3 6 4 7 10 8 9 和和 的求解方法如下:的求解方法如下:秩秩 1 2 8 1 2 5 5 3 3 1 7 0 4 3 6 0 5 6 4 1 6 4 4 0 7 7 3 0 8 10 0 2 9 8 1 0 10 9 0 0 合计合计 38 7由公式得由公式得在给定显著性水平在给定显著性水平 下下,故拒绝零假设,认为体重和肺活量之间有相关关系故拒绝零假设,认为体重和肺活量之间有相关关系由公式得由公式得在给定显著性水平在给定显著性水平 下下,故拒绝零假设,认为体重和肺活量之间有相关关系故拒绝零假设,认为体重和肺活量之间有相关关系
限制150内