2022年非参数统计学讲义相关与回归 .docx
《2022年非参数统计学讲义相关与回归 .docx》由会员分享,可在线阅读,更多相关《2022年非参数统计学讲义相关与回归 .docx(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品_精品资料_非参数统计学讲义主讲:统计系袁靖第五章相关和回来1引言所谓 相关 ,是指两组或两组以上观看结果之间的连带性或联系.换句话说,也就是各组观看结果所反映的特性之间有关系.如几个亲生兄弟间的智商与诞生次序有关系,受训练程度与性别有关系,诞生率 X 和文盲率 Y 之间的关系等等.在实际问题的讨论中,人们经常想知道两组或两组以上的观看结果是否有联系,同时也想知道联系的程度如何.前面的统计检验能够在肯定的显著性水平上,确定各组观看 值的关系是否存在.相关方法被用来度量两个或更多变量之间的线性关系的强度,是回来分析的基础.在数理统计学中,我们使用相关系数定义变量X 和变量 Y 之间的相关性.
2、可编辑资料 - - - 欢迎下载精品_精品资料_corr X ,Ycov X , Yvar X varY10.1可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_对于样本 X 1 , Y1 , X 2 ,Y2 , X n ,Yn 来说, Pearson相关系数为可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_1 X irnX YiY X iX YiY 0.2可编辑资料 - - - 欢迎下载精品_精品资料_n1 X iX 2YiY 2 X iX 2YiY 2可编辑资料 - - - 欢迎下载精品_精品资料
3、_假如在这个样本中的n 个观看值独立,就r 是的渐近无偏估量.假如它又是二元正态分布,就r 是的 ML 估量.可编辑资料 - - - 欢迎下载精品_精品资料_为了检验H 0 :0 , H 1 :0 ,可以选取统计量trn21r 2 t n2可编辑资料 - - - 欢迎下载精品_精品资料_结论: Pearson相关系数度量的是一种线性关系,而我们所要介绍的非参数的Spearman秩相关系数 r s和 Kendall 相关系数实际上度量的是一种形式的相依联系,或是更广义的单调关系.因此相关的概念被推广,不仅指线性相关,而泛指相依或联系. 2两个样本的相关分析一、 等级相关等级相关 Rank Cor
4、relation 也称作级序相关 ,用于两个至少是定序尺度测量的样本问相关程度的测定讨论背景1 度量了总体样本点在标准差线四周的集合程度,详见笔记P38.可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_1. 基本方法两个样本 X 、Y ,其观看数据可以配对为 X 1 , Y1 , X 2 , Y2 , X n , Yn .将x1 , x2 , xn 排序后可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_评秩,其秩记作U ,与xi 相对应的秩为U i i1,2, n .同样,y1 , y2 , yn
5、排序后评秩,秩记作V ,与可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_y i 相对应的秩为Vi i1,2, n .这样得到的n 对秩U 1 ,V1 , U 2 , V2 ,U n ,Vn 可能每一对完全相可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_等,也可能不等.由于每一样本都是n 个数据评秩,因此U i 与Vi 的取值都是从 1 到 n.X 、Y 的秩可能完可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_全一样,即对于全部的i 来说,有U i
6、 Vi,表 5 1 是完全一样的评秩结果.X 、Y 的秩可能完全相反,可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_表 5 2 是完全相反的评秩结果.假如X 、Y 完全相关,应当对于全部的i 有U i Vi ,即 U i Vi 0.因可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_此, U i 与 Vi之差可以用来度量X 、Y 的相关程度.定义可编辑资料 - - - 欢迎下载精品_精品资料_D iU iVi表 5-1X 的秩完全一样的评秩Y 的秩1122n 1n 1nn表 5-2完全相反的评秩X
7、的秩Y 的秩1n2n 1n 12n1可编辑资料 - - - 欢迎下载精品_精品资料_就两组秩完全相关时,Di 可编辑资料 - - - 欢迎下载精品_精品资料_D5.3 )式的这个秩差值平方和的大小既受到n 的多少的影响,又受到两组秩不一样程度的影响,因可编辑资料 - - - 欢迎下载精品_精品资料_此,采纳相对的测量指标有利于说明X 、Y 的相关程度.由于2 的最大值反映 X 、Y 完全不相关的情可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_Di2况,所以,用 可编辑资料 - - - 欢迎下载精品_精品资料_5.4 )式的中括号内最终一项,当n
8、 为奇数时是 22. n 为偶数时是 12.5.3 )式除以 1可编辑资料 - - - 欢迎下载精品_精品资料_5.5 )式的取值从 0 到 1.依据表 5-1 中的数据运算 5.5)式值为 0,表 5-2 中的数据运算的 5.5)式值为 1,即 X 、Y 的秩完全一样时, 5.5 )式的值为 0, X 、Y 的秩完全不一样时, 是测定两个样本相关强度的重要指标.其运算公式为可编辑资料 - - - 欢迎下载精品_精品资料_6R1nn 2D 2i0.61可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_斯皮尔曼相关系数也写为rs ,在有下标注以s 是
9、为说明这个相关系数r 不是积矩相关的简洁相关系可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_数,而是等级相关的Spearman相关系数.注:由于 5.6)式与 5.5)式不同,所以,R 的取值从一 1 到十 1, R1 说明 X 、Y 完全相关, R可编辑资料 - - - 欢迎下载精品_精品资料_十 l 为完全正相关, R一 1 为完全负相关.R 越接近于 l,说明相关程度越高,反之,R 越接近于零,说明相关程度越低,R 0 为完全不相关. R 0 为正相关, R 0 为负相关.通常认为R0.8 为相关程度较高. Spearman秩相关系数检验
10、临界值查表可得,P198.存在打结时, Spearman统计量要作相应修正.在大样本时,可用正态近似作检验.可编辑资料 - - - 欢迎下载精品_精品资料_Zrsn1nN 0,1可编辑资料 - - - 欢迎下载精品_精品资料_2. 应用【例 5-1】经济进展水平和卫生水平之间的相关分析对某的区 12 个街道进行调查,并对经济进展水平和卫生水平按规定的标准打分,评定结果如表54.表 5-4某的区经济水平与卫生水平得分1街道号经济水平82卫生水平86街道号7经济水平84卫生水平8028778878773606598075可编辑资料 - - - 欢迎下载精品_精品资料_498881094965756
11、411858568990126870分析:将表 5 4 中定距尺度测量的分数,按从小到大的次序排等级,得到表5 5 的结果.对两个定序尺度测量的样本进行相关分析,可以采纳等级相关系数测定.必要的运算过程如表5 5 所列.依据5 6)式可得可编辑资料 - - - 欢迎下载精品_精品资料_2R16D i163210.11190.8881可编辑资料 - - - 欢迎下载精品_精品资料_n n 2112 12 21由于 R 0 888l 0 8,所以该的区的经济进展水平和卫生水平存在着正相关关系,相关程度较高,为 88 81.表 5-5某的区经济水平与卫生水平得分2街道号经济水平 U)卫生水平 nn
12、2112unn 2112v式中, u 是 X 中同分的观看值数目, v 是 Y 中同分的观看值数目.【例 5-2】经济进展水平和卫生水平之间的相关分析某的区对 24 个区县进行调查,并对经济进展水平和卫生水平按规定标准评分,结果如表5 6.分析:将表5 6 的评分转换为秩次,从高往低排序,同分的秩取平均值,结果见表5 7.依据公式5.6 运算可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_2R16D i1634710.15090.8491可编辑资料 - - - 欢迎下载精品_精品资料_nn 212424 21由于经济水平和卫生水平的评分中均有同分
13、,应采纳校正因子修正.利用5.7 式运算修正的 R 为nn 216D 26uv 2457563471 / 21612Ri0.8490可编辑资料 - - - 欢迎下载精品_精品资料_n n2112unn 2112v24575162457512可编辑资料 - - - 欢迎下载精品_精品资料_对比两个R 值可知,由于同分的观看值数目占观看值总数目的比例不是很大,因而校正后的R 与校正前的R 变化不大.但是,校正前的只略大于校正后的R,这说明同分对只的影响虽然很小,但同分的影响是夸大 R 值.因此.在X 、Y 中至少有一个存在大量同分时,应进行校正.表 5-6经济水平与卫生水平评分区县编号经济水平X)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年非参数统计学讲义相关与回归 2022 参数 统计学 讲义 相关 回归
限制150内