教育统计与测量--5.相关分析剖析.ppt
《教育统计与测量--5.相关分析剖析.ppt》由会员分享,可在线阅读,更多相关《教育统计与测量--5.相关分析剖析.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 相关分析相关分析 任课教师:赵立任课教师:赵立教育统计与测量教育统计与测量本章主要内容本章主要内容相关、相关系数和散点图相关、相关系数和散点图各种相关系数的计算(适用条件、计算方法)各种相关系数的计算(适用条件、计算方法)n积差相关积差相关n等级相关等级相关n质量相关质量相关n品质相关品质相关相关系数的选用与解释相关系数的选用与解释一、事物之间的关系一、事物之间的关系因果关系:例如:距离因果关系:例如:距离=速度速度时间。时间。n特点:可以用函数式表达;两个变量的值是一一对应特点:可以用函数式表达;两个变量的值是一一对应的。的。共变关系:例如:盖楼房与小孩的身体发育。共变关系:例
2、如:盖楼房与小孩的身体发育。n特点:看起来有联系,实际上没有关系。特点:看起来有联系,实际上没有关系。相关关系:例如:智力与学习成绩。相关关系:例如:智力与学习成绩。n特点:有一定联系,但两个变量的值并没有一一对应特点:有一定联系,但两个变量的值并没有一一对应关系。关系。第一节第一节 相关的意义相关的意义二、相关(统计学意义)二、相关(统计学意义)指具有相关关系的不同现象之间的关系程度指具有相关关系的不同现象之间的关系程度。1.方向:方向:(1)正相关正相关:两列变量变动方向相同。同时增大,同时减少。:两列变量变动方向相同。同时增大,同时减少。(2)负相关负相关:两列变量变动方向相反。一个增大
3、,另一个却:两列变量变动方向相反。一个增大,另一个却减少;反之亦然。减少;反之亦然。(3)零相关零相关:两列变量之间无关系。:两列变量之间无关系。2.密切程度:密切程度:强相关、中度相关、弱相关强相关、中度相关、弱相关三、相关系数三、相关系数相关系数是两列变量相关程度的数字表现形式。样本相关相关系数是两列变量相关程度的数字表现形式。样本相关系数用系数用r表示;总体相关系数用表示;总体相关系数用 表示。表示。,r-1.00,1.00(1)完全相关:)完全相关:-1.00或或1.00,说明两个变量之间为确定关系;,说明两个变量之间为确定关系;(2)不完全相关:)不完全相关:|,r|1;(3)不相关
4、:)不相关:当相关系数在当相关系数在0附近时,说明两个变量之间毫无附近时,说明两个变量之间毫无关系。关系。正相关时,相关系数为正,取值在正相关时,相关系数为正,取值在01之间;负相关时,相关之间;负相关时,相关系数为负,取值在系数为负,取值在-10之间。之间。注意:相关系数仅仅为一个比值,注意:相关系数仅仅为一个比值,非等距、非等比,非等距、非等比,不能做加减乘除。不能做加减乘除。三、相关散点图三、相关散点图直观地显示了两个事物的成对观测值之间是否直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程度存在相关,存在什么样的相关以及相关程度(a)完全正相关)完全正相关(b
5、)完全负相关)完全负相关(c)无相关关系)无相关关系(d)非线性关系)非线性关系(e)正相关)正相关(f)负相关)负相关计算相关系数时应注意的问题计算相关系数时应注意的问题相关系数受样本容量相关系数受样本容量n的影响的影响n如果如果n n很小,可能完全没有相关的两事物,却计算出较大很小,可能完全没有相关的两事物,却计算出较大的相关系数。的相关系数。n一般以一般以N N大于大于3030为宜为宜相关系数相关系数不是等距数据也不是比例数据不是等距数据也不是比例数据计算相关系数要求计算相关系数要求成对成对数据数据没有线性相关,不一定没有关系,可能是非线性的没有线性相关,不一定没有关系,可能是非线性的相
6、关系数的计算不受以下因素影响相关系数的计算不受以下因素影响n互换两个变量互换两个变量n某一变量的所有值都增加同一数值某一变量的所有值都增加同一数值n某一变量的所有值都乘以同一正数某一变量的所有值都乘以同一正数第二节第二节 积差相关积差相关一、积差相关适用条件一、积差相关适用条件积差相关,也称积差相关,也称积矩相关积矩相关、皮尔逊相关皮尔逊相关,是求直线相关的基本,是求直线相关的基本方法。方法。适用条件适用条件(1)两列数据都是)两列数据都是测量的数据测量的数据(数值型变量);(数值型变量);(2)双变量正态双变量正态(获接近与正态)。要求总体为正态,但对样(获接近与正态)。要求总体为正态,但对
7、样本不要求一定为正态。本不要求一定为正态。(3)成对成对数据数据(4)两列变量之间的关系应是)两列变量之间的关系应是线性线性的,否则不能计算线性相关。的,否则不能计算线性相关。(5)样本容量)样本容量n大于大于30,最好大于,最好大于50.即:即:两列变量为正态等距(比),且具有线性关系。两列变量为正态等距(比),且具有线性关系。把协方差变成一个相对量数,即将离差除以各自的标把协方差变成一个相对量数,即将离差除以各自的标准差,变成用标准分数表示,然后将两个标准分数的乘积准差,变成用标准分数表示,然后将两个标准分数的乘积除以除以n,所得的商就是积差相关系数。用公式表示为:,所得的商就是积差相关系
8、数。用公式表示为:例例研究某能力测验的预测效度。研究某能力测验的预测效度。X表示能力测验的分数,表示能力测验的分数,Y表表示被试大学一、二年级有关科目的平均分数。两变量之间的相示被试大学一、二年级有关科目的平均分数。两变量之间的相关系数就是该测验的预测效度。关系数就是该测验的预测效度。XYxyx2y2xy7471808576777768747482758189828988848087-1.6-4.64.49.40.41.41.4-7.6-1.6-1.6-1.7-8.7-2.75.3-1.75.34.3.3-3.73.32.5622.1619.3688.360.161.961.9657.762.
9、562.562.8975.697.2628.092.8928.0918.490.0913.6910.892.7240.02-11.8849.82-0.687.426.02-2.285.92-5.2875683700198.40188.0791.802 2用原始数据计算用原始数据计算公式为:公式为:例例计算身高与体重的相关系数计算身高与体重的相关系数3、用标准分数计算、用标准分数计算4、相关系数的合并、相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。意义:来自同一总体的多个样本的相关系数的合成。步骤:步骤:(1)将各样本的将各样本的r转换成费舍转换成费舍Z分数分数,见附表,见附表8。
10、(2)求每一样本的)求每一样本的Z分数之和分数之和(3)求平均)求平均Z分数分数(4)再把)再把转换为转换为第三节第三节 等级相关等级相关等级相关是指以等级次序表示的两列或多列变量等级相关是指以等级次序表示的两列或多列变量之间的相关。之间的相关。适用条件适用条件n两列变量是等距或等比变量,但不是正态分布两列变量是等距或等比变量,但不是正态分布n两列顺序变量两列顺序变量n样本容量未大于样本容量未大于30主要包括:主要包括:n斯皮尔曼等级相关斯皮尔曼等级相关n肯德尔和谐系数肯德尔和谐系数1、斯皮尔曼等级相关、斯皮尔曼等级相关(1)适用资料:适用资料:顺序量表或数值型变量按其大小排列赋顺序量表或数值
11、型变量按其大小排列赋以等级顺序;两个变量均为等级变量的呈线性相关的资料。以等级顺序;两个变量均为等级变量的呈线性相关的资料。(2)计算公式:)计算公式:DRX-RY-各对偶等级之差,n为等级数目,RX-X变量的等级,RY-Y变量的等级请注意:请注意:尽可能不出现相同尽可能不出现相同等级,即不能并列等级,即不能并列排名,否则误差大排名,否则误差大公司的质量形象公司的质量形象与其市场份额等与其市场份额等级成正相关。级成正相关。例例一家广告代理商想了解一家公司产品质量等级是否与其市场份一家广告代理商想了解一家公司产品质量等级是否与其市场份额等级有关。小规模的实验研究,获得该行业额等级有关。小规模的实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计 测量 相关 分析 剖析
限制150内