《心理统计学第六章.doc》由会员分享,可在线阅读,更多相关《心理统计学第六章.doc(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 第六章 相关量数课时安排:6课时教学课型:理论课,课堂同步练习教学目的要求:理解相关分析的意义与条件;熟练掌握积差相关法的基本思想与分析方法;熟练掌握等级相关、点二列相关、二列相关及相关的使用前提与分析方法;能应用各种相关解决实际问题。教学重点与教学难点:重点积差相关的意义与应用;难点各种相关方法的选择应用教学方法、手段、媒介:教科书、板书、多媒体教学过程与教学内容第一节相关与相关系数1第二节 积差相关3第三节 等级相关6第四节 质与量的相关10第五节 品质相关相关13作业题13第一节 第一节 相关与相关系数一、事物的关系与相关量数事物关系分为三种:一是说明的是事物之间互相依存、互为因
2、果的关系。二是函数关系。三是伴随关系,它既不同于因果关系和函数关系,又不排斥因果关系和函数关系,是事物之间的一种更为复杂关系,相关关系即属这种关系。三者的关系如图6-1所示。 因果关系 函数关系 伴随关系 图6-1 事物之间的关系二、相关的种类(一)方向上正相关、负相关和零相关正相关指一列变量由大而小或由小而大变化时,另一列变量亦由大而小或由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。负相关指一列变量由大而小或由小而大的变化,另一列变量却反由小而大或由大而小的变化,即两列变量的变化方向是相反的,属“此增彼减”的关系。零相关又称无相关,是一列变量由大而小或由小而大变化时,另一列
3、变量则或大或小的变化,即两列变量的变化看不出一定的趋势,甚至毫无关系。(二)形状直线相关和曲线相关直线相关指两列变量中的一列变量在增加时,另一列变量随之而增加;或一列变量在增加,另一列变量却相应地减少,形成一种直线关系。两列变量的变化在坐标轴上绘制散点图时形成的是长轴或椭圆形图形。 曲线相关指两列相伴随变化的变量,未能形成直线关系。两列变量的变化莫测在坐标轴上绘制散点图时形成的是成弯月状或曲线形图形。 (三)变量个数简相关和复相关简单相关是指只有两个变量的相关,又称简相关。复杂相关则是指有三个或三个以上变量的相关,也称复相关。 (四)相关程度完全相关、强相关、弱相关和无相关完全相关指两列变量的
4、关系是一一对应、完全确定的关系。在坐标轴上描绘两列变量时会形成一条直线。强相关又称高度相关,即当一列变量变化时,与之相应的另一列变量增大(或减少)的可能性非常大。在坐标图上则表现为散点图较为集中在某条直线的周围。弱相关又称低度相关,即当一列变量变化时,与之相对应的另一列变量增大(或减少)的可能性较小。在坐标图表现出散点比较分散地分布在某条直线的周围。无相关则是当一列变量变动时,相对应的另一列变量可能有变动,也可能无变动,而且毫无规律。三、相关分析的方法(一)图示法图示法主要是利用散点图来描述变量之间的相互关系。散点图是将成对变量的变动值描绘在坐标图上形成的一种图形。从散点图上,我们既可以了解相
5、关的方向(是正相关、负相关,还是零相关)、相关的形态(是直线相关还是曲线相关),也可以了解相关的大致程度(是强相关还是弱相关)。 (二)计算法计算法是通过计算变量之间的相关系数来描述其相关情形的。相关系数是表示相关方向和大小的一种数值,用符号表示,其取值范围为,其中符号表示相关的方向,绝对值表示相关的程度。相关系数为1时表示完全正相关,相关系数为时表示完全负相关,相关系数为0时表示零相关。相关系数越接近1,其相关程度越高,反之,越接近0,相关程度越低。相关系数究竟达到何种程度才算相关高或低属于统计检验的问题。不过也有一些统计学家对相关程度作了规定,如认为表示低度相关,表示中度相关,表示高度相关
6、。四、相关系数的解释首先,要从逻辑上判断事物之间是否真正存在关系。因为相关系数是由样本数据计算而来的,即使所考察的两列变量确无任何关系,我们也可以通过概率得到强的正相关或是强的负相关。 其次,要注意随着样本容量的增大,达到相关显著的相关系数值会变得越来越小。对于相关系数,我们不仅要问是否显著,还要问有多大,而决定其大小的是测定系数。测定系数是相关系数的平方(即),用以说明二列变量的变异中一方能由另一方解释部分的多少。一般来说,相关系数在0.3以下为低相关,这时的只有理论意义而无实际意义;相关系数在0.40.6之间为中等相关,这时的既有有理论意义也有实际意义;相关系数在0.7以上为高相关,这时的
7、理论意义与实际意义都很大。第三,要在一定的时空间范围内解释相关系数。此外,应注意不同类型的数据其相关的计算方法不同。 第二节 积差相关一、积差相关的意义(一)积差相关的定义积差相关是直线相关中最基本的方法,又叫均方相关ak 积矩相关,其公式由英国统计学家皮尔逊(Pearson)提出,故又称或皮尔逊相关系数,用符号表示。它是利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积(即积差),再转换为标准积差后所求得的标准积差的平均数。我们以例6-1说明积差相关的意义及公式来源。例6-1:有5名学生的身高(公分)与体重(公斤)的测量结果如表6-1第2栏所示。试问身高与体重有无关系?表6-1
8、5名学生身高和体重的测查结果第1栏第2栏第3栏第4栏第5栏第6栏学生编号实测记分离差记分积差标准记分标准积差身高体重Y11707203001.50.00216569-500-0.4100.00315066-20-3601.63-1.52.44418070101100.820.50.4151856815-1-151.22-0.5-0.6185034500552.24 第1步,计算两列变量各自的平均数和标准差 ,;,第2步,求成对变量的离差和,将实测记分转换为离差记分。第3步,将成对变量的离差相乘,称为积差即。积差的平均数称协方差(covariance),记为,即第4步,将离差记分转换为标准记分。
9、第5步,将两列变量的标准记分再相乘称标准积差,标准积差的平均数就是积差相关系数的基本公式,即可见,积差相关系数实际上就是成对变量标准积差的算术平均数。例6-1的积差相关系数为 (二)积差相关系数的使用条件积差相关的使用一般需满足三个充分必要条件。一是两列变量必须是成对的,而且样本容量不宜少于30;二是两列变量必须是比率变量或等距变量;三是两列变量的总体分布均为正态分布或近似正态分布。二、积差相关系数的计算方法(一)定义式(二)计算式 用计算式计算例6-1的积差相关系数的过程如下。 分别求两列变量值的和,即和。 分别对两变量的变量值进行平方(即,)并求和(即,)。 求成对变量值的乘积(即)及其乘
10、积和(即)。 代入公式,计算结果表6-2 积差相关计算表第1栏第2栏第3栏第4栏第5栏第6栏学生身高体重1170722890051841224021656927225476111385315066225004356990041807032400490012600518568342254624125808503452382558705三、积差相关显著性的判断积差相关的显著性可查“皮尔逊积差相关系数显著性临界值表”。当自由度()为时,若,相关显著,若相关极显著,若,相关不显著。本例n=5, ,r=0.45,查“皮尔逊积差相关系数显著性临界值表”可得=0.878,所以相关不显著。第三节 等级相关一、
11、等级相关的意义等级相关是根据等级资料来研究变量之间相互关系的方法,其资料一是研究中所收集的数据本身就是等级评定的资料,二是研究中所收集的数据原本为等距或比率变量的资料,因不满足积差相关的使用条件需要将基而转化为等级性资料进行分析的情形。等级相关使用条件较积差相关更为宽松和灵活,可以用于多列等级或顺序变量,也可以用于成对变量值少于30的情形,还可以用于两列变量总体分布为非正态时。二、等级相关的计算方法等级相关法因变量个数的多少而有用于分析两列变量相互关系的斯皮尔曼等级相关和用于分析多列变量相互关系的肯德尔和谐系数。(一)斯皮尔曼等级相关斯皮尔曼等级相关(Spearmans rank correl
12、ation)是根据两列变量的成对等级差数计算相关系数,又叫“等级差数法”,用符号或表示1无重复量的等级相关例6-2:10名辅导员工作年限与辅导能力评定等级结果如表6-3所示。试问工作年限与辅导能力之间是否有关?表6-3 工作年限与辅导能力评定等级资料表12345678910年限581024126397能力73598261041742108169350-13-101011-40191010111630 变量形式的转换。因只有年限变量为等距变量,故只需将其转换成顺序变量即可。 求成对等级变量的差。 求等级差的平方()及平方和()。 代入公式,计算结果。2有相同等级的等级相关系数例6-3:10名学生
13、的数学和物理测验的成绩如表6-4所示,试求数学和物理成绩的相关系数。 数据中不仅数学成绩有较多的重复数据,而且物理成绩也有较多重复数据。其中,或, 表6-4 学生数学和物理成绩表12345678910数学80707080657075607055695物理707570756075806565606951.55.55.51.585.5395.5105.535.539.5317.57.59.5-42.50-1.5-1.52.521.5-20.5166.2502.252.256.2542.2540.2543.5 分析过程: 变量形式分析与转换。 求成对等级变量的差,等级差的平方()及其平方和()。 确
14、定重复等级数目,求等级的离差平方和。数学成绩的平方和物理成绩的平方和 代入公式,计算结果。 3等级相关显著性的判别方法单侧检验:查“斯皮尔曼等级相关系数临界值表”,若,相关显著;若,相关极显著;若,则相关不显著。双侧检验:计算值,即其中,自由度。(二)肯德尔和谐系数肯德尔和谐系数由统计学家肯德尔(Kendel)提出的肯德尔交错系数、相容性系数和一致性系数等三种等级相关系数的总称。肯德尔一致性系数是用于描述多列等级变量相关程度或一致性程度的相关方法,其中又有肯德尔系数和肯德尔系数,它分别用于不同的资料形式。肯德系数用于一般等级评定的资料,一是K个评分人评价N个被评价人或N件作品,以分析和评价K个
15、评分人的评价是否一致,二是同一个人先后K次评价N个被评人或N件作品,以分析其前后评价是否一致。1无重复等级的系数系数的取值范围在01之间。当为1时,评分者意见完全一致,SS越小,评价的一致性程度越低;相反,SS越大,评价的一致性程度越高高。例6-4:随机抽取5名儿童,采用排序法研究其对七种颜色的喜好程度,结果表6-5。试问儿童对七种颜色的喜好程度是否一致?表6-5 实际的评价结果 表6-6 假想的评价结果评 价 者评 价 者1234512345红1332312144红2222210100橙5454523529橙5555525625黄21112749黄11111525绿3223111121绿33
16、33315225青66767321024青6666630900兰4545422484兰4444420400紫77676331089紫7777735122514034401403500 假设5名儿童对颜色的喜好完全相同,见表6-6,其分析过程如下。 求等级的和,即将每一颜色的等级相加,结果见表6-6。 求等级和的平方,即直接将等级和平方,结果见表6-6。 求等级的离差平方和(简称平方和)。实得的平方和: 完全一致的平方和: 对色彩的喜好并不完全相同时,如表6-5。分析过程如下。 求等级的和,结果见表6-5。 求等级和的平方,结果见表6-5。 代入公式,计算结果2有相同等级的W系数式中, 例6-5
17、:在一次绘画竞赛中,3位评委对8名参赛者作品的等级评定结果如表6-7所示,试问三位评委的对绘画的评定意见是否一致?表6-7 3位评委对8幅作品的评定结果评价者参 赛 作 品 编 号12345678A13538736B1.53.53.51.5785.55.5C214478464.57.512.58.5222312.517.510820.2556.25156.2572.25484529156.25306.251780.5 分析过程: 求等级和()及等级平方和()。 求重复等级的校正值 , 代入公式,计算结果 3系数的显著性检验1)查表法:当n为37个时,查肯德尔W系数临界值表,然后用分子的SS进行
18、直接比较: SSSS0。05, 一致性显著;SSSS0。01,一致性极显著;SSSS0。05,一致性不显著。因为SS=2316 SS0.01=737.00,所以一致性相当高,10人对颜色喜好有极高的一致性。2)计算法当n大于7时,需计算值,再查显著性临界值表进行比较判断。当自由度,若0.05,一致性显著;若0.01,一致性极显著,若0.05,一致性不显著。如例6-5,n=8,所以当时,。因为,所以一致性极显著,说明三位评委的意见非常一致。第四节 质与量的相关一、点二列相关(一)定义研究一列等距或比率变量与一列“二分”名称变量之间相关的统计方法称做点二列相关系数,用符号表示。所谓“二分”名称变量
19、,是将变量按事物固有的性质分为两极情况。如性别分为男和女。点二列相关在测量中用于题目区分度分析。(二)计算 例6-7:随机抽取了某班14名学生的数推理测验的成绩。其中,男生成绩为67,10,20,43,61,18,35,33;女生成绩为23,44,60,10,50,30。试问数推理成绩与学生性别有无关系? 求“二分”名称变量各自的比例, 分别求类类值的平均数 , 求全部观测值X的标准差 代入公式,计算结果 值得注意的是计算点二列相关系数出现负值时,并不一定是负相关,其负值与两个平均数的位置有关。点二列相关是积差相关的特殊应用。可用积差相关法计算。需要对“二分”名称变量赋值,如上例,男生赋值为0
20、,女生赋值为1,则有,其积差相关系数为 表6-8 点二列相关资料转换为和积差相关资料计算表1234567891011121314成绩6710204361183533234460105030504性别000000001111116(三)显著性检验查“积差相关显著性临界值表”。本例时,=0.532,=0.661。因为0.008 =0.532,所以数推理成绩与性别无相关,即成绩优势与性别无关。二、二列相关(一)定义二列相关系数是研究一列正态的比率或等距变量和一列人为“二分”名称变量之间相互关系的统计方法,用符号或表示。在测量中用于测验效度和试题区分度的分析。(二)计算例6-8:某校心理班50名学生在
21、期末的心理测量考试后,教师对某一简答题上的得分按一定标准划分为答对与答错两种情况,结果有58%的学生答对了该题,而测验总分的平均数为53分,标准差为18分,答对学生的平均分为61。试问该题与测验总分有无关联?已知:,由值查正态分布表得值为0.39,则该题与总分的二列相关系数为(三)显著性检验 若,相关显著; ,相关极显著; ,相关不显著。例6-8的检验值为因为Z,所以相关极显著,说明该题与总分存在明显的关系。表6-10 点二列相关与二列相关的比较表比较内容点二列相关二列相关变量形式共同点一列正态的等距或比率变量不同点“二分”名称变量人为的“二分”名称变量计算公式第五节 品质相关相关一、意义相关
22、是专门研究二列“二分”名称变量之间相关的统计方法。二、计算例6-9:研究者随机抽取100名学生进行情绪稳定性测验,结果如表6-11所示。试问性别与情绪稳定性有无关联?表6-11 100名学生情绪稳定性测查结果性别情 绪 稳 定 性稳 定不 稳 定女生34()16()50()男生30()20()50()64()36()100() 将表中数据代入公式,得 (三)检验 时,若,相关显著; ,相关极显著;相关不显著。本例, ,相关不显著。 作业题1某小学一年级一班有学生40人,期末考试后,班主任老师想了解学生语文学习与算术学习的关系,试问用什么相关方法进行分析?2用不同形状、颜色和大小的几何图形让39
23、岁的儿童分类,考察不同年龄儿童选择分类标准的特点。现有5岁组儿童35人,按色分类的23,按形分类的12人;6岁组儿童36,按色分类的14,按形分类的32人。问选择分类标准是否与年龄大小有关?312名学生经济学()和人类学()的期末考试分数如下表,试用积差相关法和等级相关法计算。1234567891011125168729755739574209174807470889367739973339180864下表成绩与性别有无关联? 1 2 3 4 5 6 7 8 9 10性别 男 女 女 男 女 男 男 男 女 女成绩 83 91 95 84 89 87 86 85 88 925在某项测验中,随机
24、抽取10名学生的测验总分及其在某一主观题(满分值15分,分界规则为:17分不合格,815分合格)的得分如下表。试分析试题与总分的相关。12345678910总分79707578778488696680题目分7688912117596四位教师对6篇论文的评价结果。试分析其评价的一致性。评分者论 文 编 号123456A142.5562.5B231564C1.531.545.55.5D242562综合练习一110位大一学生平均每周所花的学习时间与他们的期末考试成绩如下表。试问:学习时间与考试成绩之间是否有相关? 比较两组数据谁的差异程度大一些?比较学生2与学生9的期末考试测验成绩。12345678
25、910学习时间40431810253327173047考试成绩587356475854453268692某班数学的平均成绩为90,标准差10分;化学的平均分85分,标准差为8分;物理的平均分为79,标准差15分。某生在三科成绩分别为95,80,80。试问该生在哪一学科上突出一些?该班三科成绩的差异程度如何?有无学习分化现象?该生的学期分数是多少?三科的总平均和总标准差是多少?3某校高一年级四个班的数学成绩初步统计结果为:一班50人,平均分88,标准差为10;二班55人,平均分90,标准差12;三班48人,平均分85,标准差9;四班53人,平均分92,标准差6。试问 年级平均数与标准差是多少?
26、哪个班的差异程度一些?4某班作业的平均分为90,标准差为5;期中考试的平均分为82,标准差为10,期末考试的平均分为76,标准差为8,三次成绩的比重为2:3:5。某生三次成绩为95,84,70。试问 该生的学期分数是多少? 期中和期末成绩孰的差异程度大一些?5三位教师对6位青年在大学的学习成绩进行评定(在0到20内)结果如下。试问三位教师之间是否有显著关系。教师123456A1512184817B813165210C1091545126一名学生计算了一大群小学三年级学生身高和体重之间的相关,得出r=0.32。她不知道是否能得出“身高越高,则体重越重”或“体重超重能导致身体长高”的结论。请帮她解
27、决这一问题。7说明以下每种情况是否存在正相关、负相关或无相关:1)丈夫与妻子的年龄 2)打高尔夫球者练习的小时数与他们的分数 3)鞋的尺码与智商4)收入与教育5)衬衣尺寸与幽默感6)接种流感疫苗的人数与患流感的人数7)短跑者练习的小时数与他们跑100码所花的时间;8)家庭食物消费与家庭衣料消费8描述统计的基本思想是什么?举例具体说明之。980个大学生在一周里用于休闲的时间数(单位:小时)如下表。试求: 平均数与标准差。 35小时和16小时的百分等级及各组的百分等级,并解释结果。 百分位差和四分位差 中数和众数10-1415-1920-2425-2930-3435-40频数82827124110某地在2003年1994的年报纸订阅量的情况如下,采用何种方法度量其集中趋势和离中趋势比较恰当?订 阅 者 数 量100以下100-499500-899900-12991300-16991700以上订阅量203136884128811在教学管理研究中,管理者在一学期对学生到课 况进行检查和统计,这一变量从什么样的角度来看是离散变量,又从什么样的角度来看是连续变量?试加以说明。12六年级的周宾在一次期末考试时语文得96分,数学84分,父母批评他数学学得不好,这种说法对吗?为什么?已知他所在班的语文平均分92,标准差为9.54,数学平均分73 ,标准差为7.12。
限制150内