《管理相关分析.ppt》由会员分享,可在线阅读,更多相关《管理相关分析.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于管理相关分析现在学习的是第1页,共49页一变量间的关系:函数关系是一一对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上 现在学习的是第2页,共49页函数关系(几个例子)现在学习的是第3页,共49页变量间的关系:相关关系(correlation)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围 现在学习的
2、是第4页,共49页相关关系(几个例子)现在学习的是第5页,共49页 绘制数据散布图 计算相关系数现在学习的是第6页,共49页散布图 散布图的定义散布图的定义:是一种研究成对出现的、两组相关数据之间关系的图示技术。在散布图种,成对的数据形成点子云,研究点子云的分布状态,便可推断成对数据之间的相关程度。当x值增加,y值也相应增加,就称x 与y之间是正相关;当x值增加,y值也相应减少,就称x 与y之间是负相关;现在学习的是第7页,共49页散布图分析:散布图分析:现在学习的是第8页,共49页现在学习的是第9页,共49页现在学习的是第10页,共49页现在学习的是第11页,共49页现在学习的是第12页,共
3、49页现在学习的是第13页,共49页五、散布图做法:五、散布图做法:1、收集成对数据(、收集成对数据(x,y):):收集成对数据一般在收集成对数据一般在30组以上;组以上;2、确定坐标并标明刻度:、确定坐标并标明刻度:横坐标横坐标x轴为自变量(原因或因素),纵坐标轴为自变量(原因或因素),纵坐标y轴为因变量(结果或特性)轴为因变量(结果或特性),且两轴的长度大体相等。,且两轴的长度大体相等。3、描点,形成散布图:、描点,形成散布图:当两组数据相等时,即数据点重合时,可围绕数据点画同心圆表当两组数据相等时,即数据点重合时,可围绕数据点画同心圆表 示,或在离第一示,或在离第一个点最近出画上第二个点
4、表示;个点最近出画上第二个点表示;4、图形分析:、图形分析:根据点子云的形状,确定相关关系的性质和程度。根据点子云的形状,确定相关关系的性质和程度。对散布图的分析判断方法有:对散布图的分析判断方法有:对照典型图形分析法:对照典型图形分析法:将绘制的散布图与将绘制的散布图与6种典型图相对比,从而确定其相关关系和程度种典型图相对比,从而确定其相关关系和程度。现在学习的是第14页,共49页 简单象限法:简单象限法:l 在图上画一条与在图上画一条与y轴平行的轴平行的P线,使线,使P线左、右两侧的点数相等或大致相等;线左、右两侧的点数相等或大致相等;l 在图上再画一条与在图上再画一条与x轴平行的轴平行的
5、Q线,使线,使Q线上、下两侧的点数相等或大致相等线上、下两侧的点数相等或大致相等;l PQ两线把图形分成四个象限,计算各象限区域内的点数,线上的不计两线把图形分成四个象限,计算各象限区域内的点数,线上的不计l 计算对角象限内的点数,即计算对角象限内的点数,即 n+n,n+n 当当n+nn+n时,为正相关时,为正相关;当当n+nn+n时,为负相关;时,为负相关;当当n+nn+n时,为不相关;时,为不相关;YPQXnnnn现在学习的是第15页,共49页六、注意事项:六、注意事项:l 数据的性质要相同,否则会导致不真实的判断结果;数据的性质要相同,否则会导致不真实的判断结果;l 散布图的相关规律的运
6、用范围一般局限于观测值数据的范围内,不能任意散布图的相关规律的运用范围一般局限于观测值数据的范围内,不能任意扩大相关推断范围;扩大相关推断范围;l 散布图中出现的个别偏离分布趋势的异常点,应当查明原因予以剔除;散布图中出现的个别偏离分布趋势的异常点,应当查明原因予以剔除;现在学习的是第16页,共49页实例解析:实例解析:某酒厂要判定中间产品酒中的酸度喝酒度某酒厂要判定中间产品酒中的酸度喝酒度2 2个变量之间有无关系,存在个变量之间有无关系,存在什么关系?(搜集到的数据如下表)什么关系?(搜集到的数据如下表)序号序号酸度酸度 x酒度酒度 y序号序号酸度酸度 x酒度酒度 y10.56.3160.7
7、6.020.95.8170.96.131.24.8181.25.341.04.6190.85.950.95.4201.24.760.75.8211.63.871.43.8221.53.480.95.7231.43.891.34.3240.95.01010.5.3250.66.3111.54.4260.76.4120.76.6270.66.8131.34.6280.56.4141.04.8290.56.7151.24.1301.24.8现在学习的是第17页,共49页解析:解析:1、确定坐标:、确定坐标:横坐标横坐标x轴为酸度,纵坐标轴为酸度,纵坐标y轴为酒度轴为酒度2、描点,形成散布图:、描点,
8、形成散布图:3、图形分析:、图形分析:可以认为酸度和酒度之间存在着弱负相关关系可以认为酸度和酒度之间存在着弱负相关关系现在学习的是第18页,共49页相关系数通过相关散布图的形状,我们大概可以判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数。总体相关系数用(读“柔”)表示,样本相关系数用r表示。现在学习的是第19页,共49页附加说明:(1)两变量间存在相关,仅意味着变量间有关联,并不一定是因果关系。(2)相关系数不是等距的测量单位。r是一个比值,不是由相等单位度量而来,不能进
9、行加、减、乘、除运算。如r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。(3)相关系数受变量取值区间大小及观测值个数的影响较大。现在学习的是第20页,共49页变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不相关的两列变量,计算的结果可能相关,如学生的身高与学习成绩。本书所举例题,数据较少,仅为说明计算方法时较方便。(4)相关系数在特定情况下使用才具有意义。如高中生身高与体重的相关系数用在儿童身上就没有意义。现在学习的是第21页,共49页(5)通过实际观测值计算的相关系数,须经过显著性检验确定其是否有意义。
10、|r|的取值范围|r|的意义0.00-0.19极低相关0.20-0.39低度相关0.40-0.69中度相关0.70-0.89高度相关0.90-1.00极高相关表5-0|r|的取值与相关程度现在学习的是第22页,共49页*如何判断两个变量的相关性(1)找出两个变量的正确相应数据。(2)画出它们的散布图(散点图)。(3)通过散布图判断它们的相关性。(4)给出相关(r)的解答。(5)对结果进行评价和检验。现在学习的是第23页,共49页二、积差相关系数一、概念及适用条件(一)概念积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为yxNxyr(5.1)。Y;Xyx的标准差为的标准差为即变量的离差为即
11、变量的离差为式中;Y-Yy,Yy;X-Xx,Xx:现在学习的是第24页,共49页(二)适用条件1、两变量均应由测量得到的连续变量。2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。3、变量必须是成对的数据。4、两变量间为线性关系。现在学习的是第25页,共49页二、计算方法(一)基本公式计算法步骤:r。xyxy、Y、Xyx求得将上述数据代入公式计算计算计算,1.54;3;2;1现在学习的是第26页,共49页学生序号X(政治)Y(语文)xyxy17482-1.6-1.72.7227175-4.6-8.740.02380814.4-2.7-11.88485899.45.349.8257
12、6820.4-1.7-0.68677891.45.37.42777881.44.36.0286884-7.60.3-2.2897480-1.6-3.75.92107487-1.63.3-5.2875.683.74.4542114.3370591.8 例1 某学校为调查学生学习各科目之间的能力迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度。X现在学习的是第27页,共49页解:依表5-1的资料,计算结果为475.0337.4454.41080.91yxNxyr 即 10名学生的政治与语文成绩的相关程度为0.475。现在学习的是第28页,共49页 Excel 演示 例10-
13、1现在学习的是第29页,共49页三、等级相关 定义:等级相关是根据等级资料来研究变量间相互关系的方法。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。现在学习的是第30页,共49页(一)斯皮尔曼等级相关1、概念及适用条件(1)概念:斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”。两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为等级相关(斯皮尔曼相关)现在学习的是第31页,共49页(2)适用条件 两变量的资料为等级测量数据,且具有线性关系。连续变量的测量
14、数据,按其大小排成等级,亦可用等级相关计算。不要求总体呈正态分布。2、计算方法)1(6122NNDrR式中:D为两变量每对数据的等级之差;N表示样本容量。(5.4)现在学习的是第32页,共49页计算步骤:(1)计算两变量等级之差D;(2)计算D2;(3)计算 D2;(4)代入公式(5.4),求得rR 现在学习的是第33页,共49页序号X(语文等级)Y(阅读等级)DD218800267-11354114321152111645-11776118910-11913-24101091112表5-3 10名学生的语文成绩与阅读能力成绩相关计算表现在学习的是第34页,共49页解:将有关数据代入公式(5.
15、4)得927.01100101261)1(6122NNDrR 如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为1等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。现在学习的是第35页,共49页 例4 某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见表5-4,求其相关系数。序号X(能力)等级Y(成绩)等级DD21903.5884-0.50.25285780611370108064164857798-115903.5952.51168097010-117857759-248100198100987580
16、6-1110922922.5-0.50.2525.5表表5-4 10名学生的自学能力和学科成绩相关计算表名学生的自学能力和学科成绩相关计算表现在学习的是第36页,共49页解:85.01100105.2561)1(6122NNDrR即学生的自学能力与学习成绩的相关程度为0.85。现在学习的是第37页,共49页 教材例10-3excel 演示现在学习的是第38页,共49页 肯德尔相关系数:度量两个顺序变量X与Y之间的关系,2)1(nnNNatauDSYXDSTnnTnnNNbtau2)1(2)1()1()(22mnNNmctauDS现在学习的是第39页,共49页 NS:同序对的数目 ND:异序对的
17、数目 TX:X中同分对的数目 TY:Y中同分对的数目 n:样本容量 m:X与Y 等级数较小者 Tau-a:没有同分对时采用,表示同序对的数目与异序对的额数目差在全部可能对数中所占的比例。Tau-b:有同分队,X与Y 的等级数相同,Tau-c:有同分队,X与Y 的等级数不同现在学习的是第40页,共49页同序对、异序对、同分对 1 1、同序对、同序对(same ordered pair)(same ordered pair)设个案设个案A在变量在变量x和和y具有等级具有等级(xi,yi),个案,个案B 在变量在变量x和和y具有等级具有等级(xj,yj),如果,如果xixj,yiyj,则称则称A和和
18、B为同序对,记作为同序对,记作Ns 2 2、异序对、异序对(different ordered pair)(different ordered pair)设设A(xi,yi)和和B(xj,yj),如果,如果xixj,yiyj,则,则 称称A和和B为异序对,记作为异序对,记作Nd现在学习的是第41页,共49页 3.3.同分对同分对(tied pair)(tied pair)X同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi=xj,yiyj,则称,则称A和和B为为x同分对,记作同分对,记作Tx Y同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi xj
19、,yi=yj,则称,则称A和和B为为y同分对,记作同分对,记作Ty X、Y同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi=xj,yi=yj,则称,则称A和和B为为xy同分对,记作同分对,记作Txy现在学习的是第42页,共49页试就以下数据,列举其中的试就以下数据,列举其中的同序对、异序对和同分对同序对、异序对和同分对casex yABCDE 23 13 11 12 3现在学习的是第43页,共49页44肯德尔和谐系数常以肯德尔和谐系数常以W表示,适用于表示,适用于多列多列等级变量的资料。可以反映等级变量的资料。可以反映多个等级变量变化的一致性多个等级变量变化的一致性。(
20、1)同一评价者无相同等级评定时,W的计算公式:N被评的对象数;K评分者人数或评分所依据的标准数;S每个被评对象所评等级之和Ri与所有这些和的平均数的离差平方和,即 肯德尔和谐系数肯德尔和谐系数现在学习的是第44页,共49页45(2)同一评价者有相同等级评定时,W的计算公式:式中K、N、S的意义同(1)式,这里mi为第i个评价者的评定结果中有重复等级的个数,nij为第i个评价者的评定结果中第j个重复等级的相同等级数。对于评定结果无相同等级的评价者,Ti=0,因此只须对评定结果有相同等级的评价者计算Ti。现在学习的是第45页,共49页某校开展学生小论文比赛,请6位教师对入选的6篇论文评定得奖等级,
21、结果如下表所示,试计算6位教师评定结果的kandall和谐系数 论文编号评等评分老师一二三四五六A312546B213456C321546D412635E312645F421536Ri19811312334361641219615291156现在学习的是第46页,共49页 由于每个评分老师对6篇论文的评定都无相同的等级,故用公式(1),由表中数据得:现在学习的是第47页,共49页肯德尔和谐系数的显著性检验肯德尔和谐系数的显著性检验 1、当评分者人数(k)在3-20之间,被评者(N)在3-7之间时,可查肯德尔和谐系数(W)显著性临界值表,检验W是否达到显著性水平。若实际计算的S值大于k、N相同的表内临界值,则W达到显著水平。2、当被评者n7时,则可用如下的x2统计量对W是否达到显著水平作检验。设H0:评价者意见不一致W=0 现在学习的是第48页,共49页9/6/2022感谢大家观看感谢大家观看现在学习的是第49页,共49页
限制150内