管理相关分析精选课件.ppt
关于管理相关分析第一页,本课件共有49页一变量间的关系:函数关系1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量3.各观测点落在一条线上 x xy y第二页,本课件共有49页函数关系(几个例子)函数关系的例子函数关系的例子 某某种种商商品品的的销销售售额额(y)与与销销售售量量(x x)之之间间的的关关系系可可表表示为示为 y=pxpx (p 为单价为单价)圆的面积圆的面积(S)与半径之间的关系可表示为与半径之间的关系可表示为S=R2 企业的原材料消耗额(y y)与产量(x x1 1)、单单位位产产量量消消耗耗(x2)、原材料价格(x x3 3)之之间间的的关关系系可可表表示示为为y y=x x1 1 x x2 2 x x3 3 第三页,本课件共有49页变量间的关系:相关关系(correlation)1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围 x xy y第四页,本课件共有49页相关关系(几个例子)相关关系的例子相关关系的例子 父亲身高父亲身高(y y)与子女身高与子女身高(x)之间的关系之间的关系 收入水平收入水平(y)与受教育程度与受教育程度(x x)之间的关系之间的关系 不确定不确定 有统计规律有统计规律第五页,本课件共有49页绘制数据散布图计算相关系数第六页,本课件共有49页散布图散布图的定义散布图的定义:是一种研究成对出现的、两组相关数据之间关系的图示技术。在散布图种,成对的数据形成点子云,研究点子云的分布状态,便可推断成对数据之间的相关程度。当x值增加,y值也相应增加,就称x 与y之间是正相关;当x值增加,y值也相应减少,就称x 与y之间是负相关;第七页,本课件共有49页散布图分析:散布图分析:散布图的分析一来般来说有六种形态散布图的分析一来般来说有六种形态散布图的分析一来般来说有六种形态散布图的分析一来般来说有六种形态散布图的分析一来般来说有六种形态散布图的分析一来般来说有六种形态.1 1 1 1 1 1、在图中当、在图中当、在图中当、在图中当、在图中当、在图中当X X X X X X增加增加增加增加增加增加,Y,Y,Y,Y,Y,Y也增加也增加也增加也增加也增加也增加,也就是表示原因与结果有相也就是表示原因与结果有相也就是表示原因与结果有相也就是表示原因与结果有相也就是表示原因与结果有相也就是表示原因与结果有相对的正相关对的正相关对的正相关对的正相关对的正相关对的正相关,如下图所示如下图所示如下图所示如下图所示如下图所示如下图所示:X X X XY Y Y Y0 0 0 0第八页,本课件共有49页2 2 2 2 2 2、散布图点的分布较广但是有向上的倾向、散布图点的分布较广但是有向上的倾向、散布图点的分布较广但是有向上的倾向、散布图点的分布较广但是有向上的倾向、散布图点的分布较广但是有向上的倾向、散布图点的分布较广但是有向上的倾向,这种形态叫做似这种形态叫做似这种形态叫做似这种形态叫做似这种形态叫做似这种形态叫做似有正相关称为弱正相关有正相关称为弱正相关有正相关称为弱正相关有正相关称为弱正相关有正相关称为弱正相关有正相关称为弱正相关X X X XY Y Y Y0 0 0 0第九页,本课件共有49页3 3 3 3 3 3、当、当、当、当、当、当X X X X X X增加增加增加增加增加增加,Y,Y,Y,Y,Y,Y反而减少反而减少反而减少反而减少反而减少反而减少,而且形态呈现一直线发展的现象而且形态呈现一直线发展的现象而且形态呈现一直线发展的现象而且形态呈现一直线发展的现象而且形态呈现一直线发展的现象而且形态呈现一直线发展的现象,这叫做完全负相关这叫做完全负相关这叫做完全负相关这叫做完全负相关这叫做完全负相关这叫做完全负相关.如下图所示如下图所示如下图所示如下图所示如下图所示如下图所示:Y Y Y Y0 0 0 0X X X X第十页,本课件共有49页4 4 4 4 4 4、当、当、当、当、当、当X X X X X X增加增加增加增加增加增加,Y,Y,Y,Y,Y,Y减少的幅度不是很明显减少的幅度不是很明显减少的幅度不是很明显减少的幅度不是很明显减少的幅度不是很明显减少的幅度不是很明显,这时的这时的这时的这时的这时的这时的X X X X X X 除了受除了受除了受除了受除了受除了受Y Y Y Y Y Y的影响外的影响外的影响外的影响外的影响外的影响外,尚有其他因素影响尚有其他因素影响尚有其他因素影响尚有其他因素影响尚有其他因素影响尚有其他因素影响X,X,X,X,X,X,这种形态叫作非显着性负相关这种形态叫作非显着性负相关这种形态叫作非显着性负相关这种形态叫作非显着性负相关这种形态叫作非显着性负相关这种形态叫作非显着性负相关,如下图所示如下图所示如下图所示如下图所示如下图所示如下图所示:Y Y Y Y0 0 0 0X X X X第十一页,本课件共有49页5 5 5 5 5 5、如果散布点的分布呈现杂乱、如果散布点的分布呈现杂乱、如果散布点的分布呈现杂乱、如果散布点的分布呈现杂乱、如果散布点的分布呈现杂乱、如果散布点的分布呈现杂乱,没有任何倾向时没有任何倾向时没有任何倾向时没有任何倾向时没有任何倾向时没有任何倾向时,称为无相关称为无相关称为无相关称为无相关称为无相关称为无相关,也也也也也也就是说就是说就是说就是说就是说就是说X X X X X X与与与与与与Y Y Y Y Y Y之间没有任何的关系之间没有任何的关系之间没有任何的关系之间没有任何的关系之间没有任何的关系之间没有任何的关系,这时应再一次先将资料层这时应再一次先将资料层这时应再一次先将资料层这时应再一次先将资料层这时应再一次先将资料层这时应再一次先将资料层别化之后再分析别化之后再分析别化之后再分析别化之后再分析别化之后再分析别化之后再分析,如下图所示如下图所示如下图所示如下图所示如下图所示如下图所示:Y Y Y Y0 0 0 0X X X X第十二页,本课件共有49页6 6 6 6 6 6、假设、假设、假设、假设、假设、假设X X X X X X增大增大增大增大增大增大,Y,Y,Y,Y,Y,Y也随之增大也随之增大也随之增大也随之增大也随之增大也随之增大,但是但是但是但是但是但是X X X X X X增大到某一值之后增大到某一值之后增大到某一值之后增大到某一值之后增大到某一值之后增大到某一值之后,Y,Y,Y,Y,Y,Y反而开反而开反而开反而开反而开反而开始减少始减少始减少始减少始减少始减少,因此产生散布图点的分布有曲线倾向的形态因此产生散布图点的分布有曲线倾向的形态因此产生散布图点的分布有曲线倾向的形态因此产生散布图点的分布有曲线倾向的形态因此产生散布图点的分布有曲线倾向的形态因此产生散布图点的分布有曲线倾向的形态,称为曲称为曲称为曲称为曲称为曲称为曲线相关线相关线相关线相关线相关线相关,如下图所示如下图所示如下图所示如下图所示如下图所示如下图所示:Y Y Y Y 0 0 0 0X X X X第十三页,本课件共有49页五、散布图做法:五、散布图做法:1、收集成对数据(、收集成对数据(x,y):):收集成对数据一般在收集成对数据一般在30组以上;组以上;2、确定坐标并标明刻度:、确定坐标并标明刻度:横坐标横坐标x轴为自变量(原因或因素),纵坐标轴为自变量(原因或因素),纵坐标y轴为因变量(结果或特性),且轴为因变量(结果或特性),且两轴的长度大体相等。两轴的长度大体相等。3、描点,形成散布图:、描点,形成散布图:当两组数据相等时,即数据点重合时,可围绕数据点画同心圆表当两组数据相等时,即数据点重合时,可围绕数据点画同心圆表 示,或在离第一个示,或在离第一个点最近出画上第二个点表示;点最近出画上第二个点表示;4、图形分析:、图形分析:根据点子云的形状,确定相关关系的性质和程度。根据点子云的形状,确定相关关系的性质和程度。对散布图的分析判断方法有:对散布图的分析判断方法有:对照典型图形分析法:对照典型图形分析法:将绘制的散布图与将绘制的散布图与6种典型图相对比,从而确定其相关关系和程度种典型图相对比,从而确定其相关关系和程度。第十四页,本课件共有49页 简单象限法:简单象限法:l 在图上画一条与在图上画一条与y轴平行的轴平行的P线,使线,使P线左、右两侧的点数相等或大致相等;线左、右两侧的点数相等或大致相等;l 在图上再画一条与在图上再画一条与x轴平行的轴平行的Q线,使线,使Q线上、下两侧的点数相等或大致线上、下两侧的点数相等或大致相等;相等;lPQ两线把图形分成四个象限,计算各象限区域内的点数,线上的不计两线把图形分成四个象限,计算各象限区域内的点数,线上的不计l计算对角象限内的点数,即计算对角象限内的点数,即 n+n,n+n当当n+n n+n时,为正相关时,为正相关;当当n+n n+n时,为负相关;时,为负相关;当当n+nn+n时,为不相关;时,为不相关;YPQXnnnn第十五页,本课件共有49页六、注意事项:六、注意事项:l数据的性质要相同,否则会导致不真实的判断结果;数据的性质要相同,否则会导致不真实的判断结果;l散布图的相关规律的运用范围一般局限于观测值数据的范围内,不能散布图的相关规律的运用范围一般局限于观测值数据的范围内,不能任意扩大相关推断范围;任意扩大相关推断范围;l散布图中出现的个别偏离分布趋势的异常点,应当查明原因予散布图中出现的个别偏离分布趋势的异常点,应当查明原因予以剔除;以剔除;第十六页,本课件共有49页实例解析:实例解析:某酒厂要判定中间产品酒中的酸度喝酒度某酒厂要判定中间产品酒中的酸度喝酒度2 2个变量之间有无关系,存在个变量之间有无关系,存在什么关系?(搜集到的数据如下表)什么关系?(搜集到的数据如下表)序号序号酸度酸度 x酒度酒度 y序号序号酸度酸度 x酒度酒度 y10.56.3160.76.020.95.8170.96.131.24.8181.25.341.04.6190.85.950.95.4201.24.760.75.8211.63.871.43.8221.53.480.95.7231.43.891.34.3240.95.01010.5.3250.66.3111.54.4260.76.4120.76.6270.66.8131.34.6280.56.4141.04.8290.56.7151.24.1301.24.8第十七页,本课件共有49页解析:解析:1、确定坐标:、确定坐标:横坐标横坐标x轴为酸度,纵坐标轴为酸度,纵坐标y轴为酒度轴为酒度2、描点,形成散布图:、描点,形成散布图:Y Y Y Y0 0 0 0X X X X酒度酒度酒度酒度酒度酒度酸度酸度酸度酸度酸度酸度nnnn3、图形分析:、图形分析:可以认为酸度和酒度之间存在着弱负相关关系可以认为酸度和酒度之间存在着弱负相关关系第十八页,本课件共有49页相关系数通过相关散布图的形状,我们大概可以判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数。总体相关系数用(读“柔”)表示,样本相关系数用r表示。第十九页,本课件共有49页附加说明:(1)两变量间存在相关,仅意味着变量间有关联,并不一定是因果关系。(2)相关系数不是等距的测量单位。r是一个比值,不是由相等单位度量而来,不能进行加、减、乘、除运算。如r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。(3)相关系数受变量取值区间大小及观测值个数的影响较大。第二十页,本课件共有49页变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不相关的两列变量,计算的结果可能相关,如学生的身高与学习成绩。本书所举例题,数据较少,仅为说明计算方法时较方便。(4)相关系数在特定情况下使用才具有意义。如高中生身高与体重的相关系数用在儿童身上就没有意义。第二十一页,本课件共有49页(5)通过实际观测值计算的相关系数,须经过显著性检验确定其是否有意义。|r|的取值范围|r|的意义0.00-0.19极低相关0.20-0.39低度相关0.40-0.69中度相关0.70-0.89高度相关0.90-1.00极高相关表5-0|r|的取值与相关程度第二十二页,本课件共有49页*如何判断两个变量的相关性(1)找出两个变量的正确相应数据。(2)画出它们的散布图(散点图)。(3)通过散布图判断它们的相关性。(4)给出相关(r)的解答。(5)对结果进行评价和检验。第二十三页,本课件共有49页二、积差相关系数一、概念及适用条件(一)概念积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为(5.1)第二十四页,本课件共有49页(二)适用条件1、两变量均应由测量得到的连续变量。2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。3、变量必须是成对的数据。4、两变量间为线性关系。第二十五页,本课件共有49页二、计算方法(一)基本公式计算法步骤:第二十六页,本课件共有49页学生序号X(政治)Y(语文)xyxy17482-1.6-1.72.7227175-4.6-8.740.02380814.4-2.7-11.88485899.45.349.82576820.4-1.7-0.68677891.45.37.42777881.44.36.0286884-7.60.3-2.2897480-1.6-3.75.92107487-1.63.3-5.2875.683.74.4542114.3370591.8 例1 某学校为调查学生学习各科目之间的能力迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度。第二十七页,本课件共有49页解:依表5-1的资料,计算结果为 即 10名学生的政治与语文成绩的相关程度为0.475。第二十八页,本课件共有49页Excel 演示 例10-1第二十九页,本课件共有49页三、等级相关定义:等级相关是根据等级资料来研究变量间相互关系的方法。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。第三十页,本课件共有49页(一)斯皮尔曼等级相关1、概念及适用条件(1)概念:斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”。两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为等级相关(斯皮尔曼相关)第三十一页,本课件共有49页(2)适用条件 两变量的资料为等级测量数据,且具有线性关系。连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。不要求总体呈正态分布。2、计算方法式中:D为两变量每对数据的等级之差;N表示样本容量。(5.4)第三十二页,本课件共有49页计算步骤:(1)计算两变量等级之差D;(2)计算D2;(3)计算 D2;(4)代入公式(5.4),求得rR 第三十三页,本课件共有49页序号X(语文等级)Y(阅读等级)DD218800267-11354114321152111645-11776118910-11913-24101091112表5-3 10名学生的语文成绩与阅读能力成绩相关计算表第三十四页,本课件共有49页解:将有关数据代入公式(5.4)得 如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为1等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。第三十五页,本课件共有49页 例4 某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见表5-4,求其相关系数。序号X(能力)等级Y(成绩)等级DD21903.5884-0.50.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-0.50.2525.5表表5-4 10名学生的自学能力和学科成绩相关计算表名学生的自学能力和学科成绩相关计算表第三十六页,本课件共有49页解:即学生的自学能力与学习成绩的相关程度为0.85。第三十七页,本课件共有49页教材例10-3excel 演示第三十八页,本课件共有49页肯德尔相关系数:度量两个顺序变量X与Y之间的关系,第三十九页,本课件共有49页NS:同序对的数目 ND:异序对的数目TX:X中同分对的数目 TY:Y中同分对的数目n:样本容量 m:X与Y 等级数较小者Tau-a:没有同分对时采用,表示同序对的数目与异序对的额数目差在全部可能对数中所占的比例。Tau-b:有同分队,X与Y 的等级数相同,Tau-c:有同分队,X与Y 的等级数不同第四十页,本课件共有49页同序对、异序对、同分对1 1、同序对、同序对(same ordered pair)(same ordered pair)设个案设个案A在变量在变量x和和y具有等级具有等级(xi,yi),个案,个案B在变量在变量x和和y具有等级具有等级(xj,yj),如果,如果xixj,yiyj,则称则称A和和B为同序对,记作为同序对,记作Ns2 2、异序对、异序对(different ordered pair)(different ordered pair)设设A(xi,yi)和和B(xj,yj),如果,如果xixj,yiyj,则,则称称A和和B为异序对,记作为异序对,记作Nd第四十一页,本课件共有49页3.3.同分对同分对(tied pair)(tied pair)X同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi=xj,yiyj,则称,则称A和和B为为x同分对,记作同分对,记作TxY同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi xj,yi=yj,则称,则称A和和B为为y同分对,记作同分对,记作TyX、Y同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi=xj,yi=yj,则称,则称A和和B为为xy同分对,记作同分对,记作Txy第四十二页,本课件共有49页试就以下数据,列举其中的试就以下数据,列举其中的同序对、异序对和同分对同序对、异序对和同分对casex yABCDE3 243 153 161 172 3第四十三页,本课件共有49页44肯德尔和谐系数常以肯德尔和谐系数常以W表示,适用于表示,适用于多列多列等级变量的资料。可等级变量的资料。可以反映多个等级变量变化的一致性以反映多个等级变量变化的一致性。(1)同一评价者无相同等级评定时,W的计算公式:N被评的对象数;K评分者人数或评分所依据的标准数;S每个被评对象所评等级之和Ri与所有这些和的平均数的离差平方和,即 肯德尔和谐系数肯德尔和谐系数第四十四页,本课件共有49页45(2)同一评价者有相同等级评定时,W的计算公式:式中K、N、S的意义同(1)式,这里mi为第i个评价者的评定结果中有重复等级的个数,nij为第i个评价者的评定结果中第j个重复等级的相同等级数。对于评定结果无相同等级的评价者,Ti=0,因此只须对评定结果有相同等级的评价者计算Ti。第四十五页,本课件共有49页某校开展学生小论文比赛,请6位教师对入选的6篇论文评定得奖等级,结果如下表所示,试计算6位教师评定结果的kandall和谐系数 论文编号评等评分老师一二三四五六A312546B213456C321546D412635E312645F421536Ri19811312334361641219615291156第四十六页,本课件共有49页由于每个评分老师对6篇论文的评定都无相同的等级,故用公式(1),由表中数据得:第四十七页,本课件共有49页肯德尔和谐系数的显著性检验肯德尔和谐系数的显著性检验 1、当评分者人数(k)在3-20之间,被评者(N)在3-7之间时,可查肯德尔和谐系数(W)显著性临界值表,检验W是否达到显著性水平。若实际计算的S值大于k、N相同的表内临界值,则W达到显著水平。2、当被评者n7时,则可用如下的x2统计量对W是否达到显著水平作检验。设H0:评价者意见不一致W=0 第四十八页,本课件共有49页09.12.2022感感谢谢大大家家观观看看第四十九页,本课件共有49页