第7章SPSS相关分析课件.ppt
《第7章SPSS相关分析课件.ppt》由会员分享,可在线阅读,更多相关《第7章SPSS相关分析课件.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7章SPSS相关分析第1页,此课件共53页哦7.1.1 相关的基本概念7.1.1.1 函数关系和相关关系 函数关系是指事物或现象之间存在着严格的依存关系,其主要特征是它的确定性,即对一个变量的每一个值,另一个变量都具有惟一确定的值与之相对应。变量之间的函数关系通常可以用函数式Y=f(x)确切地表示出来。例如,圆的周长C对于半径r的依存关系就是函数关系:C=2r。相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额与经济发展水平的关系、社会环境与人民健康的关系等等,都反映出客观现象中存在的相关关系。7.1
2、相关分析概述第2页,此课件共53页哦7.1.1.2相关关系的类型(1)根据相关程度的不同,相关关系可分为完全相关、不完全相关和无相关。(2)根据变量值变动方向的趋势,相关关系可分为正相关和负相关。(3)根据变量关系的形态,相关关系可分为直线相关和曲线相关。(4)根据研究变量的多少,可分为单相关、复相关。7.1 相关分析概述第3页,此课件共53页哦7.1.2.1相关分析的作用(1)判断变量之间有无联系(2)确定选择相关关系的表现形式及相关分析方法(3)把握相关关系的方向与密切程度(4)相关分析不但可以描述变量之间的关系状况,而且用来进行预测。(5)相关分析还可以用来评价测量量具的信度、效度以及项
3、目的区分度等。7.1.2 相关分析第4页,此课件共53页哦 相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母表示。相关系数的数值范围是介于1与+1之间(即1 r 1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量相关程度越低。如果其绝对值等于零1,则表示两个变量完全直线相关。如果其绝对值为零,则表示两个变量完全不相
4、关(不是直线相关)。7.1.2.2相关系数7.1.2 相关分析第5页,此课件共53页哦 变量相关的方向通过相关系数r所具有的符号来表示,“+”号表示正相关,即0r1。“”表示负相关,即0 r 1。在使用相关系数时应该注意下面的几个问题:(1)相关系数只是一个比率值,并不具备与相关变量相同的测量单位。(2)相关系数r 受变量取值区间大小及样本数目多少的影响比较大。(3)来自于不同群体且不同质的事物的相关系数不能进行比较。(4)对于不同类型的数据,计算相关系数的方法也不相同。7.1.2.2相关系数7.1.2 相关分析第6页,此课件共53页哦 简单相关分析是研究两个变量之间关联程度的统计方法。它主要
5、是通过计算简单相关系数来反映变量之间关系的强弱。一般它有图形和数值两种表示方式。1、相关图 在统计中制作相关图,可以直观地判断事物现象之间大致上呈现何种关系的形式。相关图是相关分析的重要方法。利用直角坐标系第一象限,把第一个变量置于横轴上,第二个变量置于纵轴上,而将两个变量对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形,这就是相关图 7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第7页,此课件共53页哦2、相关系数 虽然相关图能够展现变量之间的数量关系,但这也只是种直观判断方法。因此,可以计算变量之间的相关系数。对不同类型的变量应当采取不同的相关系数来
6、度量,常用的相关系数主要有:皮尔逊(Pearson)相关系数 常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量间的线性相关关系。注意Pearson相关系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。它的计算公式为:利用相关系数r的大小可以判断变量间相关关系的密切程度,具体见表所示。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第8页,此课件共53页哦7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第9页,此课件共53页哦对皮尔逊简单相关系数的统计检验是计算t
7、统计量,具体公式是:t统计量服从n-2个自由度的t分布。SPSS会自动计算r统计量和t值,并依据t分布表给出其对应的相伴概率值。斯皮尔曼等级相关系数。斯皮尔曼等级相关系数用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:两个变量的变量值是以等级次序表示的资料。一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第10页,此课件共53页哦 从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出
8、优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。斯皮尔曼等级相关系数常用符号 来表示。其基本公式为:式中:D是两个变量每对数据等级之差,n是两列变量值的对数。斯皮尔曼相关系数计算公式可以完全套用皮尔逊相关系数的计算公式,但公式中的x和y用它们的秩次代替即可。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第11页,此课件共53页哦 肯德尔等级相关系数:它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致对数目。显然,如果两变量具有较强的正相关,则一致对数
9、目U应较大;但若两变量相关性较弱,则一致对数目U和非一致对数目V应大致相等。故按照此思想,可得其定义为:SPSS将自动计算它的相关系数、检验统计量和对应的概率P值。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第12页,此课件共53页哦7.2.2 简单相关分析的SPSS操作详解 Step01:打开主菜单 选择主菜单中的【分析】【相关】【双变量】命令,弹出【双变量相关】对话框,如图7-1所示,这是简单相关检验的主操作窗口。7.2 SPSS在简单相关分析中的应用第13页,此课件共53页哦7.2 SPSS在简单相关分析中的应用第14页,此课件共53页哦Step02:选择检验
10、变量 在【双变量相关】对话框左侧的候选变量中选择两个个或两个以上变量将其添加至【变量】列表框中,表示需要进行简单相关分析的变量。Step03:选择相关系数类型 图中的【相关系数】复选栏可以选择计算简单相关系数的类型。皮尔逊:系统默认项,即积差相关系数,计算连续变量或是等间距测度的变量间的相关分析。肯德尔:等级相关,计算分类变量间的秩相关。斯皮尔曼:等级相关,斯皮尔曼相关系数。对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用Pearson 相关分析;对于完全等级的离散变量必须使用等级相关分析相关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用
11、斯皮尔曼 或肯德尔相关。7.2 SPSS在简单相关分析中的应用第15页,此课件共53页哦 Step04:假设检验类型选择 在图中的【显著性检验】复选栏可以选择输出的假设检验类型,对应有两个单选项。双尾检验:系统默认项。双尾检验,当事先不知道相关方向(正相关还是负相关)时选择此项。单尾检验:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【标记显著性相关)】项。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。7.2 SPSS在简单相关分析中的应用第16页,此课件共53页哦St
12、ep05:其他选项选择 单击选项按钮,弹出如图7-2所示的【选项】对话框,该对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。统计量:选择输出统计量。均值和标准差:将输出选中的各变量的观测值数目、均值和标准差。叉积偏差和协方差:输出反映选中的每一对变量之间的叉积离差矩阵和协方差矩阵。缺失值:用于设置缺失值的处理方式。它有两种处理方式:按对排除个案:系统默认项。剔除当前分析的两个变量值是缺失的个案。按列表除个案:表示剔除所有含缺失值的个案后再进行分析。7.2 SPSS在简单相关分析中的应用第17页,此课件共53页哦7.2 SPSS在简单相关分析中的应用第18页,此课件共53页哦St
13、ep06:相关统计量的Bootstrap估计 单击【Bootstrap】按钮,弹出对话框,在此可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的bootstrap 估计。相关性表支持相关性的bootstrap 估计。选项具体功能请参看本书3-1节的相关部分说明。7.2 SPSS在简单相关分析中的应用第19页,此课件共53页哦Step07:单击确定按钮,结束操作,SPSS软件自动输出结果。7.2 SPSS在简单相关分析中的应用第20页,此课件共53页哦7.2.3 实例分析:股票指数之间的联系1 实例内容 道琼斯工业平均指数(DJIA)和标准普尔指数500(S&P 500)都
14、被用做股市全面动态的测度。DJIA是基于30种股票的价格动态;S&P 500是由500种股票组成的指数。有人说S&P 500是股票市场功能的一种更好的测度,因为它基于更多的股票。表7-2显示了DJIA和S&P 500在1997年10周内的收盘价。请计算它们之间的样本相关系数。不仅如此,样本相关系数告诉我们DJIA和S&P 500之间的关系是怎样的?7.2 SPSS在简单相关分析中的应用第21页,此课件共53页哦2 实例操作 表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时根据两个股票指数的散点图(图7-4)可见它们呈显著的线性相关,因此可以采用皮尔逊
15、相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的肯德尔和斯皮尔曼相关系数。7.2 SPSS在简单相关分析中的应用第22页,此课件共53页哦7.2 SPSS在简单相关分析中的应用第23页,此课件共53页哦3 实例结果及分析(1)描述性统计分析表执行完上面的操作后,首先给出的是当前样本进行描述性统计的结果表7-3。可以看到样本容量都等于10,道琼斯工业平均指数和标准普尔指数的平均均值分别为7743.60和945.10,两者差距显著。同时,两者的方差差距也很明显。均值均值标准差标准差NDJIA7743.60197.32610SP945.1019.947107.2 SPSS在简单相
16、关分析中的应用第24页,此课件共53页哦(2)皮尔逊相关系数表 接着SPSS列出了道琼斯工业平均指数和标准普尔指数的皮尔逊相关系数表7-4。可以看到,两种指数的皮尔逊系数值高达0.995,非常接近1;同时相伴概率P值明显小于显著性水平0.01,这也进一步说明两者高度正线性相关。DJIASPDJIAPearson 相关性10.995*Sig.(双侧)0.000N1010SPPearson 相关性0.995*1Sig.(双侧)0.000N10107.2 SPSS在简单相关分析中的应用第25页,此课件共53页哦(3)非参数相关系数表 表7-5列出了两种股票指数的肯德尔和斯皮尔曼相关系数,分别等于0.
17、994和0.985;同时它们的概率P值也远小于显著性水平。但本案例中,斯皮尔曼相关系数和肯德尔相关系数都小于皮尔逊相关系数,显然这是由于在秩变换或数据按有序分类处理时损失信息所导致的。所以,通过以上分析看到,道琼斯工业平均指数和标准普尔指数具有高度正相关性,一个指数的上涨或上跌时,另一个指数也会伴随着上涨或下跌。7.2 SPSS在简单相关分析中的应用第26页,此课件共53页哦表7-5 非参数相关系数表DJIASP相关系数1.0000.944*Kendalls tau_bDJIASig.(双侧)0.000N1010相关系数0.944*1.000SPSig.(双侧)0.000N1010相关系数1.
18、0000.985*Spearmans rhoDJIASig.(双侧)0.000N1010相关系数0.985*1.000SPSig.(双侧)0.000N10107.2 SPSS在简单相关分析中的应用第27页,此课件共53页哦7.3.1 偏相关分析的基本原理1、方法概述 简单相关分析计算两个变量之间的相互关系,分析两个变量间线性关系的程度。但是现实中,事物之间的联系可能存在于多个主体之间,因此往往因为第三个变量的作用使得相关系数不能真实地反映两个变量间的线性相关程度。例如身高、体重与肺活量之间的关系,如果使用皮尔逊相关计算其相关系数,可以得出肺活量、身高和体重均存在较强的线性相关性质。但实际上呢,
19、对体重相同的人而言,身高值越大其肺活量也不一定越大。因为身高与体重有着线性关系,肺活量与体重有着线性关系,因此得出了身高与肺活量之间存在较强的线性关系的错误结论。偏相关分析就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。7.3 SPSS在偏相关分析中的应用第28页,此课件共53页哦2、基本原理 偏相关分析是在相关分析的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。偏相关系数在计算时可以首先分别计算三个因素之间的相关系数,然后通过这三个简单相关系数来计算偏相关系数,公
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 相关 分析 课件
限制150内