【SPSS19教程】第7章SPSS的相关分析剖析优秀PPT.ppt
《【SPSS19教程】第7章SPSS的相关分析剖析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《【SPSS19教程】第7章SPSS的相关分析剖析优秀PPT.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第7 7章章SPSSSPSS的相的相关关分析分析7.1 7.1 相相关关分析分析概概述述7.1.1 相相关关的基本的基本概概念念1.函函数关数关系和相系和相关关关关系系 函函数关数关系是指事物或系是指事物或现现象之象之间间存在着存在着严严格的依存格的依存关关系,其主系,其主要特征是要特征是它它的确定性,即的确定性,即对对一一个个变变量的每一量的每一个个值值,另一,另一个个变变量量都具有惟一确定的都具有惟一确定的值值与与之相之相对应对应。变变量之量之间间的函的函数关数关系通常可系通常可以用函以用函数数式式Y=f(x)精确地表示出精确地表示出来来。例如,。例如,圆圆的周的周长长C对对于半于半径径
2、r的依存的依存关关系就是函系就是函数关数关系:系:C=2r。相相关关关关系反映出系反映出变变量之量之间虽间虽然相互影然相互影响响,具有依存,具有依存关关系,但系,但彼此之彼此之间间是不能一一是不能一一对应对应的。例如,的。例如,学学生成果生成果与与其智力因素、其智力因素、各科各科学学习习成果之成果之间间的的关关系、系、教教化投化投资额资额与与经济发经济发展水平的展水平的关关系、系、社社会会环环境境与与人民健康的人民健康的关关系等等,都反映出客系等等,都反映出客观现观现象中存在的象中存在的相相关关关关系。系。7.1 7.1 相相关关分析分析概概述述2.相相关关关关系的系的类类型型(1)依据相)依
3、据相关关程度的不同,相程度的不同,相关关关关系可分系可分为为完全相完全相关关、不、不完全相完全相关关和无相和无相关关。(2)依据)依据变变量量值变动值变动方向的方向的趋势趋势,相,相关关关关系可分系可分为为正相正相关关和和负负相相关关。(3)依据)依据变变量量关关系的形系的形态态,相,相关关关关系可分系可分为为直直线线相相关关和曲和曲线线相相关关。(4)依据探)依据探讨变讨变量的多少,可分量的多少,可分为单为单相相关关、复复相相关关。7.1.2 7.1.2 相相关关分析分析1.相相关关分析的作用分析的作用(1)推)推断断变变量之量之间间有无有无联联系系(2)确定)确定选择选择相相关关关关系的表
4、系的表现现形式及相形式及相关关分析方法分析方法(3)把握相)把握相关关关关系的方向系的方向与与亲亲密程度密程度(4)相)相关关分析不但可以描述分析不但可以描述变变量之量之间间的的关关系系状况状况,而且用,而且用来来进进行行预预料。料。(5)相相关关分析分析还还可以用可以用来来评评价价测测量量具的信度、效度以及量量具的信度、效度以及项项目目的的区区分度等。分度等。7.1.2 7.1.2 相相关关分析分析 相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母表示。相关系数的数值范围
5、是介于1与+1之间(即1 r 1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。两个变量之间的相关程度用相关系数r的确定值表示,其确定值越接近1,表明两个变量的相关程度越高;其确定值越接近于0,表明两个变量相关程度越低。假如其确定值等于零1,则表示两个变量完全直线相关。假如其确定值为零,则表示两个变量完全不相关(不是直线相关)。2.相相关关系系数数7.1.2 7.1.2 相相关关分析分析 变量相关的方向通过相关系数r所具有的符号来表示,“+”号表示正相关,即0r1。“”表示负相关,即0 r 1。在运用相关系数时应当留意下面的几个问题。(1)相关系数只是一个比
6、率值,并不具备与相关变量相同的测量单位。(2)相关系数r 受变量取值区间大小及样本数目多少的影响比较大。(3)来自于不同群体且不同质的事物的相关系数不能进行比较。(4)对于不同类型的数据,计算相关系数的方法也不相同。3.相相关关系系数数7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用 简洁相关分析是探讨两个变量之间关联程度的统计方法。它主要是通过计算简洁相关系数来反映变量之间关系的强弱。一般它有图形和数值两种表示方式。1、相关图 在统计中制作相关图,可以直观地推断事物现象之间大致上呈现何种关系的形式。相关图是相关分析的重要方法。利用直角坐标系第一象限,把第一个变量置
7、于横轴上,其次个变量置于纵轴上,而将两个变量对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形,这就是相关图 7.2.1 简洁简洁相相关关分析的基本原理分析的基本原理7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用2 2、相关系数、相关系数 虽然相关图能够呈现变量之间的数量关系,但这也只是种直观推虽然相关图能够呈现变量之间的数量关系,但这也只是种直观推断方法。因此,可以计算变量之间的相关系数。对不同类型的变量断方法。因此,可以计算变量之间的相关系数。对不同类型的变量应当实行不同的相关系数来度量,常用的相关系数主要有:应当实行不同的相关系数来度量,常用的相
8、关系数主要有:皮尔逊(皮尔逊(PearsonPearson)相关系数)相关系数 常称为积差相关系数,适用于探讨连续变量之间的相关程度。例常称为积差相关系数,适用于探讨连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量间的线性相关关系。留意如,收入和储蓄存款、身高和体重等变量间的线性相关关系。留意PearsonPearson相关系数适用于线性相关的情形,对于曲线相关等更为困相关系数适用于线性相关的情形,对于曲线相关等更为困难的情形,系数的大小并不能代表其相关性的强弱。它的计算公式难的情形,系数的大小并不能代表其相关性的强弱。它的计算公式为:为:利用相关系数利用相关系数r r的大小可以
9、推断变量间相关关系的亲密程度,具体的大小可以推断变量间相关关系的亲密程度,具体见表所示。见表所示。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.2.1 7.2.1 简洁简洁相相关关分析的基本原理分析的基本原理7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用对Pearson简洁相关系数的统计检验是计算t统计量,t统计量听从n-2个自由度的t分布。SPSS会自动计算r统计量和t值,并依据t分布表给出其对应的相伴概率值。Spearman等级相关系数用来度量依次水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:两
10、个变量的变量值是以等级次序表示的资料;一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不确定大于30。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用 从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。斯皮尔曼等级相关系数常用符号 来表示。其基本公式为:式中:D是两个变量每对数据等级之差,n是两列变量值的对数。Spearman相关系数计算公式可以完全套用Pearson相关系数的计算公式,但公式中的x和y用它们的秩次代
11、替即可。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用 Kendalls等级相关系数 它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的状况。这种指标接受非参数检验方法测度变量间的相关关系。它利用变量的秩计算一样对数目和非一样对数目。明显,假如两变量具有较强的正相关,则一样对数目U应较大;但若两变量相关性较弱,则一样对数目U和非一样对数目V应大致相等。故依据此思想,可得其定义为:SPSS将自动计算它的相关系数、检验统计量和对应的概率P值。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.2.2 7.2.2 简洁简洁相相关关
12、分析的分析的SPSSSPSS操作操作详详解解Step01Step01:打:打开开主菜主菜单单 选选择择菜菜单单栏栏中中的的【Analyze(Analyze(分分析析)】【Correlate(Correlate(相相关关)】【Bivariate(Bivariate(双双变变量量)】叮叮嘱嘱,弹弹出出【Bivariate Bivariate Correlations(Correlations(双双变变量量相相关关)】对对话话框框,如如图图7-17-1所所示示,这这是是简简洁洁相相关关检检验验的的主主操操作作窗口。窗口。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.
13、2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用 Step02:选择检验变量 在【Bivariate Correlations(双变量相关)】对话框左侧的候选变量列表框中选择两个个或两个以上变量将其添加至【Variables(变量)】列表框中,表示须要进行简洁相关分析的变量。Step03:选择相关系数类型 图中的【Correlation Coefficients(相关系数)】选项组中可以选择计算简洁相关系数的类型。Pearson:系统默认项,即积差相关系数,计算连续变量或是等间距测度的变量间的相关分析。Kendall:等级相关,计算分类变量间的秩相关。Spearman:
14、等级相关,斯皮尔曼相关系数。对于非等间距测度的连续变量,因为分布不明可以运用等级相关分析,也可以运用Pearson 相关分析;对于完全等级的离散变量必需运用等级相关分析相关性。当资料不听从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用Spearman 或Kendall相关。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用 Step04:假设检验类型选择 在图中的【Test of Significance(显著性检验)】选项组中可以选择输出的假设检验类型,对应有两个单选项。Two tailed:系统默认项。双尾检验,当事先不知道相关方向(正相关还是负相
15、关)时选择此项。One tailed:单尾检验,假如事先知道相关方向可以选择此项。同时,可以勾选【Flag significant Correlations(标记显著性相关)】复选框。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用Step05:其他选项选择 单击【Options(选项)】按钮,弹出的对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。Statistics:选择输出统计量。Mean
16、s and standard deviations:将输出选中的各变量的观测值数目、均值和标准差。Cross-product deviations and covariances:输出反映选中的每一对变量之间的叉积离差矩阵和协方差矩阵。MissingValues:用于设置缺失值的处理方式。它有两种处理方式:Exclude cases pairwise:系统默认项。剔除当前分析的两个变量值是缺失的个案。Exclude cases listwise:表示剔除全部含缺失值的个案后再进行分析。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.2 SPSS7.2 SPSS在
17、在简洁简洁相相关关分析中的分析中的应应用用Step06:相关统计量的Bootstrap估计 单击【Bootstrap】按钮,在弹出的对话框中可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的Bootstrap 估计。相关性表支持相关性的Bootstrap 估计。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.2.3 7.2.3 实实例分析:股票指例分析:股票指数数之之间间的的联联系系1.1.实实例例
18、内内容容 道道琼琼斯斯工工业业平平均均指指数数(DJIADJIA)和和标标准准普普尔尔指指数数500500(S&P S&P 500500)都都被被用用做做股股市市全全面面动动态态的的测测度度。DJIADJIA是是基基于于3030种种股股票票的的价价格格动动态态;S&P S&P 500500是是由由500500种种股股票票组组成成的的指指数数。有有人人说说S&P S&P 500500是是股股票票市市场场功功能能的的一一种种更更好好的的测测度度,因因为为它它基基于于更更多多的的股股票票。表表7-27-2显显示示了了DJIADJIA和和S&P S&P 500500在在19971997年年1010周周
19、内内的的收收盘盘价价。请请计计算算它它们们之之间间的的样样本本相相关关系系数数。不不仅仅如如此此,样样本本相相关关系系数数告告知我知我们们DJIADJIA和和S&P 500S&P 500之之间间的的关关系是系是怎样怎样的?的?7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用2.2.实例操作实例操作 表给出了道琼斯工业平均指数和标准普尔指数在同一时间点表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时依据两个股票指的数值。由于这些数值都是连续型变量,同时依据两个股票指数的散点图,可见它们呈显著的线性相关,因此可以接受数的散点图
20、,可见它们呈显著的线性相关,因此可以接受PearsonPearson相关系数来测度它们之间的相关性。但为了比较,我相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的们也计算了这两组变量的KendallKendall和和SpearmanSpearman相关系数。相关系数。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用3.3.实例结果及分析实例结果及分析(1)描述性统计分析表执行完上面的操作后,首先给出的是当前样本进行描述性统计的结果,如表7-3所示。可以看到样本容量都等于1
21、0,道琼斯工业平均指数和标准普尔指数的平均均值分别为7743.60和945.10,两者差距显著。同时,两者的方差差距也很明显。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用(2)Pearson相关系数表 接着SPSS列出了道琼斯工业平均指数和标准普尔指数的Pearson相关系数表7-4。可以看到,两种指数的Pearson系数值高达0.995,特殊接近1;同时相伴概率P值明显小于显著性水平0.01,这也进一步说明两者高度正线性相关。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用(3)非参数相关系数表 表7-5列出了两种股票指数的Kend
22、all和Spearman相关系数,分别等于0.994和0.985;同时它们的概率P值也远小于显著性水平。但本案例中,Spearman相关系数和Kendall相关系数都小于Pearson相关系数,明显这是由于在秩变换或数据按有序分类处理时损失信息所导致的。所以,通过以上分析看到,道琼斯工业平均指数和标准普尔指数具有高度正相关性,一个指数的上涨或上跌时,另一个指数也会伴随着上涨或下跌。7.2 SPSS7.2 SPSS在在简洁简洁相相关关分析中的分析中的应应用用7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.3.1 7.3.1 偏相偏相关关分析的基本原理分析的基本原理1.
23、1.方法方法概概述述 简简洁洁相相关关分分析析计计算算两两个个变变量量之之间间的的相相互互关关系系,分分析析两两个个变变量量间间线线性性关关系系的的程程度度。但但是是现现实实中中,事事物物之之间间的的联联系系可可能能存存在在于于多多个个主主体体之之间间,因因此此往往往往因因为为第第三三个个变变量量的的作作用用使使得得相相关关系系数数不不能能真真实实地地反反映映两两个个变变量量间间的的线线性性相相关关程程度度。例例如如身身高高、体体重重与与肺肺活活量量之之间间的的关关系系,假假如如运运用用Pearson Pearson 相相关关计计算算其其相相关关系系数数,可可以以得得出出肺肺活活量量、身身高高
24、和和体体重重均均存存在在较较强强的的线线性性相相关关性性质质。但但事事实实上上呢呢,对对体体重重相相同同的的人人而而言言,身身高高值值越越大大其其肺肺活活量量也也不不确确定定越越大大。因因为为身身高高与与体体重重有有着着线线性性关关系系,肺肺活活量量与与体体重重有有着着线线性性关关系系,因因此此得得出出了了身身高高与与肺肺活活量量之之间间存存在在较较强强的的线线性性关关系系的的错错误误结结论论。偏偏相相关关分分析析就就是是在在探探讨讨两两个个变变量量之之间间的的线线性性相相关关关关系系时时限制可能限制可能对对其其产产生影生影响响的的变变量。量。7.3 SPSS7.3 SPSS在偏相在偏相关关分
25、析中的分析中的应应用用2.2.基本原理基本原理 偏相偏相关关分析是在相分析是在相关关分析的基分析的基础础上考上考虑虑了了两个两个因素以外的各因素以外的各种种作用,作用,或者或者说说在扣除了其他因素的作用大小以后,重新在扣除了其他因素的作用大小以后,重新来测来测度度这两个这两个因素因素间间的的关联关联程度。程度。这种这种方法的目的就在于消退其他方法的目的就在于消退其他变变量量关联关联性的性的传递传递效效应应。偏相偏相关关系系数数在在计计算算时时可以首先分可以首先分别计别计算三算三个个因素之因素之间间的相的相关关系系数数,然,然后通后通过这过这三三个简洁个简洁相相关关系系数来计数来计算偏相算偏相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS19教程 SPSS19 教程 SPSS 相关 分析 剖析 优秀 PPT
限制150内