SPSS 相关分析与回归分析专题.ppt
《SPSS 相关分析与回归分析专题.ppt》由会员分享,可在线阅读,更多相关《SPSS 相关分析与回归分析专题.ppt(310页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、相关分析与回归分析相关分析与回归分析专题相关分析与回归分析专题(Correlation®ression)相关分析与回归分析相关分析相关分析(Correlation Analysis)相关分析与回归分析一、相关分析的意义:一、相关分析的意义:研究问题过程:单变量分析研究问题过程:单变量分析 双变量分析双变量分析 多变量分析多变量分析多多变变量量分分析析与与单单变变量量分分析析的的最最大大不不同同:揭揭示示客客观观事事物物之之间间的关联性。的关联性。所以,相关分析的意义和目的在于:所以,相关分析的意义和目的在于:(1 1)在统计学中有理论与实践意义)在统计学中有理论与实践意义(2 2)对相关
2、关系的存在性给出判断)对相关关系的存在性给出判断 (3)(3)对相关关系的强度给出度量和分析对相关关系的强度给出度量和分析相关分析与回归分析二二、相相关关分分析析的的概概念念 变变量量之之间间的的关关系系分分为为确确定定性性关关系系和和非非确确定定性性关关系系。确确定定性性关关系系:当当一一个个变变量量值值(自自变变量量)确确定定后后,另另一一个个变变量量值值(因因变变量量)也也就就完完全全确确定定了了,确确定定性性关关系系往往往往可可以以表表示示成成一一个个函函数数的的形形式式,比比如如圆圆的的面面积积和和半半径径的的关关系系:S S=r r 非非确确定定性性关关系系:给给定定了了一一个个变
3、变量量值值后后,另另一一个个变变量量值值可可以以在在一一定定范范围围内内变变化化,例例如如家家庭庭的的消消费费支支出出和和家家庭庭收收入入的的关关系系。研研究究者者把把非非确确定定性性关关系系称称为为相相关关关关系系。相关分析与回归分析三三.相关分析的特点和应用相关分析的特点和应用 相关关系是普遍存在的,函数关系仅是相关关系的特例。相关关系是普遍存在的,函数关系仅是相关关系的特例。1.1.相关关系的类型相关关系的类型 相关关系多种多样,归纳起来大致有以下相关关系多种多样,归纳起来大致有以下6 6种:种:l 强正相关关系强正相关关系,其特点是一变量,其特点是一变量X X增加,导致另一变量增加,导
4、致另一变量 Y Y明显增加,说明明显增加,说明X X是影响是影响Y Y的主要因素。的主要因素。l 弱正相关关系弱正相关关系,其特点是一变量,其特点是一变量X X增加,导致另一变量增加,导致另一变量Y Y增加,但增加幅度不明显。增加,但增加幅度不明显。l 强负相关关系强负相关关系,其特点是,其特点是X X增加,导致增加,导致Y Y明显减少,说明显减少,说明明X X是影响是影响Y Y的主要因素的主要因素相关分析与回归分析l弱负相关关系弱负相关关系,其特点是变量,其特点是变量X X增加,导致增加,导致Y Y减少,但减少,但 减少幅度不明显,说明减少幅度不明显,说明X X是是Y Y的影响因素,但不是唯
5、一的影响因素,但不是唯一 因素。因素。l 非线性相关关系非线性相关关系,其特点是,其特点是X X、Y Y之间没有明显的线性之间没有明显的线性 关系,却存在着某种非线性关系,说明关系,却存在着某种非线性关系,说明X X仍是影响仍是影响Y Y的的 因素。因素。l 不相关不相关,其特点是,其特点是X X、Y Y不存在相关关系,说明不存在相关关系,说明X X不是不是 影响影响Y Y的因素。的因素。相关分析与回归分析2.2.相关分析的应用相关分析的应用 (1 1)相关分析可以在影响某个变量的诸多变量中判断)相关分析可以在影响某个变量的诸多变量中判断哪些是显著的,哪些是不显著的。而且在得到相关分析哪些是显
6、著的,哪些是不显著的。而且在得到相关分析的结果后,可以的结果后,可以用于其他分析用于其他分析,如回归分析和因子分析。,如回归分析和因子分析。(2 2)相关分析方法已广泛用于心理学、教育学、医学相关分析方法已广泛用于心理学、教育学、医学、经济学等各学科。它对试验数据的处理、经验公式的、经济学等各学科。它对试验数据的处理、经验公式的建立、管理标准的测定、自然现象和经济现象的统计预建立、管理标准的测定、自然现象和经济现象的统计预报,都是一种方便而且有效的工具。报,都是一种方便而且有效的工具。相关分析与回归分析四、相关系数四、相关系数l相相关关分分析析的的主主要要目目的的是是研研究究变变量量之之间间关
7、关系系的的密密切切程程度度,以以及及根根据据样样本本的的资资料料推推断断总总体体是是否否样样关关。反反映映变变量量之之间间关关系系紧紧密密程程度度的的指指标标主主要要是是相相关关系系数数r r。相相关关系系数数r r取取值值在在-1 1到到+1+1之之间间,当当数数值值愈愈接接近近-1 1或或+1+1时时,说说明明关关系系愈愈紧紧密密,接接近近于于0 0时时,说说明明关关系系不不紧紧密密。相关分析与回归分析相关系数的计算相关系数的计算l样本的相关系数一般用样本的相关系数一般用r r表示,总体的相关系数一般用表示,总体的相关系数一般用p p表表示。示。l对于不同类型的变量,相关系数的计算公式不同
8、。在相关对于不同类型的变量,相关系数的计算公式不同。在相关分析中,常用的相关系数有:分析中,常用的相关系数有:PearsonPearson简单简单相关系数相关系数:对定距连续变量的数据进行计算。:对定距连续变量的数据进行计算。如测度收入和储蓄,身高和体重。如测度收入和储蓄,身高和体重。SpearmanSpearman等级相关系数等级相关系数:用于度量定序变量间的线性相关:用于度量定序变量间的线性相关关系。如军队教员的军衔与职称。关系。如军队教员的军衔与职称。Kendall Kendall r r相关系数相关系数:用非参数检验方法来度量定序变量间的线性相用非参数检验方法来度量定序变量间的线性相关
9、关系。计算基于数据的秩。关关系。计算基于数据的秩。相关分析与回归分析PearsonPearson相关系数应用广泛,其计算公式及其性质如下:相关系数应用广泛,其计算公式及其性质如下:相关分析与回归分析在在AnalyzeAnalyze的下拉菜单的下拉菜单CorrelateCorrelate命令项中有三个相关命令项中有三个相关分析功能子命令分析功能子命令:l Bivariate(两两相关分析过程)(两两相关分析过程)l Partial (偏相关分析过程)(偏相关分析过程)l Distances(距离分析过程)(距离分析过程)五、五、SPSSSPSS中相关分析中相关分析CorrelationCorre
10、lation菜单菜单 相关分析与回归分析Bivariate过程过程相关分析与回归分析lBivariateBivariate过程用于进行两个或多个变量间的参数与非过程用于进行两个或多个变量间的参数与非参数相关分析,如为多个变量,给出两两相关的分析参数相关分析,如为多个变量,给出两两相关的分析结果。这是结果。这是correlatecorrelate菜单中最常用的一个过程,包括自菜单中最常用的一个过程,包括自动计算动计算PearsonPearson简单相关系数、简单相关系数、T T检验统计量和对应的检验统计量和对应的概率概率P P值。值。相关分析与回归分析举例:举例:对肺活量和体重做相对肺活量和体重
11、做相关分析关分析 1 1.打开打开SAVSAV数据。数据。2.2.用散点图初步观察两变量用散点图初步观察两变量间有无相关趋势,依次单击间有无相关趋势,依次单击菜单菜单“Graphs-Chart Graphs-Chart BuilderBuilder”打开图形构建器,打开图形构建器,选择做散点图(选择做散点图(Scatter Scatter/Dot)/Dot)。相关分析与回归分析 3.3.设置相关分析的参数。设置相关分析的参数。依次单击依次单击“Analyze-Correlate-BivariateAnalyze-Correlate-Bivariate”执执行两变量相关分析。其主设置面板如图所示
12、:行两变量相关分析。其主设置面板如图所示:待分析变量列表待分析变量列表变量列表变量列表相关系数相关系数显著性检验选项显著性检验选项相关分析与回归分析相关分析与回归分析(2 2)相关性输出,)相关性输出,“相关性相关性”表格给出的是表格给出的是PearsonPearson相关系数及其检验结果:相关系数及其检验结果:“相关系数相关系数”表格给出的表格给出的是两个非参数相关系数及其检验结果。可见,是两个非参数相关系数及其检验结果。可见,3 3个相个相关系数在关系数在0.010.01和和0.050.05的显著性水平(双边检验)上都的显著性水平(双边检验)上都非常显著,从而推断体重和肺活量之间存在着明显
13、非常显著,从而推断体重和肺活量之间存在着明显的正相关关系。的正相关关系。(1 1)描述性输出,)描述性输出,“描述性统计量描述性统计量”表格给出了两表格给出了两个变量的基本统计信息,包括均值、标准差和频率。个变量的基本统计信息,包括均值、标准差和频率。相关分析与回归分析 Partial 过程过程相关分析与回归分析l偏相关分析偏相关分析也称净相关分析,它在控制其他变量的线性也称净相关分析,它在控制其他变量的线性影响下分析两变量间的线性相关,所采用的是工具是影响下分析两变量间的线性相关,所采用的是工具是偏偏相关系数相关系数(净相关系数)。运用偏相关分析可以有效地(净相关系数)。运用偏相关分析可以有
14、效地揭示变量间的真实关系,识别干扰变量并寻找隐含的相揭示变量间的真实关系,识别干扰变量并寻找隐含的相关性。关性。如控制年龄和工作经验的影响,估计工资收入与如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系。受教育水平之间的相关关系。lPartialPartial过程,当进行相关分析的两个变量的取值都受到其他变量的过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。输出控制其他变量影响后的相关系数。相关分析与回归分析举例:举例:分析身高与肺活量之间的相
15、关性,要控制体重在分析身高与肺活量之间的相关性,要控制体重在相关分析过程中的影响。相关分析过程中的影响。1.1.设置偏相关分析的参数。设置偏相关分析的参数。依次单击依次单击“Analyze-Correlate-PatialAnalyze-Correlate-Patial”执行偏相关执行偏相关分析。其主设置面板如图所示:分析。其主设置面板如图所示:相关分析与回归分析0 0阶偏相关阶偏相关(Pearson)Pearson)1 1阶偏相关阶偏相关显著相关显著相关相关不显著相关不显著相关分析与回归分析(1 1)描述性输出,)描述性输出,“描述性统计量描述性统计量”表格给出了三个表格给出了三个变量的基本
16、统计信息,包括均值、标准差和频率。变量的基本统计信息,包括均值、标准差和频率。(2 2)相关性输出,)相关性输出,“相关性相关性”表格给出了所有变量的表格给出了所有变量的0 0阶偏相关(阶偏相关(PearsonPearson简单相关)系数和简单相关)系数和1 1阶偏相关系数的阶偏相关系数的计算结果果、以及它们各自的显著性检验计算结果果、以及它们各自的显著性检验P P值。分析结值。分析结果显示:在体重果显示:在体重 不变的条件下,身高与肺活量之间不存不变的条件下,身高与肺活量之间不存在显著在显著 线性相关关系。线性相关关系。相关分析与回归分析Distances过程过程相关分析与回归分析l距离分析
17、:距离分析:此过程可以在观测记录之间或者此过程可以在观测记录之间或者 不同变量之间进行不同变量之间进行相似性和不相似性相似性和不相似性分析。相似性分分析。相似性分析可以用于检测观测值的接近程度,不相似性分析可析可以用于检测观测值的接近程度,不相似性分析可用于考察各变量的内在联系和结构。该过程一般不单用于考察各变量的内在联系和结构。该过程一般不单独使用,而是作为因子分析、聚类分析和多维尺度分独使用,而是作为因子分析、聚类分析和多维尺度分析等的预分析过程,以帮助了解复杂数据集的内部结析等的预分析过程,以帮助了解复杂数据集的内部结构,为进一步的分析做准备。构,为进一步的分析做准备。l与距离分析有关的
18、统计量分为相似性测度和不相似性与距离分析有关的统计量分为相似性测度和不相似性测试两大类。测试两大类。相关分析与回归分析l不相似性测度不相似性测度a a、对定距、对定距变量变量的测度可以使用的统计量有的测度可以使用的统计量有EuclidEuclid欧氏距离、欧氏距离、平方欧氏距离平方欧氏距离、契比雪夫距离、契比雪夫距离等。等。b b、对、对定序变量,定序变量,使用卡方使用卡方不相似测度和不相似测度和PhiPhi方不相似测度方不相似测度。c c、对二值(只有两种取值)、对二值(只有两种取值)变量变量,使用欧氏距离、平方欧,使用欧氏距离、平方欧氏距离、氏距离、Lane and Williams La
19、ne and Williams 不相似测度。不相似测度。l相似性测度:相似性测度:a a、对定距、对定距变量的测度,主要有变量的测度,主要有统计量统计量PearsonPearson相关或余弦相关或余弦距距离离。b b 、对二值变量的相似性测度主要包括简单匹配系数、对二值变量的相似性测度主要包括简单匹配系数、JaccardJaccard相似性指数等。相似性指数等。在通常使用的距离中,最常用的是在通常使用的距离中,最常用的是欧式距离。欧式距离。相关分析与回归分析案例:打开案例:打开“地区经济发展水平指标地区经济发展水平指标.sav.sav”相关分析与回归分析参数设置:参数设置:距离的计算对象距离的
20、计算对象距离的测度类型距离的测度类型分析变量例表分析变量例表相关分析与回归分析结果分析:结果分析:相关分析与回归分析(1 1)案例处理摘要。)案例处理摘要。“案例处理摘要案例处理摘要”表格给出了数表格给出了数据使用的基本情况。主要是对有无缺失值的统计信息,据使用的基本情况。主要是对有无缺失值的统计信息,可见本例的可见本例的1111个案例没有缺失,全部用于分析。个案例没有缺失,全部用于分析。(2 2)近似矩阵。)近似矩阵。“近似矩阵近似矩阵”表格给出的是各变量之表格给出的是各变量之间的相似矩阵,图中以线框标注了相关系数较大的几对间的相似矩阵,图中以线框标注了相关系数较大的几对变量。它们在进一步的
21、分析中应重点关注,或者直接对变量。它们在进一步的分析中应重点关注,或者直接对其进行适当的预处理(例如变量约减)其进行适当的预处理(例如变量约减)相关分析与回归分析相关分析与回归分析相关分析与回归分析线性回归线性回归相关分析与回归分析线性回归事物关系函数关系(一一对应)统计关系(非一一对应)线性相关非线性相关相关分析与回归分析回归分析(regressionanalysis)确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。p涉及的自变量的多少a.一元回归分析b.多元回归分析p自变量和因变量之间的关系类型,a.线性回归分析b.非线性回归分析线性回归相关分析与回归分析回归分析一般步骤:确
22、定回归方程中的解释变量(自变量)和被解释变量(因变量)确定回归模型建立回归方程对回归方程进行各种检验利用回归方程进行预测线性回归相关分析与回归分析一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。一元线性回归数学模型:其中0和1是未知参数,分别称为回归常数和回归系数,称为随机误差,是一个随机变量,且应该满足两个前提条件:E()=0var()=2线性回归模型线性回归相关分析与回归分析多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其他多个解释变量之间的线性关系。多元线性回归数学模型:其中0、1、p都是未知参数,分别称为回归
23、常数和偏回归系数,称为随机误差,是一个随机变量,且同样满足两个前提条件:E()=0var()=2线性回归线性回归模型相关分析与回归分析回归参数的普通最小二乘估计(OLSE)线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则。最小二乘法将偏差距离定义为离差平方和,即(1)最小二乘估计就是寻找参数0、1、p的估计值0、1、p,使式(1)达到极小。通过求极值原理(偏导为零)和解方程组,可求得估计值,SPSS将自动完成。线性回归相关分析与回归分析u回归方程的统计检验u回归方程的拟合优度检验(相关系数检验)一元
24、线性回归的拟合优度检验采用R2统计量,称为判定系数或决定系数,数学定义为其中称为回归平方和(SSA)称为总离差平方和(SST)线性回归相关分析与回归分析线性回归u回归方程的统计检验u回归方程的拟合优度检验(相关系数检验)R2取值在0-1之间,R2越接近于1,说明回归方程对样本数据点的拟合优度越高。相关分析与回归分析多元线性回归的拟合优度检验采用统计量,称为调整的判定系数或调整的决定系数,数学定义为式中n-p-1、n-1分别是SSE和SST的自由度。其取值范围和意义与一元回归方程中的R2是相同的。u回归方程的统计检验u回归方程的拟合优度检验(相关系数检验)线性回归相关分析与回归分析u回归方程的统
25、计检验u回归方程的显著性检验(F检验)一元线性回归方程显著性检验的零假设是1=0,检验采用F统计量,其数学定义为:即平均的SSA/平均的SSE,F统计量服从(1,n-2)个自由度的F分布。SPSS将会自动计算检验统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平,则应拒绝零假设,认为线性关系显著。线性回归相关分析与回归分析u回归方程的统计检验u回归方程的显著性检验(F检验)多元线性回归方程显著性检验的零假设是各个偏回归系数同时为零,检验采用F统计量,其数学定义为:即平均的SSA/平均的SSE,F统计量服从(p,n-p-1)个自由度的F分布。SPSS将会自动计算检验统计量的观测值以及
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 相关分析与回归分析专题 相关 分析 回归 专题
限制150内