spss回归分析相关分析.ppt
《spss回归分析相关分析.ppt》由会员分享,可在线阅读,更多相关《spss回归分析相关分析.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、相关分析相关分析 Correlations线性相关:线性相关:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。(+-)非线性相关:非线性相关:如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似的在一条曲线上。如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。这就是相关分析。如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,这就是回归分析。绘制散点图散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分析效果相关分析相关分析 Correlations是将数据以点的形式画在直角坐标系上
2、,通过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。散点图:散点图:完全负相关负相关无相关完全正相关正相关无相关实际操作:简单散点图:生成一对相关变量的散点图简单散点图:生成一对相关变量的散点图重叠散点图:生成多对相关变量的散点图重叠散点图:生成多对相关变量的散点图矩阵散点图:同时生成多对相关变量的矩阵散点图矩阵散点图:同时生成多对相关变量的矩阵散点图三维散点图:生产成三个变量之间的三维散点图三维散点图:生产成三个变量之间的三维散点图相关分析相关分析 Correlations表示一对变量间统计关系的散点图将纵轴变量选入【Y 轴】,将横轴变量选入【X轴】,将分组变量选入【设置标
3、记】:用该变量分组,并在一张图上用不同颜色绘制若干个散点图。将标记变量选入【标注个案】:将标记变量的各变量值标记在散点图相应点的旁边。简单散点图:简单散点图:计算相关系数:利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:1.计算样本相关系数计算样本相关系数r;相关系数r的取值在-1-+1之间 r0表示两变量存在正的线性相关关系;r4040)必须是连续变量必须是连续变量多元回归方程中的自变量选择多元回归方程中的自变量选择 强行进入法(强行进入法(enterenter),即一般所称的复回归分析法。强迫所有),即一般所称的复回归分析法。强迫所有变量有顺序地进入回归方程。在研究设计中,如
4、果研究者事先建立假变量有顺序地进入回归方程。在研究设计中,如果研究者事先建立假设,决定变量的重要性层次,则应使用设,决定变量的重要性层次,则应使用enterenter法比较合适。此法又称法比较合适。此法又称“层次式进入法层次式进入法”(hierarchical enterhierarchical enter)后退法(后退法(BackwardBackward),将已纳入方程的变量按对因变量的贡献),将已纳入方程的变量按对因变量的贡献大小由小到大依次剔除,每剔除一个自变量,即重新检验每一自变量大小由小到大依次剔除,每剔除一个自变量,即重新检验每一自变量对因变量的贡献。对因变量的贡献。前进法(前进法
5、(ForwardForward),对已纳入方程的变量不考察其显著性,直),对已纳入方程的变量不考察其显著性,直到方程外变量均达不到入选标准。到方程外变量均达不到入选标准。强制剔除法(强制剔除法(RemoveRemove)与后退法相同,只是筛选的是)与后退法相同,只是筛选的是BlockBlock逐步回归法逐步回归法 StepwiseStepwise运用很广,报告中出现的几率最高。结合了前进法和后退法的运用很广,报告中出现的几率最高。结合了前进法和后退法的优点。第一,模型中先不包含任何预测变量,与因变量相关最优点。第一,模型中先不包含任何预测变量,与因变量相关最高者首先进入回归方程;第二,控制回归
6、方程中的变量后,根高者首先进入回归方程;第二,控制回归方程中的变量后,根据每个预测变量与因变量的偏相关的高低来决定进入方程的顺据每个预测变量与因变量的偏相关的高低来决定进入方程的顺序;第三,已进入方程的自变量,每引入一个自变量,就对方序;第三,已进入方程的自变量,每引入一个自变量,就对方程中的每一自变量进行显著性检验,若发现不显著,就剔除;程中的每一自变量进行显著性检验,若发现不显著,就剔除;每剔除一个自变量有也对留在方程中的自变量再进行显著性检每剔除一个自变量有也对留在方程中的自变量再进行显著性检验,再不显著,又剔除,直至没有自变量引入,也没有自变量验,再不显著,又剔除,直至没有自变量引入,
7、也没有自变量剔除为止。剔除为止。在选择回归的方法时,注意专业上的要求要先于统计学检验的准则。在选择回归的方法时,注意专业上的要求要先于统计学检验的准则。HowerHower(19871987)建议:()建议:(1 1)应优先使用)应优先使用enterenter或或stepwisestepwise。(。(2 2)使用)使用enterenter时,可根据研究时,可根据研究计划时的相关理论,决定变量投入的顺序。计划时的相关理论,决定变量投入的顺序。通过样本数据建立回归方程后一般不能立即用于对实际问题的分通过样本数据建立回归方程后一般不能立即用于对实际问题的分析和预测,通常要进行各种统计检验析和预测,
8、通常要进行各种统计检验.包括回归方程的拟合优度检验包括回归方程的拟合优度检验回归方程的显著性检验回归方程的显著性检验回归系数的显著性检验回归系数的显著性检验残差分析等残差分析等拟合优度检验拟合优度检验检验样本数据点聚集在回归线周围的密集程度,从而评价回归方检验样本数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。程对样本数据的代表程度。认为认为y y各观测值的之间的差异主要由两个方面的原因造成:一是各观测值的之间的差异主要由两个方面的原因造成:一是解释变量解释变量x x取值的不同造成的;二是由于其他随机因素造成的。取值的不同造成的;二是由于其他随机因素造成的。SST=SS
9、A+SSESST=SSA+SSE(回归平方和剩余平方和)(回归平方和剩余平方和)若若SSASSA所占的比例远大于所占的比例远大于SSESSE所占的比例,那么回归方程的拟合优所占的比例,那么回归方程的拟合优度会比较高。度会比较高。拟合优度检验采用拟合优度检验采用R R2 2统计量,该统计量称为判定系数或决定系数,统计量,该统计量称为判定系数或决定系数,它是它是SSA/SSTSSA/SST反映因变量的全部变异中能够通过回归关系被自变量解释的比例,反映因变量的全部变异中能够通过回归关系被自变量解释的比例,即检验回归的效果如何。即检验回归的效果如何。如果自变量的个数很多,有时要以调整后的决定系数代替原
10、先的如果自变量的个数很多,有时要以调整后的决定系数代替原先的决定系数。因为增加新的自变量会使决定系数增大,这种决定系决定系数。因为增加新的自变量会使决定系数增大,这种决定系数会有高人为控制的机制在内,此时用调整后的决定系数更好数会有高人为控制的机制在内,此时用调整后的决定系数更好拟合优度检验拟合优度检验显著性检验显著性检验线性回归方程能够较好地反映被解释变量和解释变量之间统计关线性回归方程能够较好地反映被解释变量和解释变量之间统计关系的前提应是,被解释变量和解释变量之间确实存在显著的线性系的前提应是,被解释变量和解释变量之间确实存在显著的线性关系。回归方程的显著性检验正是要检验被解释变量与所有
11、解释关系。回归方程的显著性检验正是要检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当。系是否恰当。基本出发点与拟合优度检验非常相似。基本出发点与拟合优度检验非常相似。检验采用检验采用F统计量。统计量。主要目的是研究回归方程中的每个解释变量与被解释变量之间是主要目的是研究回归方程中的每个解释变量与被解释变量之间是否存在显著的线性关系,也就是研究解释变量能够有效地解释被否存在显著的线性关系,也就是研究解释变量能够有效地解释被解释变量的线性变化,他们能够保留在线性回归方程中。解释变量的线性变化,他们能够
12、保留在线性回归方程中。是围绕回归系数估计值的抽样分布展开的,由此构造服从某种理是围绕回归系数估计值的抽样分布展开的,由此构造服从某种理论分布的检验统计量,并进行检验。论分布的检验统计量,并进行检验。t t统计量:在一元线性回归分析中,回归方程显著性检验和回归统计量:在一元线性回归分析中,回归方程显著性检验和回归系数显著性检验的作用是相同的,两者可以相互代替,同时回归系数显著性检验的作用是相同的,两者可以相互代替,同时回归方程显著性检验中方程显著性检验中F Ft t2 2。但在多元线性回归中的这两种检验通常不能互相替代。但在多元线性回归中的这两种检验通常不能互相替代。残差分析所谓残差是指由回归方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 回归 分析 相关
限制150内