回归分析SPSS操作说课材料.ppt
《回归分析SPSS操作说课材料.ppt》由会员分享,可在线阅读,更多相关《回归分析SPSS操作说课材料.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、回归分析SPSS操作回归分析基本概念回归分析基本概念1 回回归分析主要解决以下几方面的分析主要解决以下几方面的问题:q 通通过分析大量的分析大量的样本数据,确定本数据,确定变量之量之间的数学关系式。的数学关系式。q 对所确定的数学关系式的可信程度所确定的数学关系式的可信程度进行各种行各种统计检验,并,并区分出区分出对某一特定某一特定变量影响量影响较为显著的著的变量和影响不量和影响不显著的著的变量。量。q 利用所确定的数学关系式,根据一个或几个利用所确定的数学关系式,根据一个或几个变量的量的值来来预测或控制另一个特定或控制另一个特定变量的取量的取值,并,并给出出这种种预测或控制的或控制的精确度。
2、精确度。2.1 统计学上的定义和计算公式统计学上的定义和计算公式 定定义:一元:一元线性回性回归分析是分析某一个因素分析是分析某一个因素(自(自变量)是如何影响另一事物(因量)是如何影响另一事物(因变量)的量)的过程,程,所所进行的分析是比行的分析是比较理想化的。其理想化的。其实,在,在现实生活生活中,任何一个事物(因中,任何一个事物(因变量)量)总是受到其他多种事是受到其他多种事物(多个自物(多个自变量)的影响。量)的影响。一元线性回归分析一元线性回归分析2 研究问题研究问题 合成合成纤维的的强度与其拉伸倍数有关,度与其拉伸倍数有关,测得得试验数据如表数据如表9-1所示。求合成所示。求合成纤
3、维的的强度与拉伸倍数之度与拉伸倍数之间是否存在是否存在显著的著的线性相关关系。性相关关系。2.2 SPSS中实现过程中实现过程表表表表1 1强强强强度与拉伸倍数的度与拉伸倍数的度与拉伸倍数的度与拉伸倍数的试验试验试验试验数据数据数据数据序序 号号拉拉 伸伸 倍倍 数数强度(强度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1 实现步骤实现步骤图图图图1 1 在菜在菜在菜在菜单单单单中中中中选择选择选择选择“Linear”Linear”命令命令命令命令图
4、图图图2 “Linear Regression”2 “Linear Regression”对话对话对话对话框框框框因因因因变变量量量量自自自自变变量量量量指定回指定回指定回指定回归归方法方法方法方法全部全部全部全部选选入入入入图图图图3 “Linear Regression:statistics”3 “Linear Regression:statistics”对话对话对话对话框框框框与回与回与回与回归归系数相系数相系数相系数相关的关的关的关的统计统计量量量量提供决定系数、估提供决定系数、估提供决定系数、估提供决定系数、估计计标标准准准准误误、ANOVAANOVA表表表表等等等等异常异常异常异常
5、值诊值诊断断断断报报告残差超告残差超告残差超告残差超过过2 2个个个个标标准差的被准差的被准差的被准差的被试试 图图图图4 “Linear Regression4 “Linear Regression:Plots”Plots”对话对话对话对话框框框框 调调整整整整预测值预测值标标准化准化准化准化预测值预测值标标准化残差准化残差准化残差准化残差剔除残差剔除残差剔除残差剔除残差学生化残差学生化残差学生化残差学生化残差学生化剔除残差学生化剔除残差学生化剔除残差学生化剔除残差输输出出出出标标准化残差相准化残差相准化残差相准化残差相对对于因于因于因于因变变量的散布量的散布量的散布量的散布图图标标准化残差
6、准化残差准化残差准化残差图图直方直方直方直方图图正正正正态态概率概率概率概率图图q对应x值的残差的残差图x0良好模式x0方差不齐x0不满足线性回归假设图图5 “Linear Regression5 “Linear Regression:Save”Save”对话对话框框框框 预测值预测值残差残差残差残差本本本本对话对话框用来定框用来定框用来定框用来定义义存存存存储储进进入数据文件的新入数据文件的新入数据文件的新入数据文件的新变变量量量量预测预测区区区区间间均数的置信区均数的置信区间个体的容个体的容许区区间学生化残差学生化残差学生化残差学生化残差标标准化残差准化残差准化残差准化残差未未未未标标准化
7、残差准化残差准化残差准化残差 (1 1)输出的结果文件中的第一部分:)输出的结果文件中的第一部分:X与与Y的的简单相关系数相关系数2.3 结果和讨论结果和讨论q1)决定系数)决定系数R2 它它表表示示在在因因变量量y的的总变异异中中可可由由回回归方方程程所所解解释部部分分的的比例。比例。0R21,越接近于越接近于1,说明回明回归方程效果越好。方程效果越好。q2)校正的决定系数)校正的决定系数Adj R2 0AdjR21,越接近于越接近于1,说明回明回归方程效果越好。方程效果越好。q即使自即使自变量量对Y无无显著意著意义,R2也随方程中的也随方程中的变量量个数增加而增加。个数增加而增加。Adj
8、R2可以可以惩罚复复杂模型。模型。F=t2截距截距回回归系数系数标准化回归系数结果果显示:回示:回归方程方程显著,即合成著,即合成纤维的的强度受拉伸倍数的度受拉伸倍数的显著影响著影响(2 2)第二部分)第二部分 异常值分析异常值分析q 如果如果标准化残差超准化残差超过2/-2,称,称为异常异常值outliers。q 当当样本量比本量比较小,异常小,异常值又会影响回又会影响回归系数的估系数的估计时,应该关注异常关注异常值的影响。的影响。q 异常值 a 不影响 异常值 b 影响q第第i个观察值的学生化残差个观察值的学生化残差q 考考虑了用来了用来计算残差的算残差的 值有不同的方差。有不同的方差。这
9、种种调整能整能够使残差分析更加敏感地使残差分析更加敏感地发现方差不方差不齐。q学生化残差学生化残差超超过2和和-2的点可的点可认为是异常是异常值(3)第三部分)第三部分 数据窗口的存储数据窗口的存储 未标准化残差 标准化残差 学生化残差预测预测区区区区间间均数的置信区均数的置信区间个体的容个体的容许区区间1.7 利用回归方程进行估计和预测q均数的置信区均数的置信区间:均数均数 界界值标准准误 q个体的容个体的容许区区间(参考参考值范范围):):均数均数 界界值标准差准差 可信区间与预测区间示意图3.1 统计学上的定义统计学上的定义 定定义:在上一:在上一节中中讨论的回的回归问题只涉及了一只涉及
10、了一个自个自变量,但在量,但在实际问题中,影响因中,影响因变量的因素往量的因素往往有多个。例如,商品的需求除了受自身价格的影往有多个。例如,商品的需求除了受自身价格的影响外,响外,还要受到消要受到消费者收入、其他商品的价格、消者收入、其他商品的价格、消费者偏好等因素的影响;影响水果者偏好等因素的影响;影响水果产量的外界因素量的外界因素有平均气温、平均日照有平均气温、平均日照时数、平均湿度等。数、平均湿度等。多元线性回归分析多元线性回归分析3q研研究究者者往往往往是是根根据据自自己己的的经验或或借借鉴他他人人的的研研究究结果果选定定若若干干个个自自变量量,这些些自自变量量对因因变量量的的影响作用
11、是否都有影响作用是否都有统计学意学意义还有待于考察。有待于考察。q在在建建立立回回归方方程程的的过程程中中有有必必要要考考虑对自自变量量进行行筛选,挑挑选出出若若干干个个与与因因变量量作作用用较大大的的变量量建建立立回回归方方程程。剔剔除除那那些些对因因变量量没没有有影影响响的的变量,从而建立一个量,从而建立一个较理想和理想和稳定的回定的回归方程。方程。3.2 逐步回归逐步回归逐步回归的思想:q1.开开始始方方程程中中没没有有自自变量量,然然后后按按自自变量量对y的的贡献献大大小小由由大大到到小小依依次次挑挑选进入入方方程程,每每选入入一一个个变量,都要量,都要对进行行检验,决定,决定变量的取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 SPSS 操作 材料
限制150内