spss回归分析大全课件.ppt
《spss回归分析大全课件.ppt》由会员分享,可在线阅读,更多相关《spss回归分析大全课件.ppt(225页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSSSPSS回归分析回归分析小组成员:小组成员:李标李标 祝斌祝斌 宋金泽宋金泽 周益丰周益丰 贾汪洋贾汪洋1 1BGBG2本章内容7.1 回归分析概述回归分析概述7.2 线性回归分析线性回归分析7.3 曲线估计回归分析曲线估计回归分析7.4 罗辑回归分析罗辑回归分析7.5 序数、概率回归分析序数、概率回归分析7.6 非线性、权重估计、两阶最小二乘、非线性、权重估计、两阶最小二乘、最佳尺度回归分析最佳尺度回归分析 23回归分析(regression analysis)确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。p涉及的自变量的多少a.一元回归分析b.多元回归分析p自变量和
2、因变量之间的关系类型,a.线性回归分析b.非线性回归分析回归分析34回归分析一般步骤:确定回归方程中的解释变量(自变量)和被解释变量(因变量)确定回归模型建立回归方程对回归方程进行各种检验利用回归方程进行预测回归分析4线性回归分析一元线性回归方程反应一个一元线性回归方程反应一个因变量因变量与一个与一个自变量自变量之间的线性之间的线性关系,当直线方程关系,当直线方程Y=a+bx的的a和和b确定时,即为一元回归确定时,即为一元回归线性方程。经过相关分析后,在直角坐标系中将大量数据绘线性方程。经过相关分析后,在直角坐标系中将大量数据绘制成制成散点图散点图,这些点不在一条直线上,但可以从中找到一条,这
3、些点不在一条直线上,但可以从中找到一条合适的直线,使各散点到这条直线的纵向距离之和最小,这合适的直线,使各散点到这条直线的纵向距离之和最小,这条直线就是回归直线,这条直线的方程叫作直线回归方程。条直线就是回归直线,这条直线的方程叫作直线回归方程。注意:一元线性回归方程与函数的直线方程有区别,一元注意:一元线性回归方程与函数的直线方程有区别,一元 线性回归方程中的自变量线性回归方程中的自变量X对应的是因变量对应的是因变量Y的一个取值范的一个取值范围。围。51.一元线性回归分析的基本理论一元线性回归分析的基本理论 把把解释变量解释变量和和被解释变量被解释变量的多个对应样本值组队成坐标数据的多个对应
4、样本值组队成坐标数据对(对(xi,yi),通过观察数据对(),通过观察数据对(xi,yi)的散点图,如果)的散点图,如果发现发现y与与xi之间呈现出显著的线性关系,则应考虑建立之间呈现出显著的线性关系,则应考虑建立y和和xi的一元线性回归模型,其中,的一元线性回归模型,其中,y=a+bx+,y为被解释为被解释变量;变量;a为模型的截距项;为模型的截距项;b为待估计参数;为待估计参数;x为解释变量;为解释变量;为随机误差项。为随机误差项。线性回归分析线性回归分析6对于一元线性模型,一般采用对于一元线性模型,一般采用最小二乘估计法最小二乘估计法来估计相关的参数(如和的无偏来估计相关的参数(如和的无
5、偏估计值和),从而得到样本回归直线,这样把得到的样本回归直线作为总体回估计值和),从而得到样本回归直线,这样把得到的样本回归直线作为总体回归的近似,是一种预测过程。归的近似,是一种预测过程。那要确定得到的样本回归直线是否能作为总体回归的近似,就必须对回归方程那要确定得到的样本回归直线是否能作为总体回归的近似,就必须对回归方程的线性关系进行各种统计检验,包括的线性关系进行各种统计检验,包括拟合优度检验拟合优度检验、回归方程显著性检验回归方程显著性检验、回回归系数的显著性检验(归系数的显著性检验(t检验检验)、)、残差分析残差分析等。等。线性回归分析线性回归分析7u回归方程的回归方程的拟合优度拟合
6、优度检验(相关系数检验)检验(相关系数检验)一元线性回归的拟合优度检验采用一元线性回归的拟合优度检验采用R2统计量,称为判定系数或决定系统计量,称为判定系数或决定系数,数学定义为数,数学定义为其中其中 称为回归平方和(称为回归平方和(SSA)称为总离差平方和(称为总离差平方和(SST)R2取值在取值在0-1之间,之间,R2越接近于越接近于1,说明回归方程对样本数据点的拟,说明回归方程对样本数据点的拟合优度越高。合优度越高。线性回归分析线性回归分析89多元线性回归的拟合优度检验采用多元线性回归的拟合优度检验采用 统计量,称为调整的判定系数或统计量,称为调整的判定系数或调整的决定系数,数学定义为调
7、整的决定系数,数学定义为式中式中n-p-1、n-1分别是分别是SSE和和SST的自由度。其取值范围和意义与一的自由度。其取值范围和意义与一元回归方程中的元回归方程中的R2是相同的。是相同的。u回归方程的拟合优度检验(相关系数检验)回归方程的拟合优度检验(相关系数检验)线性回归分析线性回归分析9u回归回归方程方程的显著性检验(的显著性检验(F检验)检验)即平均的即平均的SSA/平均的平均的SSE,F统计量服从(统计量服从(1,n-2)个自由度的)个自由度的F分布。分布。SPSS将会自动计算检验统计量的观测值以及对应的概率将会自动计算检验统计量的观测值以及对应的概率p值,如果值,如果p值小于给定的
8、显著性水平值小于给定的显著性水平,则应拒绝零假设,认为线性关系显著。,则应拒绝零假设,认为线性关系显著。一元线性回归方程显著性检验的零假设是一元线性回归方程显著性检验的零假设是1=0,检验采用,检验采用F统计量,统计量,其数学定义为:其数学定义为:线性回归分析线性回归分析1011u回归方程的显著性检验(回归方程的显著性检验(F检验)检验)多元线性回归方程显著性检验的零假设是各个偏回归系数同时为零,多元线性回归方程显著性检验的零假设是各个偏回归系数同时为零,检验采用检验采用F统计量,其数学定义为:统计量,其数学定义为:即平均的即平均的SSA/平均的平均的SSE,F统计量服从(统计量服从(p,n-
9、p-1)个自由度的)个自由度的F分布。分布。SPSS将会自动计算检验统计量的观测值以及对应的概率将会自动计算检验统计量的观测值以及对应的概率p值,值,如果如果p值小于给定的显著性水平值小于给定的显著性水平,则应拒绝零假设,认为,则应拒绝零假设,认为y与与x的全的全体的线性关系显著。体的线性关系显著。线性回归分析线性回归分析11u回归系数的显著性检验(回归系数的显著性检验(t检验)检验)一元线性回归方程的回归系数显著性检验的零假设是一元线性回归方程的回归系数显著性检验的零假设是1=0,检验采用,检验采用t统计量,其数学定义为:统计量,其数学定义为:t统计量服从统计量服从n-2个自由度的个自由度的
10、t分布。分布。SPSS将会自动计算将会自动计算t统计量的观测值统计量的观测值以及对应的概率以及对应的概率p值,如果值,如果p值小于给定的显著性水平值小于给定的显著性水平,则应拒绝零,则应拒绝零假设,认为假设,认为x对对y有显著贡献,线性关系显著。有显著贡献,线性关系显著。线性回归分析线性回归分析1213u回归系数的显著性检验(回归系数的显著性检验(t检验)检验)多元线性回归方程的回归系数显著性检验的零假设是多元线性回归方程的回归系数显著性检验的零假设是i=0,检验采,检验采用用t统计量,其数学定义为:统计量,其数学定义为:ti统计量服从统计量服从n-p-1个自由度的个自由度的t分布。分布。SP
11、SS将会自动计算将会自动计算ti统计量统计量的观测值以及对应的概率的观测值以及对应的概率p值,如果值,如果p值小于给定的显著性水平值小于给定的显著性水平,则应拒绝零假设,认为则应拒绝零假设,认为xi对对y有显著贡献,应保留在线性方程中。有显著贡献,应保留在线性方程中。(i=1,2,,p)线性回归分析线性回归分析13u残差分析残差分析 所谓残差是指由回归方程计算所得的预测值与实际样本值之间的差所谓残差是指由回归方程计算所得的预测值与实际样本值之间的差距,即距,即它是回归模型中它是回归模型中 的估计值。如果回归方程能较好地反映被解释变量的估计值。如果回归方程能较好地反映被解释变量的特征和变化规律,
12、那么残差序列中应不包含明显的规律性和趋势性。的特征和变化规律,那么残差序列中应不包含明显的规律性和趋势性。线性回归分析线性回归分析14u残差分析残差分析均值为均值为0的正态性分析的正态性分析 残差均值为残差均值为0的正态性分析,可以通过绘制残差图进行分析,如果残的正态性分析,可以通过绘制残差图进行分析,如果残差均值为差均值为0,残差图中的点应在纵坐标为,残差图中的点应在纵坐标为0的横线上下随机散落着。正的横线上下随机散落着。正态性可以通过绘制标准化(或学生化)残差的累计概率图来分析态性可以通过绘制标准化(或学生化)残差的累计概率图来分析线性回归分析线性回归分析1516u回归方程的统计检验回归方
13、程的统计检验u残差分析独立性分析 绘制残差序列的序列图以样本期(或时间)为横坐标,残差为纵坐标,如果残差随时间的推移呈规律性变化,则存在一定的正或负相关性。计算残差的自相关系数取值在-1到+1之间,接近于+1表明序列存在正自相关性。DW(DurbinWatson)检验DW取值在0至4之间,直观判断标准是DW=4,残差序列完全负自相关;DW=2,完全无自相关;DW=0,完全正自相关。线性回归分析线性回归分析1617u回归方程的统计检验回归方程的统计检验u残差分析残差分析异方差分析异方差分析 绘制残差图绘制残差图如果残差的方差随着解释变量值的增加呈增加(或减少)如果残差的方差随着解释变量值的增加呈
14、增加(或减少)的趋势,说明出现了异方差现象。的趋势,说明出现了异方差现象。线性回归分析线性回归分析1718u回归方程的统计检验回归方程的统计检验u残差分析残差分析探测样本中的异常值和强影响点(对于探测样本中的异常值和强影响点(对于y值)值)标准化残差标准化残差ZRE由于残差是服从均值为由于残差是服从均值为0的正态分布,因此可以根据的正态分布,因此可以根据3准则准则进行判断,首先对残差进行标准化进行判断,首先对残差进行标准化 ,绝对值大于,绝对值大于3对应的观察值为异常值。对应的观察值为异常值。学生化残差学生化残差SRE剔除残差剔除残差DRE(或剔除学生化残差(或剔除学生化残差SDRE)上述上述
15、SRE、SDRE的直观判断标准同标准化残差的直观判断标准同标准化残差ZRE。1819线性回归分析线性回归分析1920多元回归分析中的其他问题多元回归分析中的其他问题u变量筛选问题变量筛选问题向前筛选策略向前筛选策略 解释变量不断进入回归方程的过程,首先选择与被解释变量具有最高线解释变量不断进入回归方程的过程,首先选择与被解释变量具有最高线性相关系数的变量进入方程,并进行各种检验;其次在剩余的变量中挑选性相关系数的变量进入方程,并进行各种检验;其次在剩余的变量中挑选与解释变量偏相关系数最高并通过检验的变量进入回归方程。与解释变量偏相关系数最高并通过检验的变量进入回归方程。向后筛选策略向后筛选策略
16、 变量不断剔除出回归方程的过程,首先所有变量全部引入回归方程并检变量不断剔除出回归方程的过程,首先所有变量全部引入回归方程并检验,然后在回归系数显著性检验不显著的一个或多个变量中,剔除验,然后在回归系数显著性检验不显著的一个或多个变量中,剔除t检验值检验值最小的变量。最小的变量。逐步筛选策略逐步筛选策略 向前筛选与向后筛选策略的综合向前筛选与向后筛选策略的综合线性回归分析线性回归分析2021多元回归分析中的其他问题多元回归分析中的其他问题u变量多重共线性问题变量多重共线性问题容忍度容忍度Tol容忍度值越接近于容忍度值越接近于1,表示多重共线性越弱。,表示多重共线性越弱。SPSS变量多重共线性的
17、要变量多重共线性的要求不很严格,只是在容忍度值太小时给出相应警告信息。求不很严格,只是在容忍度值太小时给出相应警告信息。方差膨胀因子方差膨胀因子VIF膨胀因子是容忍度的倒数,越接近于膨胀因子是容忍度的倒数,越接近于1,表示解释变量间的多重共线性越,表示解释变量间的多重共线性越弱。通常如果弱。通常如果VIFi大于等于大于等于10,说明解释变量,说明解释变量xi与其余解释变量之间有与其余解释变量之间有严重的多重共线性。严重的多重共线性。特征根和方差比特征根和方差比这里的特征根是指相关系数矩阵的特征根。如果最大特征根远远大于其这里的特征根是指相关系数矩阵的特征根。如果最大特征根远远大于其他特征根的值
18、,则说明这些解释变量之间具有相当多的重叠信息。他特征根的值,则说明这些解释变量之间具有相当多的重叠信息。条件指数条件指数ki10 ki 100时,认为多重共线性较强,时,认为多重共线性较强,ki 100时,认为多重共线性时,认为多重共线性很严重很严重线性回归分析线性回归分析2122u回归方程的统计检验回归方程的统计检验u残差分析残差分析异方差分析异方差分析 等级相关分析等级相关分析得到残差序列后首先对其取绝对值,然后计算出残差和解得到残差序列后首先对其取绝对值,然后计算出残差和解释变量的秩,最后计算释变量的秩,最后计算Spearman等级相关系数,并进行等级相关系数,并进行等级相关分析。具体过
19、程见相关分析相关章节。等级相关分析。具体过程见相关分析相关章节。线性回归分析线性回归分析22回归分析步骤:回归分析步骤:第一,分析大量样本变量观测值,确定变量之间的数学关系式第一,分析大量样本变量观测值,确定变量之间的数学关系式回归方回归方程程;第二,分析其回归方程的第二,分析其回归方程的可信程度可信程度,区分影响显著的和影响不显著的自变,区分影响显著的和影响不显著的自变量;量;第三,根据已确定的数学关系,预测(第三,根据已确定的数学关系,预测(y)或者控制)或者控制(x)特定变量的取值,并特定变量的取值,并给出给出预测或控制预测或控制的精确度。的精确度。线性回归分析线性回归分析23线性回归的
20、使用条件:线性回归的使用条件:线性趋势线性趋势,即自变量与因变量的关系是线性的。即自变量与因变量的关系是线性的。独立性独立性,因变量因变量Y的取值相互独立。反映在方程中即残差独立。的取值相互独立。反映在方程中即残差独立。正态性正态性,即自变量的任何一个线性组合,即自变量的任何一个线性组合,Y应该服从正态分布。反映在应该服从正态分布。反映在方程中即残差方程中即残差Ei服从正态分布。服从正态分布。方差齐性方差齐性,自变量的任何一个线性组合,自变量的任何一个线性组合,Y的方差相同。的方差相同。一元线性回归分析一元线性回归分析24 2.一元线性回归分析的一元线性回归分析的SPSS操作操作打开【分析】打
21、开【分析】【回归】【回归】【线性】,出现线性【线性】,出现线性回归主对话回归主对话 框,进行框,进行SPSS程序命令操作,程序命令操作,即对各子对话框即对各子对话框进行设置。进行设置。线性回归分析线性回归分析25(1)变量)变量 因变量因变量 被选入该文本框中的变量为线性回归模型中的被解释被选入该文本框中的变量为线性回归模型中的被解释变量,数值类型为数值型。如果被解释变量为分类变量,则可以用变量,数值类型为数值型。如果被解释变量为分类变量,则可以用二元或者多元二元或者多元Logistic模型等建模分析。模型等建模分析。自变量自变量 被选入该列表框中的变量为线性模型中的解释变量,被选入该列表框中
22、的变量为线性模型中的解释变量,数值类型一般为数值型。如果解释变量为分类变量或定性变量,可数值类型一般为数值型。如果解释变量为分类变量或定性变量,可以用虚拟变量(哑变量)表示。如果选择多个自变量,可将自变量以用虚拟变量(哑变量)表示。如果选择多个自变量,可将自变量分组成块,通过分组成块,通过“上一张上一张”和和“下一张下一张”按钮对不同的变量子集指按钮对不同的变量子集指定不同的进入方法。定不同的进入方法。线性回归分析线性回归分析26总离差平方和可分解为(2)方法)方法 用于选择线性回归中变量的进入和剔除方法,来建立多个回归模型用于选择线性回归中变量的进入和剔除方法,来建立多个回归模型进入,该方法
23、表示自变量列表中进入,该方法表示自变量列表中所有的变量所有的变量都进入回归模型。都进入回归模型。逐步,该方法是一个动态过程,表示具有逐步,该方法是一个动态过程,表示具有F统计量的统计量的概率最小概率最小的自变量的自变量被选进回归模型;对于已经在回归方程中的变量,被选进回归模型;对于已经在回归方程中的变量,如果它们的如果它们的F统计量的概率变得足够大,则移除这些变量,统计量的概率变得足够大,则移除这些变量,直到不再有自变量符合进入或移除的条件,该方法终止。直到不再有自变量符合进入或移除的条件,该方法终止。删除,该方法表示建立回归模型前设定一定条件,然后根据删除,该方法表示建立回归模型前设定一定条
24、件,然后根据条件删除自变量。条件删除自变量。向后,该方法表示首先将自变量列表中的所有自变量选入到回归模型中,然向后,该方法表示首先将自变量列表中的所有自变量选入到回归模型中,然后按后按顺序移除顺序移除,最先删除与因变量之间的部分,最先删除与因变量之间的部分相关性最小相关性最小的那个变量,移除的那个变量,移除第一个变量后,得到新的方程,又将与因变量之间的部分相关性最小的那个第一个变量后,得到新的方程,又将与因变量之间的部分相关性最小的那个变量删除,直到方程中没有满足消除条件的变量,过程结束。变量删除,直到方程中没有满足消除条件的变量,过程结束。向前,该方法与向前,该方法与“向后向后”恰好相反,是
25、将自变量按顺序选入到回归模型中。恰好相反,是将自变量按顺序选入到回归模型中。首先选入与因变量之间具有首先选入与因变量之间具有最大相关性的最大相关性的、满足选入条件的变量进入回归模、满足选入条件的变量进入回归模型中,然后再考虑下一个变量,直到没有满足条件的变量时,过程结束。型中,然后再考虑下一个变量,直到没有满足条件的变量时,过程结束。线性回归分析线性回归分析27(3)选择变量)选择变量 该文本框主要用于指定分析个案的选择规则,当回归分析中包含由选该文本框主要用于指定分析个案的选择规则,当回归分析中包含由选择规则定义的个案,则需要进行设置。择规则定义的个案,则需要进行设置。线性回归:设置规则子对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 回归 分析 大全 课件
限制150内