第九章-SPSS的线性回归分析优秀PPT.ppt
《第九章-SPSS的线性回归分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第九章-SPSS的线性回归分析优秀PPT.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 SPSS SPSS的线性回来分析的线性回来分析一、回来分析概述一、回来分析概述(一一)回来分析理解回来分析理解(1)“回来回来”的含义的含义Galton探讨探讨父亲身高和儿子身高的关系时的独特发探讨探讨父亲身高和儿子身高的关系时的独特发觉。觉。(2)回来线的获得方式一:局部平均回来线的获得方式一:局部平均 回来曲线上的点给出了相应于每一个回来曲线上的点给出了相应于每一个x(父亲父亲)值的值的y(儿儿子子)平均数的估计平均数的估计(3)回来线的获得方式二:拟和函数回来线的获得方式二:拟和函数使数据拟和于某条曲线;使数据拟和于某条曲线;通过若干参数描述该曲线;通过若干参数描述该曲线;
2、利用已知数据在确定的统计准则下找出参数的估计值利用已知数据在确定的统计准则下找出参数的估计值(得得到回来曲线的近似到回来曲线的近似);一、回来分析概述一、回来分析概述(二二)回来分析的基本步骤回来分析的基本步骤(1)确定自变量和因变量确定自变量和因变量(父亲身高关于儿子身高的回来父亲身高关于儿子身高的回来与儿子身高关于父亲身高的回来是不同的与儿子身高关于父亲身高的回来是不同的)。(2)从样本数据动身确定变量之间的数学关系式,并对回从样本数据动身确定变量之间的数学关系式,并对回来方程的各个参数进行估计。来方程的各个参数进行估计。(3)对回来方程进行各种统计检验。对回来方程进行各种统计检验。(4)
3、利用回来方程进行预料。利用回来方程进行预料。一、回来分析概述一、回来分析概述(三三)参数估计的准则参数估计的准则目标:回来线上的视察值与预料值之间的距离总和达到最小目标:回来线上的视察值与预料值之间的距离总和达到最小最小二乘法最小二乘法(利用最小二乘法拟和的回来直线与样本数据点在垂直方利用最小二乘法拟和的回来直线与样本数据点在垂直方向上的偏离程度最低向上的偏离程度最低)二、一元线性回来分析二、一元线性回来分析(一一)一元回来方程一元回来方程 y=0+1x0为常数项;为常数项;1为为y对对x回来系数,即:回来系数,即:x每变动一个单位所引起每变动一个单位所引起的的y的平均变动的平均变动(二二)一
4、元回来分析的步骤一元回来分析的步骤利用样本数据建立回来方程利用样本数据建立回来方程回来方程的拟和优度检验回来方程的拟和优度检验回来方程的显著性检验回来方程的显著性检验(F检验和检验和t检验检验)残差分析残差分析预料预料Y=a+bX F检验检验T检验检验R2拟拟合合优优度度如如何何,即即X对对Y的说明实力的说明实力线性关系是否显著线性关系是否显著系数是否显著不为零系数是否显著不为零=b三、一元线性回来方程的检验三、一元线性回来方程的检验(一一)拟和优度检验拟和优度检验 R2(1)目的:检验样本视察点聚集在回来直线四周的密目的:检验样本视察点聚集在回来直线四周的密集程度,评价回来方程对样本数据点的
5、拟和程度。集程度,评价回来方程对样本数据点的拟和程度。(2)思路:思路:因为:因为:因变量取值的变更受两个因素的影响因变量取值的变更受两个因素的影响自变量不同取值的影响自变量不同取值的影响其他因素的影响其他因素的影响于是:于是:因变量总变差因变量总变差=自变量引起的自变量引起的+其他因素引其他因素引起的起的即:即:因变量总变差因变量总变差=回来方程可说明的回来方程可说明的+不行说明不行说明的的可证明:因变量总离差平方和可证明:因变量总离差平方和=回来平方和回来平方和+剩余平剩余平方和方和三、一元线性回来方程的检验三、一元线性回来方程的检验(一一)拟和优度检验拟和优度检验 (3)统计量:判定系数
6、统计量:判定系数R2=SSR/SST=1-SSE/SST。R2体现了回来方程所能说明的因变量变差的比例;体现了回来方程所能说明的因变量变差的比例;1-R2则体现了因变量总变差中,回来方程所无法则体现了因变量总变差中,回来方程所无法说明的比例。说明的比例。R2越接近于越接近于1,则说明回来平方和占了因变量总变差,则说明回来平方和占了因变量总变差平方和的绝大部分比例,因变量的变差主要由自变平方和的绝大部分比例,因变量的变差主要由自变量的不同取值造成,回来方程对样本数据点拟合得量的不同取值造成,回来方程对样本数据点拟合得好好在一元回来中在一元回来中R2=r2;因此,从这个意义上讲,判因此,从这个意义
7、上讲,判定系数能够比较好地反映回来直线对样本数据的代定系数能够比较好地反映回来直线对样本数据的代表程度和线性相关性。表程度和线性相关性。三、一元线性回来方程的检验三、一元线性回来方程的检验(二二)回来方程的显著性检验回来方程的显著性检验 F检验检验(1)目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示。示。(2)H0:=0 即:回来系数与即:回来系数与0无显著差异无显著差异(3)利用利用F检验,构造检验,构造F统计量:统计量:F=平均的回来平方和平均的回来平方和/平均的剩余平方和平均的剩余平方和F(1,n
8、-1-1)假如假如F值较大,则说明自变量造成的因变量的线性变动远大于随机因素对因变量的值较大,则说明自变量造成的因变量的线性变动远大于随机因素对因变量的影响,自变量于因变量之间的线性关系较显著影响,自变量于因变量之间的线性关系较显著(4)计算计算F统计量的值和相伴概率统计量的值和相伴概率p(5)推断推断pregression-linear(2)选择一个变量为因变量进入选择一个变量为因变量进入dependent框框(3)选择一个变量为自变量进入选择一个变量为自变量进入independent框框(4)enter:所选变量全部进入回来方程:所选变量全部进入回来方程(默认方法默认方法)(5)对样本进行
9、筛选对样本进行筛选(selection variable)利用满足确定条件的样本数据进行回来分析利用满足确定条件的样本数据进行回来分析(6)指定作图时各数据点的标记变量指定作图时各数据点的标记变量(case labels)四、一元线性回来分析操作四、一元线性回来分析操作(二二)statistics选项选项(1)基本统计量输出基本统计量输出Estimates:默认。显示回来系数相关统计量。:默认。显示回来系数相关统计量。confidence intervals:每个非标准化的回来系数:每个非标准化的回来系数95%的置信区间。的置信区间。Descriptive:各变量均值、标准差和相关系数单侧检验
10、概率。:各变量均值、标准差和相关系数单侧检验概率。Model fit:默认。判定系数、估计标准误差、方差分析表、容忍度:默认。判定系数、估计标准误差、方差分析表、容忍度(2)Residual框中的残差分析框中的残差分析Durbin-waston:D-W值值casewise diagnostic:异样值:异样值(奇异值奇异值)检测检测(输出预料值及残差和标输出预料值及残差和标准化残差准化残差)四、一元线性回来分析操作四、一元线性回来分析操作(三三)plot选项:图形分析选项:图形分析 Standardize residual plots:绘制残差序列直方图和累计概率图,检:绘制残差序列直方图和累
11、计概率图,检测残差的正态性测残差的正态性绘制指定序列的散点图,检测残差的随机性、异方差性绘制指定序列的散点图,检测残差的随机性、异方差性ZPRED:标准化预料值:标准化预料值 ZRESID:标准化残差:标准化残差SRESID:学生化残差:学生化残差produce all partial plot:绘制因变量和全部自变量之间的散点图:绘制因变量和全部自变量之间的散点图五、线性回来方程的残差分析五、线性回来方程的残差分析(一一)残差序列的正态性检验残差序列的正态性检验 绘制标准化残差的直方图或累计概率图绘制标准化残差的直方图或累计概率图(二二)残差序列的随机性检验残差序列的随机性检验绘制残差和预料
12、值的散点图,应随机分布在经过零的一条直绘制残差和预料值的散点图,应随机分布在经过零的一条直线上下线上下五、线性回来方程的残差分析五、线性回来方程的残差分析(三三)残差序列独立性检验残差序列独立性检验 残差序列是否存在后期值与前期值相关的现象,利用残差序列是否存在后期值与前期值相关的现象,利用D D。W(Durbin-Watson)W(Durbin-Watson)检验检验d-w=0d-w=0:残差序列存在完全正自相关;:残差序列存在完全正自相关;d-w=4d-w=4:残差序列存:残差序列存在完全负自相关;在完全负自相关;0d-w20d-w2:残差序列存在某种程度的正:残差序列存在某种程度的正自相
13、关;自相关;2d-w42d-w4:残差序列存在某种程度的负自相关;:残差序列存在某种程度的负自相关;d-w=2d-w=2:残差序列不存在自相关。:残差序列不存在自相关。残差序列不存在自相关,可以认为回来方程基本概括了因残差序列不存在自相关,可以认为回来方程基本概括了因变量的变更;否则,认为可能一些与因变量相关的因素变量的变更;否则,认为可能一些与因变量相关的因素没有引入回来方程或回来模型不合适或滞后性周期性的没有引入回来方程或回来模型不合适或滞后性周期性的影响。影响。五、线性回来方程的残差分析五、线性回来方程的残差分析(四四)异样值异样值(casewise或或outliers)诊断诊断利用标准
14、化残差不仅可以知道视察值比预料值大或小,并且还知道利用标准化残差不仅可以知道视察值比预料值大或小,并且还知道在确定值上它比大多数残差是大还是小。一般标准化残差的确在确定值上它比大多数残差是大还是小。一般标准化残差的确定值大于定值大于3,则可认为对应的样本点为奇异值,则可认为对应的样本点为奇异值异样值并不总表现出上述特征。当剔除某视察值后,回来方程的标异样值并不总表现出上述特征。当剔除某视察值后,回来方程的标准差显著减小,也可以判定该视察值为异样值准差显著减小,也可以判定该视察值为异样值六、线性回来方程的预料六、线性回来方程的预料(一一)点估计点估计y0(二二)区间估计区间估计 x0为xi的均值
15、时,预料区间最小,精度最高。x0越远离均值,预料区间越大,精度越低。七、多元线性回来分析七、多元线性回来分析(一一)多元线性回来方程多元线性回来方程多元回来方程:多元回来方程:y=0+1x1+2x2+。+kxk 1、2、k为偏回来系数。为偏回来系数。1表示在其他自变量保持不变的状况下,自变量表示在其他自变量保持不变的状况下,自变量x1变动一个单位变动一个单位所引起的因变量所引起的因变量y的平均变动的平均变动(二二)多元线性回来分析的主要问题多元线性回来分析的主要问题回来方程的检验回来方程的检验自变量筛选自变量筛选多重共线性问题多重共线性问题八、多元线性回来方程的检验八、多元线性回来方程的检验(
16、一一)拟和优度检验拟和优度检验(1)判定系数判定系数R2 R是是y和和xi的复相关系数的复相关系数(或视察值与预料值的相关系或视察值与预料值的相关系数数),测定了因变量,测定了因变量y与全部自变量全体之间线性相与全部自变量全体之间线性相关程度关程度(2)调整的调整的R2 考虑的是平均的剩余平方和,克服了因自变量增加而考虑的是平均的剩余平方和,克服了因自变量增加而造成造成R2也增大的弱点也增大的弱点在某个自变量引入回来方程后,假如该自变量是志向在某个自变量引入回来方程后,假如该自变量是志向的且对因变量变差的说明说明是有意义的,那么必的且对因变量变差的说明说明是有意义的,那么必定使得均方误差削减,
17、从而使调整的定使得均方误差削减,从而使调整的R2得到提高;得到提高;反之,假如某个自变量对因变量的说明说明没有意反之,假如某个自变量对因变量的说明说明没有意义,那么引入它不会造成均方误差削减,从而调整义,那么引入它不会造成均方误差削减,从而调整的的R2也不会提高。也不会提高。八、多元线性回来方程的检验八、多元线性回来方程的检验(二二)回来方程的显著性检验回来方程的显著性检验 F(1)目的:检验全部自变量与因变量之间的线性关系是否显著,是否可用线目的:检验全部自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示。性模型来表示。(2)H0:1=2=k=0 即:全部回来系数同时与即:全部回来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 SPSS 线性 回归 分析 优秀 PPT
限制150内