spss教程第三章--相关分析与回归模型的建立与分析讲课教案.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《spss教程第三章--相关分析与回归模型的建立与分析讲课教案.doc》由会员分享,可在线阅读,更多相关《spss教程第三章--相关分析与回归模型的建立与分析讲课教案.doc(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Good is good, but better carries it.精益求精,善益求善。spss教程第三章-相关分析与回归模型的建立与分析-第三章相关分析与回归模型的建立与分析相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。u 本章主要内容:1、 对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。2、 建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Li
2、near)和曲线估计(CurveEstimation)。u 数据条件:参与分析的变量数据是数值型变量或有序变量。3.1相关分析在SPSS中,可以通过Analyze菜单进行相关分析(Correlate),Correlate菜单如图3.1所示。图3.1Correlate相关分析菜单3.1.1简单相关分析两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系。一是通过散点图直观地显示变量之间关系,二是通过相关系数准确地反映两变量的关系程度。3.1.1.1散点图SPSS软件的绘图命令集中在Graphs菜单。下面通过例题来介绍具体操作方法。例1:数据库SY-8中的变量X表示山东省人均国内生
3、产总值,Y表示山东省城镇居民的消费额(资料来源:山东省2003年统计年鉴),现画出散点图来观察两个变量的关联程度。具体操作步骤如下:首先打开数据SY-8,然后单击GraphsScatter,打开Scatterplot散点图对话框,如图3.2所示。然后选择需要的散点图,图中的四个选项依次是:Simple简单散点图Matrix矩阵散点图Overlay重叠散点图3-D三维散点图图3.2散点图对话框如果只考虑两个变量,可选择简单的散点图Simple,然后点击Define,打开SimpleScatterplot对话框,如图3.3所示。图3.3SimpleScatterplot对话框选择变量分别进入X轴和
4、Y轴,点击OK后就可以得到散点图,见图3.4。从下面输出的人均国内生产总值与城镇居民消费额的散点图3.4中可以粗略地看出,两个变量之间有强正相关的线性关系。图3.4散点图3.1.1.2简单相关分析操作简单相关分析是指两个变量之间的相关分析,主要是指对两变量之间的线性相关程度作出定量分析。仍然数据SY-8为例,说明居民收入与某商品的销售量两变量的相关分析过程,具体操作如下:1、打开数据库SY-8后,单击AnalyzeCorrelateBivariate打开Bivariate对话框,见图3.5所示。图3.5Bivariate:Correlation两变量相关分析对话框2、从左边的变量框中选择需要考
5、察的两个变量进入Variables框内,从CorrelationCoefficients栏内选择相关系数的种类,有Pearson相关系数,Kendalls一致性系数和Spearman等级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种。3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述,见图3.6所示。图3.6BivariateCorrelation:Options对话框4、单击OK,可以得到相关分析的结果。从表3.1(a)可以得到两个变量的基本统计描述,从表(b)中可以得到相关系数及对相关系数的检验结果,由于尾概率就小于0.01,故说明两变量之间存
6、在着显著的线性相关性。表3.1(a)基本统计描述DescriptiveStatisticsMeanStd.DeviationN城镇居民消费额(元)2582.28002335.9638425人均国内生产总值(元)3689.88003701.5079825表3.1(b)相关系数检验Correlations城镇居民消费额(元)人均国内生产总值(元)城镇居民消费额(元)PearsonCorrelation1.998(*)Sig.(2-tailed).000N2525人均国内生产总值(元)PearsonCorrelation.998(*)1Sig.(2-tailed).000.N2525*Correla
7、tionissignificantatthe0.01level(2-tailed).从表3.1(b)中可以看到两个变量相关性分析的结果:相关系数是0.998,相关程度非常高,且假设检验的P值远远地小于0.05,可以认为居民收入与某产品的销量存在线性正相关关系。3.1.2偏相关分析简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。例2:为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、打火石销量作为影
8、响因素,得数据表3.2。试求火柴销售量与煤气户数的偏相关系数.表3.2火柴销量及影响因素表(见参考文献1)年份火柴销售量(万件)煤气户数(万户)卷烟销量(百箱)蚊香销量(十万盒)打火石销量(百万粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.
9、3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17解:根据数据表建立数据文件SY-9,求解火柴销售量与煤气户数的偏相关系数具体操作如下:1、首先打开数据文件SY-9,单击AnalyzeCorrelatePartial,打开PartialCorrelations对话框,见图3
10、.7所示。图3.7PartialCorrelations2、从左边框内选择要考察的两个变量进入Variables框内,其它客观存在的变量作为控制变量进入Controllingfor框内,如本例中考察煤气户数与火柴销量的偏相关系数进入Variables框内,其它相关变量(除年份外)进入Controllingfor框内。3、单击Options按纽,打开Options对话框如图3.8所示。从Statistics栏中选择输出项,有平均值及标准差,Zero-ordercorrelations表示在输出偏相关系数的同时输出变量间的简单相关系数。另外还有缺失值的处理方式。本例中选择简单相关系数。图3.8Pa
11、rtialCorrelate:Options对话框4、选择结束后,单击OK得输出结果,如表3.3所示。表3.3偏相关分析输出表-PARTIALCORRELATIONCOEFFICIENTS-ZeroOrderPartials简单相关火柴销量煤气户数打火石量蚊香销量卷烟销量火柴销量1.0000.8260-.4902.8083.8788(简单相关系数)(0)(13)(13)(13)(13)(自由度)P=.P=.000P=.064P=.000P=.000(P值)煤气户数.82601.0000-.0230.9489.9029(13)(0)(13)(13)(13)P=.000P=.P=.935P=.00
12、0P=.000打火石量-.4902-.02301.0000-.0070-.0295(13)(13)(0)(13)(13)P=.064P=.935P=.P=.980P=.917蚊香销量.8083.9489-.00701.0000.9030(13)(13)(13)(0)(13)P=.000P=.000P=.980P=.P=.000卷烟销量.8788.9029-.0295.90301.0000(13)(13)(13)(13)(0)P=.000P=.000P=.917P=.000P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoeff
13、icientcannotbecomputed_-PARTIALCORRELATIONCOEFFICIENTS偏相关系数-Controllingfor(控制变量).打火石量蚊香销量卷烟销量火柴销量煤气户数火柴销量1.0000.6046(偏相关系数)(0)(10)(自由度)P=.P=.037(P值)煤气户数.60461.0000(10)(0)P=.037P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed表中的上半部分是简单相关系数,下半部分是偏相关系数。从表中可以看出,火柴销量与煤
14、气户数的简单相关系数为0.8260,自由度为13,检验的P值为0.000;而偏相关系数为0.6046,自由度为10,检验的P值为0.037,表示煤气户数对火柴销量的真实影响是显著的。3.2线性回归分析线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象(因变量)与影响因素(自变量)之间的线性函数关系式。由于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。这一节将专门介绍SPSS软件的线性回归分析的操作方法,包括求回归系数,给出回归模型的各项检验统计量值及相应的概率,对输出结果的分析等相关内容
15、。3.2.1线性回归模型假设条件与模型的各种检验1、线性回归的假设理论(1)正态性假设:即所研究的变量均服从正态分布;(2)等方差假设:即各变量总体的方差是相等的;(3)独立性假设,即各变量之间是相互独立的;(4)残差项无自相关性,即误差项之间互不相关,Cov(ei,ej)=02、线性回归模型的检验项目(1)回归系数的检验(t检验)。(2)回归方程的检验(F检验)。(3)拟合程度判定(可决系数R2)。(4)D.W检验(残差项是否自相关)。(5)共线性检验(多元线性回归)。(6)残差图示分析(判断异方差性和残差序列自相关)。3.2.2线性回归分析的具体步骤SPSS软件中进行线性回归分析的选择项为
16、AnalyzeRegressionLinear。如图3.9所示。下面通过例题介绍线性回归分析的操作过程。图3.9Regression分析功能菜单例3.仍然用例2的数据,考察火柴销售量与各影响因素之间的相关关系,建立火柴销售量对于相关因素煤气户数、卷烟销量、蚊香销量、打火石销量的线性回归模型,通过对模型的分析,找出合适的线性回归方程。解:建立线性回归模型的具体操作步骤如下:1、打开数据文件SY-9,单击AnalyzeRegressionLinear打开Linear对话框如图3.10所示。2、从左边框中选择因变量Y进入Dependent框内,选择一个或多个自变量进入Independent框内。从M
17、ethod框内下拉式菜单中选择回归分析方法,有强行进入法(Enter),消去法(Remove),向前选择法(Forward),向后剔除法(Backward)及逐步回归法(Stepwise)五种。本例中选择逐步回归法(Stepwise)。图3.10LinearRegression对话框3、单击Statistics,打开LinearRegression:Statistics对话框,可以选择输出的统计量如图3.11所示。l RegressionCoefficients栏,回归系数选项栏。Estimates(系统默认):输出回归系数的相关统计量:包括回归系数,回归系数标准误、标准化回归系数、回归系数检
18、验统计量(t值)及相应的检验统计量概率的P值(sig)。本例中只选择此项。Confidenceintervals:输出每一个非标准化回归系数95的置信区间。Covariancematrix:输出协方差矩阵。l 与模型拟合及拟合效果有关的选择项。Modelfit是默认项。能够输出复相关系数R、R2及R2修正值,估计值的标准误,方差分析表。Rsquaredchange:引入或剔除一个变量时,R2的变化。Descriptives:基本统计描述。PartandPartialcorrelations:相关系数及偏相关系数。Collinearitydiagnostics:共线性诊断。主要对于多元回归模型,
19、分析各自变量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指数等。本例中选择上面所有的统计项。l Residuals残差栏Durbin-Watson:D.W检验.Casewisediagnostics:奇异值诊断,有两个选项:Outliersoutside()standarddeviations:奇异值判据,默认项标准差3。Allcase输出所有观测量的残差值。本例中选择D.W检验及奇异值诊断,选择标准差为2,即置信度约为95%。图3.11LinearRegression:Statistics4、如果需要观察图形,可单击Plots按纽,打开LinearRegression:Pl
20、ots对话框如图3.12所示。在此对话框中可以选择所需要的图形。图3.12LinearRegression:Plots对话框在左上角的源变量框中,选择Dependent进入X(或Y)轴变量框,选择其它变量进入Y(或X)轴变量框,除因变量外,其客观存在变量依次是:ZPRED:标准化预测值,ZRESID:标准化残差,DRESID:剔除残差,ADJPRED:修正后预测值,SRESID学生化残差,SDRESID:学生化剔除残差。l StandardizedResidualPlots栏,标准化残差图类型,有选择项:Histogram:标准化残差直方图Normalprobabilityplot标准化残差序
21、列的正态分布概率图.Produceallpartialplots依次绘制因变量和所有自变量的散布图本例中选择因变量Dependent与标准化残差ZRESID的残差图。5、单击Options按纽,打开LinearRegression:Options对话框,如图3.13所示。可以从中选择模型拟合判断准则SteppingMethodCriteria及缺失值的处理方式。图3.13LinearRegression:Options对话框l SteppingMethodCriteria栏,设置变量引入或剔除模型的判别标准。UseprobabilityofF:采用F检验的概率为判别依据。UseFvalue:采
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 教程 第三 相关 分析 回归 模型 建立 讲课 教案
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内