「相关分析与回归分析SPSS实现」.pdf
相关分析与回归分析 一、试验目标与要求 本试验项目的目的是学习并使用 SPS软件进行相关分析和回归分析,具体包括:(1)皮尔逊pars简单相关系数的计算与分析(2)学会在PSS上实现一元及多元回归模型的计算与检验。(3)学会回归模型的散点图与样本方程图形。(4)学会对所计算结果进行统计分析说明。(5)要求试验前,了解回归分析的如下内容。参数、的估计 回归模型的检验方法:回归系数的显著性检验(t检验);回归方程显著性检验(F-检验)。二、试验原理 1相关分析的统计学原理 相关分析使用某个指标来表明现象之间相互依存关系的密切程度。用来测度简单线性相关关系的系数是Paron简单相关系数。2.回归分析的统计学原理 相关关系不等于因果关系,要明确因果关系必须借助于回归分析。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。线性回归数学模型如下:iikkiiixxxy22110 在模型中,回归系数是未知的,可以在已有样本的基础上,使用最小二乘法对回归系数进行估计,得到如下的样本回归函数:iikkiiiexxxy22110 回归模型中的参数估计出来之后,还必须对其进行检验。如果通过检验发现模型有缺陷,则必须回到模型的设定阶段或参数估计阶段,重新选择被解释变量和解释变量及其函数形式,或者对数据进行加工整理之后再次估计参数。回归模型的检验包括一级检验和二级检验。一级检验又叫统计学检验,它是利用统计学的抽样理论来检验样本回归方程的可靠性,具体又可以分为拟和优度评价和显著性检验;二级检验又称为经济计量学检验,它是对线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验等。三、试验演示内容与步骤.连续变量简单相关系数的计算与分析 在上市公司财务分析中,常常利用资产收益率、净资产收益率、每股净收益和托宾Q值4个指标来衡量公司经营绩效。本试验利用SS对这个指标的相关性进行检验。操作步骤与过程:打开数据文件“上市公司财务数据(连续变量相关分析).sav”,依次选择“【分析】【相关】【双变量】”打开对话框如图,将待分析的4个指标移入右边的变量列表框内。其他均可选择默认项,单击ok提交系统运行。图.1 Bivarat Crelatio对话框 结果分析:表给出了Pan简单相关系数,相关检验t统计量对应的p值。相关系数右上角有两个星号表示相关系数在0.01的显著性水平下显著。从表中可以看出,每股收益、净资产收益率和总资产收益率3个指标之间的相关系数都在0.8以上,对应的p值都接近0,表示3个指标具有较强的正相关关系,而托宾Q值与其他3个变量之间的相关性较弱。表5.1 Peaon简单相关分析 Crrlatios 每股收益率 净资产收益率 资产收益率 托宾Q值 每股收益率 Pearsn oreaton .877(*).24(*)-.07 Si.(2tied).000 0.19 N 31 315 315 35 净资产收益率 Peaon Correlo.87(*)1.808(*)-001 S.(2-aile).0 000.3 N 315 315 31 31 资产收益率 Pears Crlation.82(*).808(*)1.011.(-tailed).000.00 .84 15 315 315 托宾Q值 Parsn Crrelain-.03-.01 1 1 ig.(2-tailed).199.98.849.N 15 35 31 315*Corrlaio is sigificn at he 0.01 eve(2-tailed).2一元线性回归分析 实例分析:家庭住房支出与年收入的回归模型 在这个例子里,考虑家庭年收入对住房支出的影响,建立的模型如下:iixiy 其中,yi是住房支出,xi是年收入 线性回归分析的基本步骤及结果分析:(1)绘制散点图 打开数据文件,选择【图形】【旧对话框】-【散点/点状】,如图5.所示。图.2 散点图对话框 选择简单分布,单击定义,打开子对话框,选择X变量和Y变量,如图.3所示。单击o提交系统运行,结果见图54所示。图53 Simple Scatteplot 子对话框 从图上可直观地看出住房支出与年收入之间存在线性相关关系。图5.4 散点图(2)简单相关分析 选择【分析】【相关】【双变量】,打开对话框,将变量“住房支出”与“年收入”移入vrbes列表框,点击ok运行,结果如表5.所示。表52 住房支出与年收入相关系数表 orrelatios 住房支出(千美元)年收入(千美元)住房支出(千美元)Pearsn Correlatn 1.966(*)ig.(2taild).00 N 20 年收入(千美元)Pearson Corrlatio.96(*)1 Sig.(2-taed).00.N 20*Correan is sgifcan at the 0.0 level(2taild).从表中可得到两变量之间的皮尔逊相关系数为0.96,双尾检验概率p值尾0.00【回归】【线性】”,打开Liear eression 对话框。将变量住房支出y移入Depndnt列表框中,将年收入x移入Independens列表框中。在Mthd 框中选择E 选项,表示所选自变量全部进入回归模型。