SPSS 回归与相关分析.pptx
相关和回归分析相关和回归分析相关分析相关分析(correlation analysis)一元回归分析一元回归分析(linear regression)曲线拟合曲线拟合(curve estimation)多元回归分析多元回归分析(multiple regression)非线性回归分析非线性回归分析(nonlinear regression)第1页/共23页相关和回归分析相关和回归分析相关分析和回归分析的任务相关分析和回归分析的任务研究对象:统计关系研究对象:统计关系相关相关分析旨在反映变量相互之间线性关系的强弱程度,无方向性,不考分析旨在反映变量相互之间线性关系的强弱程度,无方向性,不考虑因果关系。虑因果关系。回归分析侧重于考察一个或几个变量(自变量)的变化对另一个变量回归分析侧重于考察一个或几个变量(自变量)的变化对另一个变量(应变量)的影响程度,并通过一定的数学表达式来描述这种关系。具(应变量)的影响程度,并通过一定的数学表达式来描述这种关系。具方向性,通常包含因果关系。方向性,通常包含因果关系。第2页/共23页绘制散点图绘制散点图目的将相互关联的变量数据对将相互关联的变量数据对(X,Y)(X,Y)作为二维平面的座标点,构建直角座标作为二维平面的座标点,构建直角座标图,即图,即散点图散点图,以探究两变量间数量变化的趋势,为相关或回归分析提,以探究两变量间数量变化的趋势,为相关或回归分析提供初步的思路。供初步的思路。方法 GraphsInteractives Scatterplot第3页/共23页实例实例用已知浓度用已知浓度X的免疫球蛋白的免疫球蛋白A(IgA,g/ml)作火箭免作火箭免疫电泳疫电泳,由于抗体抗原反应受扩散浓度梯度影响,形由于抗体抗原反应受扩散浓度梯度影响,形成的反应带呈火箭状。测得火箭高度成的反应带呈火箭状。测得火箭高度Y(mm)如下表所如下表所示,试分析抗体浓度与火箭高度的相互关系。示,试分析抗体浓度与火箭高度的相互关系。X(g/ml)0.20.40.60.81.01.21.41.6Y(mm)7.612.315.718.218.721.422.623.8先作散点图观察第4页/共23页实例实例-绘制散点图绘制散点图步骤一:步骤一:步骤一:步骤一:Graphs GraphsInteractiveInteractiveScatterplotScatterplot第5页/共23页实例实例-绘制散点图绘制散点图步骤二:步骤二:步骤二:步骤二:确定横、纵确定横、纵确定横、纵确定横、纵座标座标座标座标输出散点图输出散点图输出散点图输出散点图第6页/共23页相关分析相关分析作用:用相关系数用相关系数(r)(r)体现两个变量间的线性关系程度。体现两个变量间的线性关系程度。r:-1,+1r:-1,+1;r=1:r=1:完全正相关;完全正相关;r=-1:r=-1:完全负相完全负相关;关;r=0:r=0:无线性相关。无线性相关。说明:相关系数只是较好地度量了两变量间的线性相关相关系数只是较好地度量了两变量间的线性相关程度,不能描述非线性关系。程度,不能描述非线性关系。数据中的极端值对相关系数影响较大。数据中的极端值对相关系数影响较大。步骤AnalyzeCorrelate Bivariate第7页/共23页实例实例-相关分析相关分析(数据同上数据同上)步骤一:步骤一:步骤一:步骤一:Analyze AnalyzeCorrelateCorrelateBivariateBivariate步骤二:步骤二:步骤二:步骤二:选择要分析的选择要分析的选择要分析的选择要分析的变量变量变量变量选择相关系数选择相关系数选择相关系数选择相关系数计算方法计算方法计算方法计算方法(默认(默认(默认(默认PearsonPearson法)法)法)法)第8页/共23页实例实例-相关分析相关分析(结果输出结果输出)相关分析列联表相关分析列联表相关分析列联表相关分析列联表相关系数相关系数相关系数相关系数r=0.969r=0.969对零假设对零假设对零假设对零假设(r=0r=0)的检验)的检验)的检验)的检验结果显示:结果显示:结果显示:结果显示:P=0.000P=0.0000.010.01否定零假设即否定零假设即否定零假设即否定零假设即X X和和和和Y Y极显著相关极显著相关极显著相关极显著相关第9页/共23页一元线性回归分析一元线性回归分析一元线性回归方程:a a为常数项;为常数项;b b为为Y Y对对X X回归系数回归系数步骤:AnalyzeRegression Linear第10页/共23页一元线性回归分析一元线性回归分析回归方程的显著性检验目的目的:检验自变量与因变量之间的线性关系是否显检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示。著,是否可用线性模型来表示。检验方法:检验方法:1.1.t t检验:检验回归系数检验:检验回归系数b b是否显著不等于是否显著不等于0 02.2.F F检验:检验回归平方和(检验:检验回归平方和(SSSSR R)对总平方和)对总平方和(S(SYYYY)的解释是否显著的解释是否显著注:一元回归中注:一元回归中,F,F检验与检验与t t检验等价检验等价,存在存在F=tF=t2 2,两种检验可以相互替代两种检验可以相互替代第11页/共23页实例实例-线性回归分析线性回归分析(数据同上数据同上)步骤一:步骤一:步骤一:步骤一:Analyze AnalyzeRegressionRegressionLinearLinear步骤二:步骤二:步骤二:步骤二:确定因变量确定因变量确定因变量确定因变量(dependent)(dependent)确定自变量确定自变量确定自变量确定自变量(independent)(independent)第12页/共23页实例实例-线性回归分析线性回归分析(结果输出结果输出)表一:相关系数表一:相关系数表一:相关系数表一:相关系数表二:方差分析表二:方差分析表二:方差分析表二:方差分析表三:系数表表三:系数表表三:系数表表三:系数表(a,b)(a,b)F F检验检验检验检验t t检验检验检验检验第13页/共23页曲线拟合曲线拟合目的:在一元回归分析中,因变量与自变量之间的关系在一元回归分析中,因变量与自变量之间的关系不呈线性关系,但通过适当处理不呈线性关系,但通过适当处理,可以转化为线可以转化为线性模型进行回归分析,即曲线拟合或曲线估计。性模型进行回归分析,即曲线拟合或曲线估计。步骤:Analyze Regression Curve estimation第14页/共23页曲线拟合曲线拟合备选的转化模型:对数模型(logarithmic)指数模型(exponential)幂函数模型(power)二次函数模型(quadratic)三次函数模型(cubic)双曲线模型(inverse)S-曲线模型(s-curve)Logistic模型等第15页/共23页实例实例-曲线拟合曲线拟合(数据同上数据同上)步骤一:步骤一:步骤一:步骤一:Analyze AnalyzeRegressionRegressionCurve Curve EstimationEstimation步骤二:步骤二:步骤二:步骤二:选定因变量选定因变量选定因变量选定因变量(dependent)(dependent)选定自变量选定自变量选定自变量选定自变量(independent)(independent)选择曲线模型选择曲线模型选择曲线模型选择曲线模型第16页/共23页实例实例-曲线拟合曲线拟合(结果输出结果输出1)输出表包括:各曲线模型的相关指数(R2)、显著性检验(F-检验)和回归方程参数。根据相关指数选择“最佳”拟合方程,本例中对数模型和三次函数模型R2最大,为“最佳”方程的备选。“最佳”的最终确定需结合专业知识,本例中对数模型更为合适。第17页/共23页实例实例-曲线拟合曲线拟合(结果输出结果输出2)将线性化的方程还原,对(X,Y-hat)作图,比较各方程的拟合程度第18页/共23页实例实例-曲线拟合曲线拟合(结果输出结果输出3)“最佳”拟合模型-对数模型和三次函数模型的拟合效果第19页/共23页多元线性回归分析多元线性回归分析多元线性回归方程多元线性回归方程多元回归方程多元回归方程:Y=:Y=0 0+1 1X X1 1+2 2x x2 2+.+.+k kx xk k1 1、2 2、k k为偏回归系数。为偏回归系数。1 1表示在其他自变量保持不变的情况下,自变量表示在其他自变量保持不变的情况下,自变量X X1 1变动一个单位所引变动一个单位所引起的因变量起的因变量Y Y的平均变动的平均变动多元线性回归分析的主要问题多元线性回归分析的主要问题回归方程的检验回归方程的检验自变量筛选自变量筛选多重共线性问题多重共线性问题第20页/共23页2.5.3 2.5.3 多元线性回归分析多元线性回归分析自变量筛选法自变量筛选法Enter:Enter:所选择的自变量将全部进入建立的回归方程所选择的自变量将全部进入建立的回归方程中,该项为默认方式。对一元线性回归采用较多。中,该项为默认方式。对一元线性回归采用较多。RemoveRemove:将进入方程中的自变量同时剔除。将进入方程中的自变量同时剔除。ForwardForward:向前筛选法,是自变量不断进入回归方向前筛选法,是自变量不断进入回归方程的过程。程的过程。BackwardBackward:向后筛选法,是自变量不断剔除出回归向后筛选法,是自变量不断剔除出回归方程的过程。方程的过程。StepwiseStepwise:逐步筛选法,是逐步筛选法,是“向前法向前法”和和“向后法向后法”的结合的结合第21页/共23页非线性回归分析非线性回归分析意义意义非线性回归过程建立因变量与一组自变量之间的非线性回归过程建立因变量与一组自变量之间的非线性关系。非线性关系。非线性模型可以在自变量与因变量之间达成某种非线性模型可以在自变量与因变量之间达成某种模型,这些任务的完成是依靠迭代估计运算获得。模型,这些任务的完成是依靠迭代估计运算获得。步骤步骤【AnalyzeAnalyze】【RegressionRegression】【NonlinearNonlinear】注意注意在在【Model ExpressionModel Expression】框中输入一个合适的方程,框中输入一个合适的方程,在该方程中,包括变量、参数和常数等。在该方程中,包括变量、参数和常数等。必须为每个参数设置初始值。必须为每个参数设置初始值。第22页/共23页谢谢您的观看!第23页/共23页