回归分析方差分析讲稿.ppt
《回归分析方差分析讲稿.ppt》由会员分享,可在线阅读,更多相关《回归分析方差分析讲稿.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、回归分析方差分析第一页,讲稿共九十二页哦主要内容线性回归线性回归曲线回归曲线回归第二页,讲稿共九十二页哦线性回归线性回归第三页,讲稿共九十二页哦线性回归 一、相关分析与回归分析共性:都是研究两变量之间的关系差异:相关模型回归模型变量 要求X,Y都是随机变量要求X为可控变量,Y变量是随机变量分布 X,Y呈正态分布变量X的条件分布为正态分布第四页,讲稿共九十二页哦二、回归方程的数学模型u模型模型u一元回归一元回归:用于分析两个变量之间的关系用于分析两个变量之间的关系u基本形式是:基本形式是:第五页,讲稿共九十二页哦二、回归方程的数学模型二、回归方程的数学模型模型求解:最小二乘法模型求解:最小二乘法
2、第六页,讲稿共九十二页哦二、回归方程的数学模型二、回归方程的数学模型u模型模型u多元回归:用于分析多元回归:用于分析n个自变量和因变量个自变量和因变量y之间之间的关系的关系u基本形式基本形式第七页,讲稿共九十二页哦二、回归方程的数学模型二、回归方程的数学模型模型求解:模型求解:即要使得即要使得分别对b0,b1,bn求导,并令其一阶导数为0,可求出各个系数第八页,讲稿共九十二页哦二、回归方程的数学模型二、回归方程的数学模型u估计标准误差估计标准误差 是估计是估计y与对应观测值之间的离差平方和与对应观测值之间的离差平方和第九页,讲稿共九十二页哦三、回归方程的选择三、回归方程的选择SPSS中可以提供
3、多元回归分析,当有多中可以提供多元回归分析,当有多个自变量时,不仅要求与因变量相关,且个自变量时,不仅要求与因变量相关,且要求自变量之间彼此尽可能独立。要求自变量之间彼此尽可能独立。SPSS中提供了五种选择:强制进入强制进入ENTER:进入进入“Enter”所选择的所选择的自变量将全部进入建立的回归方程中,该项自变量将全部进入建立的回归方程中,该项为默认方式。为默认方式。强制退出强制退出REMOVE:后进入后进入“Remove”将将进入方程中的自变量同时剔除。进入方程中的自变量同时剔除。第十页,讲稿共九十二页哦向前选择向前选择FORWARD:条件进入条件进入“Forward”根根据据“Opti
4、ons”对话框中的设置,在方程中每次对话框中的设置,在方程中每次加入一个变量,直至加入所有符合条件的变量为加入一个变量,直至加入所有符合条件的变量为止。止。向后剔除向后剔除BACKWARD:先进入先进入“Backward”自自变量框中所有的变量同时进入方程中,然后根据变量框中所有的变量同时进入方程中,然后根据“Options”对话框中的设置,剔除某个变量,对话框中的设置,剔除某个变量,直到所建立的方程中不再含有可剔除的变量为止。直到所建立的方程中不再含有可剔除的变量为止。逐步回归逐步回归STEPWISE:逐步进入逐步进入“Stepwise”根据根据“Options”对话框中的设置,在方程中加对
5、话框中的设置,在方程中加入或剔除单个变量直到所建立的方程中不再含有入或剔除单个变量直到所建立的方程中不再含有可加入或剔除的变量为止。可加入或剔除的变量为止。第十一页,讲稿共九十二页哦四、功能菜单菜单“Analyze-Regression-Linear”对话框设置因变量:设置因变量:“Dependent”栏设置自变量:设置自变量:“Independent(S)”框 “Selection Variable”为控制变量输入栏。控制变量相当于过滤变量,即必须当该变量的值满足设置的条件时,观测量才能参加回归分析。第十二页,讲稿共九十二页哦Regression Coefficients复选框组:定义回归系
6、数的输出情况,选中Estimates可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta;选中Confidence intervals输出每个回归系数的95%可信区间;选中covariance matrix会输出各个自变量的相关矩阵和方差、协方差矩阵。Residuals复选框组:用于选择输出残差诊断的信息,可选的有Durbin-Watson残差序列相关性检验、超出规定的n倍标准误的残差列表。Model fit复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:R,R2和调整的R2,标准误及方差分析表。第十三页,讲稿共九十二页哦R squared chang
7、e复选框:显示模型拟合过程中R2、F值和p值的改变Descriptives复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。Part and partial correlations复选框:显示自变量间的相关、部分相关和偏相关系数。Collinearity diagnostics复选框:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues)、方差膨胀因子(VIF)第十四页,讲稿共九十二页哦散点图“DEPENDNT”因变量。“ZPRED”标准化预测值。“ZRESID”标准化残差。“DRESID”删除残差。“ADJPRED”修正后预测值。“SRES
8、ID”学生氏化残差。“SDRESID”学生氏化删除残差。“Standardized Residual Plots”设置各变量的标准化残差图形输出。其中共包含两个选项:“Histogram”用直方图显示标准化残差。“Normal probability plots”比较标准化残差与正态残差的分布示意图。“Produce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。第十五页,讲稿共九十二页哦SAVE按钮按钮“Predicted Values”预测值栏选项:预测值栏选项:Unstandardized 非标准化预测值。在当前数据文件中新添加一个以字符“PR
9、E_”开头命名的变量,存放根据回归模型拟合的预测值。Standardized 标准化预测值。Adjusted 调整后预测值。S.E.of mean predictions 预测值的标准误。“Distances”距离栏选项:距离栏选项:Mahalanobis:距离。Cooks”:Cook距离。Leverage values:杠杆值。“Prediction Intervals”预测区间选项:预测区间选项:Mean:区间的中心位置。Individual:观测量上限和下限的预测区间。第十六页,讲稿共九十二页哦“Save to New File”保存为新文件:保存为新文件:选中“Coefficient
10、statistics”项将回归系数保存到指定的文件中。“Export model information to XML file”导出统计过程中的回归模型信息到指定XML文件。“Residuals”保存残差选项:保存残差选项:“Unstandardized”非标准化残差。“Standardized”标准化残差。“Studentized”学生氏化残差。“Deleted”删除残差。“Studentized deleted”学生氏化删除残差。“Influence Statistics”统计量的影响。统计量的影响。“DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。“Standardiz
11、ed DfBeta(s)”标准化的DfBeta值。“DiFit”删除一个特定的观测值所引起的预测值的变化。“Standardized DiFit”标准化的DiFit值。“Covariance ratio”删除一个观测值后的协方差矩阵的行列式和带有全部观测值的协方差矩阵的行列式的比率。第十七页,讲稿共九十二页哦设置回归分析的一些选项,有:Stepping Method Criteria单选钮组:设置纳入和排除标准,可按P值或F值来设置。Include constant in equation复选框:用于决定是否在模型中包括常数项,默认选中。Missing Values单选钮组:用于选择对缺失值的
12、处理方式,可以是不分析任一选入的变量有缺失值的记录(Exclude cases listwise)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录(Exclude cases pairwise);将缺失值用该变量的均数代替(Replace with mean)。第十八页,讲稿共九十二页哦五、实例分析考察Employee data.sav文件中,当前工资水平与过去工资,受教育年数,来公司工作时间、工种、来公司前的工作经验和是否为少数民族的线性模型。第十九页,讲稿共九十二页哦结果分析第二十页,讲稿共九十二页哦回归模型统计量:R 是相关系数;R Square 相关系数的平方,又
13、称判定系数,判定线性回归的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例);Adjusted R Square 调整后的判定系数;Std.Error of the Estimate 估计标准误差。第二十一页,讲稿共九十二页哦方差分析表,F值为1622.118,显著性概率是0.000,表明回归极显著。第二十二页,讲稿共九十二页哦第二十三页,讲稿共九十二页哦第二十四页,讲稿共九十二页哦曲线回归曲线回归第二十五页,讲稿共九十二页哦曲线回归的目标选定某一用方程表达式的曲线,使得实际数据与理论数据之间的差异尽可能的小。第二十六页,讲稿共九十二页哦自变量与因变量的关系注:注:本质线性关系又称为拟
14、线性关系,可转换成线性关系,本质线性关系又称为拟线性关系,可转换成线性关系,用最小二乘法的方法求出相关系数用最小二乘法的方法求出相关系数本质非线性关系不能转换成线性关系,仅能用迭代方法或本质非线性关系不能转换成线性关系,仅能用迭代方法或分段平均值法求出分段平均值法求出第二十七页,讲稿共九十二页哦SPSS功能本质线性关系Analyze-Regression-Curve Estimation本质非线性关系Analyze-Regression-NonLinear第二十八页,讲稿共九十二页哦变量关系的基本研究方法做散点图,初步判断两变量的关系,曲线的形状从专业的知识分析,或长期积累的经验找出变量间的函
15、数类型建立简单、适合的模型第二十九页,讲稿共九十二页哦SPSS中的11种拟线性模型模型名称模型名称回归方程回归方程相应的线性回归方程相应的线性回归方程Linear(线性线性)Y=b0+b1tQuadratic(二次二次)Y=b0+b1t+b2t2Compound(复合复合)Y=b0(b1t)Ln(Y)=ln(b0)+ln(b1)tGrowth(生长生长)Y=eb0+b1tLn(Y)=b0+b1tLogarithmic(对对数数)Y=b0+b1ln(t)Y=b0+b1mCubic(三次三次)Y=b0+b1t+b2t2+b3t3第三十页,讲稿共九十二页哦SPSS中的11种拟线性模型(续)模型名称模
16、型名称回归方程回归方程相应的线性回归方程相应的线性回归方程S型型Y=eb0+b1/tLn(Y)=b0+b1/tExponential(指数指数)Y=b0*eb1*tLn(Y)=ln(b0)+b1tInverse(逆逆)Y=b0+b1/tY=b0+b1/tPower(幂幂)Y=b0(tb1)Ln(Y)=ln(b0)+b1ln(t)Logistic(逻辑逻辑)Y=1/(1/u+b0b1t)Ln(1/Y-1/u)=ln(b0+ln(b1)t)第三十一页,讲稿共九十二页哦曲线选择的一般准则如果因变量的一阶差分如果因变量的一阶差分(Yi-Yi-1)接近常数,用直线接近常数,用直线拟合拟合如果因变量的二阶
17、差分如果因变量的二阶差分(Yi-Yi-1)-(Yi-1-Yi-2)接近常数,接近常数,用抛物线拟合用抛物线拟合如果一阶差分倾向于按固定的百分比如果一阶差分倾向于按固定的百分比Yi/Yi-1减少,减少,用修改指数曲线用修改指数曲线对数一阶差分接近常数,用拟合指数函数对数一阶差分接近常数,用拟合指数函数对数二阶差分接近常数,用拟合指数抛物线对数二阶差分接近常数,用拟合指数抛物线若倒数的一阶差分几乎按固定的百分比变化,用逻辑曲若倒数的一阶差分几乎按固定的百分比变化,用逻辑曲线线第三十二页,讲稿共九十二页哦功能菜单菜单Analyze-Regression-Curve Estimation变量选择区变量
18、选择区因变量因变量自变量自变量模型选择模型选择第三十三页,讲稿共九十二页哦Save 按钮保存预报值保存预报值保存残差保存残差保存预报区间保存预报区间第三十四页,讲稿共九十二页哦实例分析数据Car.sav为有关汽车数据,试分析mpg(每加仑汽油行驶里程)与weight(车重)的关系?第三十五页,讲稿共九十二页哦实例分析步骤先做散点图(Graphs-Scatter-Simple):weight(X)、mpg(Y),看每加仑汽油行驶里程数mpg(Y)随着汽车自重weight(X)的增加而减少的关系,也发现是曲线关系第三十六页,讲稿共九十二页哦实例分析步骤建立若干曲线模型(可试着选用所有模型Model
19、s)Analyze-Regression-Curve EstimationDependent:mpgIndependent:weightModels:全选(除了最后一个逻辑回归)选Plot models:输出模型图形点击OK第三十七页,讲稿共九十二页哦结果分析判定模型的优劣性:一般通过比较R square和“F”值的大小,R square值和“F”值越大,模型越优越。分析:比较各种模型的相关系数的平方值R square和F值,结果是复合模型(Compound)的 R square最大R2=0.70678方程为:mpg=60.15*0.999664weight说明:Growth和Exponent
20、ial的结果也相同,也一样。第三十八页,讲稿共九十二页哦练习对南瓜现货交易的收盘价进行曲线拟合,找出最佳拟合曲线。(使用时间作为自变量)数据见NG11.xls第三十九页,讲稿共九十二页哦方差分析方差分析方差分析方差分析何何 帆帆第四十页,讲稿共九十二页哦本课主要内容1.方差分析概述方差分析概述2.单因变量单因素方差分析单因变量单因素方差分析3.单因变量多因素方差分析单因变量多因素方差分析4.协方差分析协方差分析第四十一页,讲稿共九十二页哦方差分析概述 一、问题的提出一、问题的提出通过参数检验可以解决两两总体均值的比较通过参数检验可以解决两两总体均值的比较.n多个总体均值的检验如何作?多个总体均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 方差分析 讲稿
限制150内