《第9章spss13学习教程.pptx》由会员分享,可在线阅读,更多相关《第9章spss13学习教程.pptx(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、在 SPSS 中,实现回归分析的功能在:AnalyzeRegressionRegression 命令菜单有如下九个过程。Linear:线性回归分析;Curve Estimation:曲线估计分析;Binary logistic:二维逻辑分析;Multinormal logistic 多维逻辑分析;Ordinal 顺序分析;Probit 概率分析;Nonlinear:非线性回归分析;Weight Estimation 加权估计分析;2-Stage Least Squares:两阶最小二乘分析。第1页/共36页9.1 Linear 线性回归分析其中0为回归常数,其中 1,n 为回归系数,为随机误差
2、。基本要求:自变量和因变量都为数值型,且线性相关程度较高。随机误差要求无自相关性,y服从正态分布。第2页/共36页【设置界面】因变量,一个自变量,可多个自变量筛选法条件筛选法散点图标志变量异方差时,对选入变量用加权异方差时,对选入变量用加权最小二乘法估计模型参数最小二乘法估计模型参数第3页/共36页【statistics按钮】回归系数相关量95%置信区间回归系数协方差阵拟合优度相关量多重共线性分析自变量进入回归方程引起R变化量自相关的DW检验,即检验H0:=0异常值分析第4页/共36页【plots按钮】通过图形用于对残差序列进行分析因变量标准化预测值标准化残差剔除残差调整的预测值学生化残差剔除
3、学生化残差绘制散点图坐标依次绘制因变量与各自变量的散点图第5页/共36页【Save按钮】将选中结果作为新变量存入数据文件或新文件预测值观测值与均值偏差预测值区间残差值剔除某case后改变值第6页/共36页【option按钮】多元线性回归分析中自变量进入或剔除的标准回归分析中是否包含常数项第7页/共36页【结果形式】可决系数-自变量可解释因变量的比例模型的方差分析H0:b1=bn=0第8页/共36页模型中常数项与回归系数的检验回归方程为time=-1.955+3.457diamH0:a=0H0:bi=0第9页/共36页【实例】为研究某公司职工当前工资水平(salarysalary),收集了影响因
4、素6 6个,即开始工资(salbegin$salbegin$)、受教育时间(educeduc)、来公司工作时间(jobtimejobtime)、工种(jobcatjobcat)、来前工作经验(prevexpprevexp)及是否少数民族(minorityminority),试用多元线性回归对该公司当前工资水平建立恰当回归模型。【数据准备】见下页第10页/共36页第11页/共36页6个影响因素变量自变量逐步筛选【设置界面】第12页/共36页【statistics按钮】第13页/共36页【Save按钮】第14页/共36页【结果形式】先后选入自变量,minority未选入剔除变量第15页/共36页复
5、相关系数,随自变量的加入而增大,较大,线性相关高可决系数D-W统计量值:在1.52.5间无显著自相关性第16页/共36页随自变量的加入,线性模型都有显著效果H0:b1=b5=0H0:b1=b2=b3=0第17页/共36页随自变量的加入,因变量与自变量都显著线性相关H0:a=0,bi=0 (j=1,.,5)标准化回归系数(无量纲),用于比较各变量重要程度大小第18页/共36页 可见,第5个回归方程为 salary=-15038.574+1.365salbegin+5859.585jobcat-19.553prevexp+154.698jobtime+539.642educ 复相关系数R=0.91
6、7,可决系数R2=0.84,经检验,回归模型、回归系数及D-W检验都有显著统计学意义。对工资水平影响较大的因素依次为 开始工资、工种、来前工作经验、来公司工作时间、受教育时间。第19页/共36页9.2 Curve Estimation:曲线估计分析 曲线回归(估计、拟合):选定一种用函数表达曲线,使理论数据与实际数据间的差异尽可能小。解决问题:(1)曲线模型的选择;(2)模型参数的确定。基本思路:通过散点图及专业、经验等确定函数类型,再利用SPSS解决。可以经变量变换转化为线性关系,SPSS中Curve Estimation解决。不能经变换转化为线性关系,用迭代或分段平均值等方法处理,SPSS
7、中Nonlinear解决第20页/共36页Curve Estimation中提供了11种本质线性模型:第21页/共36页【实例】某产品零售商已知产品的广告投入和销售额的数据,试找出适当的回归方程。【作散点图预分析】Graphs-scatter/dotGraphs-scatter/dot重叠散点图,用于多对变量三维散点图,用于三个相关变量简单散点图,用于一对变量矩阵散点图,用于多对变量单点散点图,用于单个变量第22页/共36页设置散点标识,颜色设置散点标签设置栅格,行列分类分组【散点图设置】第23页/共36页 可见,不是非常明确,可以近似拟合直线、二次曲线及三次曲线。【注意】若不能明确判定函数类
8、型时,可选几种可能曲线,再利用SPSS的结果分析、判定。第24页/共36页【设置界面】若选用time,则因变量数据作为时间均匀的时间序列第25页/共36页【结果形式】由表中可决系数R2 可见,二次或三次曲线拟合较好,且模型检验也有统计学意义。二次曲线方程:sales=3.903+2.854advert-0.245advert2三次曲线方程:sales=3.283+3.471advert-0.422advert2+0.015advert3第26页/共36页拟合曲线:第27页/共36页9.3 Nonlinear:非线性回归分析 该种模型不能经变换转化为线性模型,用迭代或分段平均值等方法处理。基本要
9、求:自变量和因变量都为数值型。非线性回归分析的关键:(1)曲线模型的选择及参数确定;(2)迭代算法的初始值。第28页/共36页 Nonlinear中提供了19种非本质线性模型:第29页/共36页【设置界面】选定的函数表达式(19种之1)模型中参数初始值的设定设置损失函数,使其最小化设置参数约束条件第30页/共36页【parameter按钮】【option按钮】迭代方法:连续二次规划法阻尼最小二乘法(默认)第31页/共36页设置参数约束条件【constraint按钮】第32页/共36页【结果形式】迭代过程表 经15次迭代,相邻两次迭代参差平方和几乎为0,即得到参数最优解,迭代终止。第33页/共36页参数估计表由表可得非线性回归方程为Saels=12.904-11.268exp(-0.496advert)第34页/共36页参数估计相关系数表方差分析表与因变量均值的变异全部变异 由表中可决系数R2=0.909,说明模型可以解释因变量的90.9%的变异。第35页/共36页感谢您的观看!第36页/共36页
限制150内