《第六章 spss回归分析.ppt》由会员分享,可在线阅读,更多相关《第六章 spss回归分析.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS 回回 归归 分分 析析 Regression目 录 线线 性性 回回 归归 曲曲 线线 估估 计计 二项逻辑斯谛回归二项逻辑斯谛回归 多分变量的逻辑斯谛回归多分变量的逻辑斯谛回归 概率单位回归概率单位回归 非线性回归非线性回归 加加 权权 回回 归归 两段最小二乘法两段最小二乘法 最优尺度回归最优尺度回归 习题参考答案习题参考答案南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华线线 性性 回回 归归一元线性回归有关公式一元线性回归有关公式 对斜率检验的假设是,总体回归系数对斜率检验的假设是,总体回归系数对斜率检验的假设是,总体回归系数对斜率检验的假设是,总体回
2、归系数b b=0=0。检验该假设的。检验该假设的。检验该假设的。检验该假设的t t值计算公式是:值计算公式是:值计算公式是:值计算公式是:对截距检验的假设是,总体回归方程截距对截距检验的假设是,总体回归方程截距对截距检验的假设是,总体回归方程截距对截距检验的假设是,总体回归方程截距a a=0=0。检验该假设的。检验该假设的。检验该假设的。检验该假设的t t值计算公式是:值计算公式是:值计算公式是:值计算公式是:在两公式中,在两公式中,在两公式中,在两公式中,SESEb b是回归系数的标准误。是回归系数的标准误。是回归系数的标准误。是回归系数的标准误。SESEa a是截距的标准误。是截距的标准误
3、。是截距的标准误。是截距的标准误。南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华一元线性回归有关公式 R R R R2 2 2 2判定系数判定系数判定系数判定系数 方差分析方差分析方差分析方差分析 南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华 (a)(b)(c)(d)(e)(f)(g)一元线性回归各种残差与预测值关系示意图南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华多元线性回归多元线性回归多元回归分析的模型多元回归分析的模型 校正校正R R2 2判定系数的公式判定系数的公式 其中其中k k为自变量的个数,为自变量
4、的个数,n n为观测量数目为观测量数目 偏回归系数和常数项的偏回归系数和常数项的t t检验的公式检验的公式 多元回归分析:根据多个自变量的最优组合建立回归方程来预测因变量的回归分析多元回归分析:根据多个自变量的最优组合建立回归方程来预测因变量的回归分析 南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归菜单回归菜单南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华线性回归主对话框线性回归主对话框南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华输出统计量对话框输出统计量对话框南京农业大学李刚华南京农业大学李刚华南京农业大学李
5、刚华南京农业大学李刚华确定影响点确定影响点南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华选择图形对话框选择图形对话框南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华选择对话框选择对话框 返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华简单散点图对话框图 返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华散点图示例初始工资与当前工资散点图初始工资与当前工资散点图 返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出1)引入或从模型中剔除的变量引入
6、或从模型中剔除的变量 返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出2)返回拟合过程小结拟合过程小结南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出3)返回方差分析方差分析南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出4)返回建立模型过程中的各模型回归系数及检验结果建立模型过程中的各模型回归系数及检验结果南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出5)返回当前工资变量的异常值表当前工资变量的异
7、常值表南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出6)返回残差分析的统计量残差分析的统计量南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华回归模型的建立(示例输出9)返回共线性诊断共线性诊断南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华曲曲 线线 估估 计计 返回曲线估计对话框曲线估计对话框曲线估计对话框曲线估计对话框南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华保存对话框 返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华曲线回归实例散点图
8、 返回每加仑里程与车重散点图每加仑里程与车重散点图南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华曲线回归实例输出1QuadraticQuadratic模型拟合模型拟合系数及其检验结果系数及其检验结果模型的方差分析结果模型的方差分析结果拟合优度的检验拟合优度的检验二次模型分析结果二次模型分析结果 返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华曲线回归实例输出2 返回三次模型分析结果三次模型分析结果CUBIC模型拟合模型拟合系数及其检验结果系数及其检验结果模型的方差分析结果模型的方差分析结果拟合优度的检验拟合优度的检验南京农业大学李刚华南京农
9、业大学李刚华南京农业大学李刚华南京农业大学李刚华曲线回归实例输出3 返回 指数模型分析结果指数模型分析结果Compound模型拟合模型拟合系数及其检验结果系数及其检验结果模型的方差分析结果模型的方差分析结果拟合优度的检验拟合优度的检验南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第第1 1题题 数据数据数据数据spss09-10spss09-10是某企业是某企业是某企业是某企业1987198719981998年的经济效益、年的经济效益、年的经济效益、年的经济效益、科研人员、科研经费的统计数据。假定科研人员、科研经费的统计数据。假定科研人员、科研经费的统计数据。假定科研
10、人员、科研经费的统计数据。假定19991999年该企业年该企业年该企业年该企业科研人员科研人员科研人员科研人员6161名、科研经费名、科研经费名、科研经费名、科研经费4040万元,试预测万元,试预测万元,试预测万元,试预测19991999年该企年该企年该企年该企业的经济效益。业的经济效益。业的经济效益。业的经济效益。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第1题 操作步骤1.1.打开数据打开数据打开数据打开数据spss09-10spss09-10,按照按照按照按照AnalyzeRegressionLinearAnalyzeRegressionLinear顺序
11、,将变量顺序,将变量顺序,将变量顺序,将变量ecobeniecobeni(经济效益)选经济效益)选经济效益)选经济效益)选入入入入DependentDependent框中作为因变量,框中作为因变量,框中作为因变量,框中作为因变量,将变量将变量将变量将变量perper(科研人员数量)、科研人员数量)、科研人员数量)、科研人员数量)、feefee(科研经费)选入科研经费)选入科研经费)选入科研经费)选入Independent(s)Independent(s)框中作为自变量。框中作为自变量。框中作为自变量。框中作为自变量。2.2.打开打开打开打开PlotsPlots对话框,将变量对话框,将变量对话框
12、,将变量对话框,将变量ZPREDZPRED与与与与ZRESIDZRESID分别选入分别选入分别选入分别选入X X、Y Y框中用来检验残差的分布情况,打开框中用来检验残差的分布情况,打开框中用来检验残差的分布情况,打开框中用来检验残差的分布情况,打开statisticsstatistics对对对对话框选择话框选择话框选择话框选择EstimatesEstimates、Model fitModel fit、Durbin-WatsonDurbin-Watson统计统计统计统计量;其它选择量;其它选择量;其它选择量;其它选择项为项为项为项为SPSSSPSS默认选择项。默认选择项。默认选择项。默认选择项。
13、3.3.单击单击单击单击OKOK按钮提交运算。按钮提交运算。按钮提交运算。按钮提交运算。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第第第第1 1题参考答案题参考答案题参考答案题参考答案 R2检验:得出的R2为0.999,调整后的RSquare为0.998,均很接近1,说明x1、x2与y的关系很密切。DW检验:对于给定的显著性水平为a=0.05,解释变量个数 k=3、样本个数 n=12,查DW检验表。因DW检验表中样本容量n最小为15,故取临界值 d1=0.82,du=1.75,于是有DW统计值在d1=0.82DW=2.621524du=2.25之间。所以该回归
14、模型不存在自相关。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第1题参考答案(1)F检验:在方差分析中得出的F检验值为1905.789远远大于 F0.05(2,12-2-1)=4.26,说明x1、x2与y之间的回归效果非常显著。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第1题参考答案(续1)t检验:表中,给出了回归系数和标准化回归系数的估计值及其标准误差、检验值。由于各回归系数的 检验值。Sig=0.000,小于0.05故拒绝系数为0的原假设。即可以断言:科研人员与科研经费对该企业的经济效益有显著影响。返回南京农业大学李刚华南京
15、农业大学李刚华南京农业大学李刚华南京农业大学李刚华第1题参考答案(续2)从下图经济效益预测值与其学生化残差散点图中可以看到绝大部分观测量随机地落在垂直围绕2的范围内,预测值与学生化残差值之间没有明显的关系,所以回归方程应该满足线性与方差齐性的假设且拟合效果较好。综合上述计算结果和检验结果,可得如下的回归模型:y=116.81+4.182x1+26.02x2 1999年该企业科研人员61名、科研经费40万元,其经济效益为116.814.1826126.02401412.7万元。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题 某商场19891998年的商品流通费
16、用率与商品零售额资料如data09-11所示。若1999年该商场商品零售额36.33亿元,试预测1999年该商场商品流通费用额。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题操作步骤-11.打开data09-11数据文件,按照GraphsScatterSimple的顺序打开Scatter对话框,将变量ratio选入Y轴(Y-axis),将变量total选入X轴(X-axis)。2.单击ok按钮提交作图。从图中可以看出,随着商品零售额的增加,商品流通费用率有从图中可以看出,随着商品零售额的增加,商品流通费用率有不断下降的趋势,呈现曲线形状。建立曲线回归模型。不
17、断下降的趋势,呈现曲线形状。建立曲线回归模型。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题操作步骤-21.按照按AnalyzeregressionCurve Estimation顺序打开Curve Estimation对话框,将变量total选入indenpent框中作为自变量,将变量ratio选入Dependent框中作为因变量;在models选择项中选择Inverse、Quadratic、Cubic模型以便进行对比;选择Plot models、Include constant in equation、Display ANOVA table选择项;2.单
18、击Ok按钮提交运算。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题输出结果及分析1 返回倒数模型分析结果倒数模型分析结果南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题输出结果及分析2二次模型分析结果二次模型分析结果南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题输出结果及分析3三次模型分析结果三次模型分析结果南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第2题输出结果及分析4各种模型曲线。各种模型曲线。返回比较三个模型的R2值见下各表。CUB模型的R2=0.991最大,I
19、NV模型次之R2=0.971,QUA模型的R2=0.953最小。由此可以初步判断,拟合最好的是CUB模型。南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第第第第2 2题结论题结论题结论题结论 由CUB模型Y=b0+b1t+b2t2+b3t3得出方程式为:ratio15.86-1.34tatol+0.05tatol2-0.0007tatol3 初步计算后发现其ratio值为负值,与实际情况不符,选择Inverse.模型:Y=b0+(b1/t),得到Y=2.57+42.76/tatol。将1999年该商场商品零售额36.33亿元代入模型得出ratio2.5742.76/3
20、6.33=3.75%,由 此可以得出1999年该商场商品流通费用总额预测值为1.36万元(36.333.75%)。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第3题参考答案 R.NorellR.NorellR.NorellR.Norell进行了一项利用电流刺激农场动物(实验对象进行了一项利用电流刺激农场动物(实验对象进行了一项利用电流刺激农场动物(实验对象进行了一项利用电流刺激农场动物(实验对象为牛)的实验,其目的是为了了解高压电线对牲畜的影响。为牛)的实验,其目的是为了了解高压电线对牲畜的影响。为牛)的实验,其目的是为了了解高压电线对牲畜的影响。为牛)的实验,
21、其目的是为了了解高压电线对牲畜的影响。建立模型,在对新农场选址时,对高压线的辐射电流进行测建立模型,在对新农场选址时,对高压线的辐射电流进行测建立模型,在对新农场选址时,对高压线的辐射电流进行测建立模型,在对新农场选址时,对高压线的辐射电流进行测试,如果超过一成的牲畜对高压电流有反应时就需要重新选试,如果超过一成的牲畜对高压电流有反应时就需要重新选试,如果超过一成的牲畜对高压电流有反应时就需要重新选试,如果超过一成的牲畜对高压电流有反应时就需要重新选址。址。址。址。ProbitProbitProbitProbitdatadatadatadata数据中变量数据中变量数据中变量数据中变量“curr
22、entcurrentcurrentcurrent”为刺激电流、变为刺激电流、变为刺激电流、变为刺激电流、变量量量量“experimentexperimentexperimentexperiment”为总的实验次数、变量为总的实验次数、变量为总的实验次数、变量为总的实验次数、变量“anwseranwseranwseranwser”为对电为对电为对电为对电流做出反应的响应次数。流做出反应的响应次数。流做出反应的响应次数。流做出反应的响应次数。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第第3题操作步骤题操作步骤(1)(1)读取数据文件读取数据文件读取数据文件读取数据
23、文件spss09-12spss09-12。(2)(2)按按按按AnalyzeRegressionProbitAnalyzeRegressionProbit顺序打开顺序打开顺序打开顺序打开ProbitProbit对话框。对话框。对话框。对话框。(3)(3)选择变量选择变量选择变量选择变量“answer”answer”作为响应变量送入作为响应变量送入作为响应变量送入作为响应变量送入Response Response FrequencyFrequency框中;选择变量框中;选择变量框中;选择变量框中;选择变量“experimentexperiment”作为总观测变作为总观测变作为总观测变作为总观测变
24、量送入量送入量送入量送入Total observedTotal observed框中。框中。框中。框中。(4)(4)选择变量选择变量选择变量选择变量“current”current”变量送入变量送入变量送入变量送入Covariate(s)Covariate(s)框中。框中。框中。框中。(6)(6)在在在在transformtransform框中选择框中选择框中选择框中选择Log Base 10Log Base 10选项,在选项,在选项,在选项,在OptionOption对话框对话框对话框对话框选择选择选择选择Parallelism testParallelism test,其他参数选项均为默认
25、值。其他参数选项均为默认值。其他参数选项均为默认值。其他参数选项均为默认值。(7)(7)单击单击单击单击OKOK按钮进行统计分析。按钮进行统计分析。按钮进行统计分析。按钮进行统计分析。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第3题输出及结果分析11.1.根据上表得出建立的模型为根据上表得出建立的模型为Probit(pProbit(p)=)=1.38+3.77(Log10(1.38+3.77(Log10(currentcurrent)2.2.皮尔逊拟合优度的卡方检验显著水平值皮尔逊拟合优度的卡方检验显著水平值(0.122)(0.122)大于大于0.050.05,所以可以判,所以可以判断模型对数据的拟合优度是满意的断模型对数据的拟合优度是满意的 。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华第3题结论从上表中可以发现电流超过从上表中可以发现电流超过从上表中可以发现电流超过从上表中可以发现电流超过1.051.05毫安时,就需要进行新毫安时,就需要进行新毫安时,就需要进行新毫安时,就需要进行新的农场选址。的农场选址。的农场选址。的农场选址。返回南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华南京农业大学李刚华真实的数据和正确的方法是预测的基本条件 返回返回返回
限制150内