excel在回归分析中的应用.pdf
《excel在回归分析中的应用.pdf》由会员分享,可在线阅读,更多相关《excel在回归分析中的应用.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Excel在回归分析中的应用涂 虬(武钢职工大学土建系 武汉:43008)摘 要 回归分析方法是数量统计常用的一种方法。本文详细介绍了如何使用EXCEL进行回归分析的二种方法:“回归”分析工具以及工作表函数,并以实例进行了讲解。关键词 Excel 回归分析 工程表函数 显著性检验中图分类号:文献标识码:A来稿日期:2001.02.05作者简介:涂虬,男,1970年生,武钢职工大学副教授。1 前言回归分析方法是处理多个变量之间相互关系的一种数学方法,是数理统计常用方法之一。从分析测试的观点来看,回归分析的任务就是找出响应值y(因变量)与影响它的诸因素xi(自变量,i=1,2,3,n)之间的统计关
2、系(回归模型),利用这种统计关系在一定置信度下由各因素的取值去预测响应值的范围,在众多的预报变量中,判断哪些变量对自变量的影响是显著的,哪些变量的影响是不显著的;根据预报变量的给定值来估计和预测精度。常用的回归模型包括线性回归、非线性回归,前者又可分为一元线性回归、多元线性回归,后者分为可化为一元线性方程的回归方程,如冥函数、指数函数、对数函数等,以及可化为多元线性方程的回归方程,如多项式方程。传统的回归分析方法是对线性回归模型采用最小二乘法来拟合回归方程,然后计算相关系数进行显著性检验,而对非线性方程,还得对自变量和因变量作适当的变换,把非线性方程转化为线性方程,然后再用线性回归的方法处理。
3、这种传统的回归计算方法,尤其对于多元非线性方程,求解过程非常繁琐,计算复杂。Excel在回归分析中能避开复杂的计算,把复杂的计算过程交给计算机处理,使用起来非常简单。本文将探讨如何使用Excel进行回归分析。2Excel回归分析过程与方法介绍2.1 回归分析过程回归分析过程就是通过样本观测数据对模型中的因变量f(x)进行估计,分析随机误差项的分布特征,使用模型进行预测预报,任何一个回归分析过程包括以下内容:(1)建立回归模型,确定自变量和因变量,判定因变量f(x)的形式。(2)用样本数据来拟合模型中的未知参数。(3)确定随机误差项和估计量的分布性质。(4)拟合优度检验,验证用X预测Y的拟合程度
4、。(5)利用模型进行预测和控制。预测问题是对固定的X值预测相应的Y值,而控制问题可以看成是预测问题的反问题,通过控制X值以便把Y的值控制在指定的范围内。第13卷第2期2001年6月武钢职工大学学报Journal of University for Staff and Workers of WISGCOVol.13.No.2June.2001采用Excel以取代传统的数学方法,计算(2),(3),(4),(5),这正是Excel用以回归分析的方便所在。2.2 回归分析方法介绍Excel为用户提供了二种回归分析工具:“回归”分析工具、工作表函数。2.2.1“回归”分析工具使用方法介绍(1)在Exc
5、el工作区单元格中录入样本观测数据。(2)建立回归模型,确定因变量f(x)的形式。取样本观测数据,录入Excel中的图表向导,选用“XY散点图”,把样本数据连成曲线,观察曲线形状,建立回归方程。(3)启动“回归分析”分析工具从“工具”菜单中选择“数据分析”子菜单,打开“数据分析”对话框,从中选择“回归”分析工具。如果“工具”菜单中没有“数据分析”,从“工具”中选定“加载宏”,在“加载宏”中选定“分析工具库”即可在“工具”菜单中加载“数据分析”。(4)填写“回归分析”对话框,如图1所示。“回归”对话框(5)回归结果分析 在回归“对话框中按“确定”按钮,可以得到回归结果。2.2.2 工作表函数使用
6、说明Excel提供了9个函数用于建立回归模型和回归预测,其中5个函数用于一元回归分析,4个函数用于多元回归分析,这些函数列于表1。表1 用于回归分析的工作表函数函 数 名定 义语 法 格 式INTERCEPT一元线性回归模型的估计值(截距)INTERCFPT(Known-ys,Known-xs)SLOPE一元线性回归模型的估计值(斜率)SLOPE(Known-ys,Known-xs)RSQ一元线性回归模型的决定系数(r2)SRQ(Known-ys,Known-xs)FORECAST依照一元线性回归模型的预测值FORECAST(new-xs,Known-ys,Known-xs)STEYX依照一元
7、线性回归模型的标准误差STEYX(Known-ys,Known-xs)TREND依照多元线性回归模型的预测值TREND(Known-ys,Known-xs,new-xs,const)GROWTH依照多元指数回归模型的预测值GROWTH(Known-ys,Known-xs,new-xs,const)LINST估计多元线性回归模型的未知函数LINST(Known-ys,Known-xs,const,stats)LOGEST估计多元指数回归模型的未知函数LOGEST(Known-ys,Known-xs,const,stats)对以上九个函数说明如下:(1)所有函数必须要求自变量与因变量的数据个数相同
8、,否则将返回错误值。52涂虬:Excel在回归分析中的应用(2)工作表函数参数分别说明如下:Known-ys,known-xs分别表示因变量、自变量的数据区域引用;new-xs表示待预测的自变量值。Const:用于指定是否要设定常数为0的逻辑值。如果Const设定为TRUE,则常数项将通过计算求得。如果Const设定为FALSE,则常数项将设为0,调整回归参数以满足公式y=f(x)。Stats:为逻辑值,用以指出是否返回除回归系数以外的其它统计量值,如果为TRUE,则返回这些值,如果为FALSE,不返回这些值。这些统计量包括:回归系数的标准误差(抽样误差)、决定系数(r2)、估计量的标准估计误
9、差(抽样误差)、自由度、回归平方和、残差平方和。以上工作表函数使用非常简单,只要理解各工作表函数定义及语法格式,使用起来非常方便。3Excel“回归”分析工具的使用以下以具体实例讲解如何使用Excel“回归分析”分析工具。3.1一元线性回归模型一元线性回归方程可表示为y=+x+,式中,是要求解的回归参数,是一个随机变量,即因变量Y的随机误差项,它反映了除X变量以外其它变量对Y的影响程度和方式。“回归”分析对话框见图1,需要说明的是:自变量X、因变量Y在单元格中必须以单列数据形式输入。例1:炼铝厂测得铝硬度X与抗张强度Y的数据如下:xi68537084607251837064yi28829834
10、9343290354283324340286求X对Y的回归方程。解:(1)工作区单元格中录入数据:xi录入 AB:A11单元格,yi录入在 B2;B11单元格。(2)建立回归模型,确定因变量f(x)的形式。按2.2.1(2)中介绍的方法,确定回归方程y=+x+(3)启动“回归分析”分析工具,从“工具”菜单中选择“数据分析”子菜单,打开“数据分析”对话框,从中选择“回归”。(4)填写“回归分析”对话框。在“Y”值输入区域”输入:B2:B11,在“X”值输入区域”输入:A2:A11。“标志”:本例题未选“置信度”:省略,表示95%“常数为零:”不强制回归通过原点,可不选。“残差”:如果不需要以残差
11、形式出现,不选此复选框。(6)分析结果:如下表所示(由于篇幅有限,只给出部分结果):SUMMARY OUTPUT回归统计MuItiple R0.680744861R Square0.463413566Adjusted R Square0.396340262标准误差22.68523588观测值10方差分析dfSSMSFSignificance F回归分析13555.5405843555.5405846.90906120.03024811残差84116.959416514.619927总计97672.562 武钢职工大学学报 2001.6(2)Coefficients标准误差t StatP-val
12、ueLower 95%Upper 95%下限95%上限95.0%Intercept193.9507524 46.795780464.144620530.003232886.03941937301.86208586.0394194 301.862085X Variable 1 1.8007295940.685076362.6285093160.03024810.2209396543.380519530.22093965 3.38051953回归分析正态分布图从表中“回归统计”可以看到R的倍数、R的平方、调整后的R平方、标准误差。从“方差分析”可以看到残差的方差、平均残差的方差以及F下的显著水平。
13、回归分析出的截距=193.95 斜率=1.80073 则回归方程为y=1.80073x+193.95+3.2 多元线性回归方程多元线性回归方程可表示为y=+1x2+2x2+nxn+,式中,1,2,n是要求解的回归参数,意义同上。同样地,自变量X、因变量Y在单元格中必须以单列数据形式输入。例2 铝合金化学铣切工艺中,为便于操作,需要对腐蚀速度进行控制,因此要考察腐蚀液温度X1(.C)、碱浓度X2(g/c)、腐蚀液含铝量x3(g/1)对腐蚀速度Y(mm/min)的影响,一共做了20次,所得数据如下:Xi173737575757579797979Xi212213042364812213036Xi32
14、00200175175200200200200225225yi0.02400.02350.02400.01900.02450.01850.03200.03000.02900.0275Xi179798383838383838787Xi242481221303642481221Xi3200200200225175175200200200225yi0.02500.02500.03700.03600.03550.03250.03050.02700.04400.0425Xi3200200200225175175200200200225yi0.02500.02500.03700.03600.03550.0
15、3250.03050.02700.04400.0425求y对x1,x2,x3的线性回归方程。解:(1)在工作区单元格中录入数据(x1,x2,x3值分别输入在 A2:A21,B2:B21,C2:C21;yi值输入在 D2:D21)。(注意该区域必须由单列数据组成)(2)建立回归模型y=+1x1+2x2+3x3+(3)填写如图1所示“回归分析”对话框在“Y值输入区域”输入:D2:D21;在“X值输入区域”输入:A2:C2172涂虬:Excel在回归分析中的应用其余同图例1(4)结果分析:如下表所示(由于篇幅有限,只给出部分结果)SUMMARY OUTPUT回归统计MuItiple R0.98590
16、8501R Square0.972015572Adjusted R Square0.966768492标准误差0.001277812观测值20方差分析dfSSMSFSignificance F回归分析30.00090740.0003025185.24891.23996E-12残差162.612E-051.633E-06总计190.0009336Coefficients标准误差t StatP-valueLower 95%Upper 95%下限95%上限95.0%Intercept-0.068806790.0062661-10.980817.36E-09-0.082090315-0.0555232
17、7-0.08209032-0.05552327X Variable10.0013145727.031E-0518.6960442.7E-120.0011655160.0014636290.0011655160.001463629X Variable2-0.000245142.341E-05-10.470111.44E-08-0.000294772-0.0001955-0.00029477-0.0001955X Variable3 4.35492E-061.879E-050.23170860.819702-3.54883E-05 4.41981E-05-3.5488E-05 4.41981E-0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- excel 回归 分析 中的 应用
限制150内