第4章回归分析ppt课件.ppt
第4章回归分析ppt课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望4.1基本概念基本概念(1)相互关系相互关系确定性关系确定性关系:变量之间存在着严格的函数关系变量之间存在着严格的函数关系相关关系相关关系:变量之间近似存在某种函数关系变量之间近似存在某种函数关系(2)回归分析(回归分析(regressionanalysis)处理变量之间相关关系的统计方法处理变量之间相关关系的统计方法n确定回归方程确定回归方程:变量之间近似的函数关系式变量之间近似的函数关系式n检验回归方程的显著性检验回归方程的显著性n试验结果预测试验结果预测4.2一元线性回归分析一元线性回归分析4.2.1一元线性回归方程的建立一元线性回归方程的建立(1)最小二乘原理)最小二乘原理n设有一组试验数据设有一组试验数据(如表),若(如表),若x,y符合线性关系符合线性关系xx1x2xnyy1y2yn计算值计算值与试验值与试验值yi不一定相等不一定相等 与与yi之间的偏差称为残差:之间的偏差称为残差:a,b回归系数(回归系数(regressioncoefficient)回归值回归值/拟合值,由拟合值,由xi代入回归方程计算出的代入回归方程计算出的y值。值。n 一元线性回归方程一元线性回归方程 :n残差平方和残差平方和:n残差平方和最小时,回归方程与试验值的拟合程度最好残差平方和最小时,回归方程与试验值的拟合程度最好求残差平方和极小值:求残差平方和极小值:n正规方程组(正规方程组(normalequation):n 解正规方程组:解正规方程组:n简算法:简算法:4.2.2一元线性回归效果的检验一元线性回归效果的检验(1)相关系数检验法)相关系数检验法相关系数(相关系数(correlationcoefficient):n描述变量描述变量x与与y的线性相关程度的线性相关程度n定义式:定义式:相关系数特点:相关系数特点:n1r1nr1:x与与y有精确的线性关系有精确的线性关系nr0:x与与y负线性相关(负线性相关(negativelinearcorrelation)nr0:x与与y正线性相关(正线性相关(positivelinearcorrelation)nr0时时,x与与y没有线性关系没有线性关系,但可能存在其它类型关系,但可能存在其它类型关系n相关系数相关系数r越接近越接近1,x与与y的线性相关程度越高的线性相关程度越高n试验次数越少试验次数越少,r越接近越接近1n当当,说明,说明x与与y之间存在显著的线性关系之间存在显著的线性关系n对于给定的显著性水平对于给定的显著性水平,查相关系数临界值查相关系数临界值rmin相关系数检验相关系数检验(2)F检验检验离差平方和离差平方和n总离差平方和:总离差平方和:n回归平方和(回归平方和(regressionsumofsquare):n残差平方和残差平方和:n三者关系:三者关系:自由度自由度nSST的自由度的自由度:dfTn1nSSR的自由度的自由度:dfR1nSSe的自由度的自由度:dfen2n三者关系:三者关系:dfTdfRdfe均方均方 F检验检验nF服从自由度为(服从自由度为(1,n2)的)的F分布分布n给定的显著性水平给定的显著性水平下下,查得临界值:,查得临界值:F(1,n2)n若若FF(1,n2),则认为,则认为x与与y有明显的线性关系,所有明显的线性关系,所建立的线形回归方程有意义建立的线形回归方程有意义方差分析表方差分析表 4.3多元线性回归分析多元线性回归分析(1)多元线性回归形式)多元线性回归形式n试验指标(因变量)试验指标(因变量)y与与m个试验因素(自变量)个试验因素(自变量)xj(j=1,2,m)n多元线性回归方程:多元线性回归方程:4.3.1多元线性回归方程的建立多元线性回归方程的建立n 偏回归系数:偏回归系数:(2)回归系数的确定)回归系数的确定n根据最小二乘法原理根据最小二乘法原理:求偏差平方和最小时的回归系数:求偏差平方和最小时的回归系数n偏差平方和:偏差平方和:n 根据:根据:得到正规方程组,正规方程组的解即为回归系数。得到正规方程组,正规方程组的解即为回归系数。4.3.2多元线性回归方程显著性检验多元线性回归方程显著性检验(1)F检验法检验法n总平方和:总平方和:n回归平方和:回归平方和:n 残差平方和:残差平方和:nF服从自由度为(服从自由度为(m,nm1)的分布)的分布n给定的显著性水平给定的显著性水平下下,若,若FF(m,nm1),则,则y与与x1,x2,xm间有显著的线性关系间有显著的线性关系n方差分析表:方差分析表:(2)相关系数检验法)相关系数检验法n复相关系数(复相关系数(multiplecorrelationcoefficient)R:反映了一个变量反映了一个变量y与多个变量(与多个变量(x1,x2,xm)之间线)之间线性相关程度性相关程度n计算式计算式:R1时,时,y与变量与变量x1,x2,xm之间存在严格的线性关系之间存在严格的线性关系R0时,时,y与变量与变量x1,x2,xm之间不存在线性相关关系之间不存在线性相关关系当当0R1时,变量之间存在一定程度的线性相关关系时,变量之间存在一定程度的线性相关关系RRmin时时,y与与x1,x2,xm之间存在密切的线性关系之间存在密切的线性关系nR一般取正值一般取正值,0R1 4.3.3因素主次的判断因素主次的判断(1)偏回归系数的标准化)偏回归系数的标准化n设偏回归系数设偏回归系数bj的标准化回归系数为的标准化回归系数为Pj:n Pj越大,则对应的因素(越大,则对应的因素(xj)越重要)越重要(2)偏回归系数的显著性检验偏回归系数的显著性检验n计算每个偏回归系数的偏回归平方和计算每个偏回归系数的偏回归平方和SSj:SSjbjLjynSSj的大小表示了因素的大小表示了因素xj对试验指标对试验指标y影响程度,对应的自影响程度,对应的自由度由度dfj1n服从自由度为(服从自由度为(1,nm1)的)的F分布分布 n如果若如果若FF(1,nm1),则说明,则说明xj对对y的影响是不显的影响是不显著的,这时可将它从回归方程中去掉,变成(著的,这时可将它从回归方程中去掉,变成(m1)元线)元线性方程性方程(3)偏回归系数的)偏回归系数的t检验检验n 计算偏回归系数计算偏回归系数 的标准差:的标准差:nt值的计算值的计算:单侧单侧t分布表分布表n检验:检验:如果如果 说明说明xj对对y的影响显著,否则影响不显著,的影响显著,否则影响不显著,4.4.1一元非线性回归分析一元非线性回归分析n通过线性变换,将其转化为一元线性回归问题通过线性变换,将其转化为一元线性回归问题:直角坐标中画出散点图;直角坐标中画出散点图;推测推测y与与x之间的函数关系;之间的函数关系;线性变换;线性变换;用线性回归方法求出线性回归方程;用线性回归方法求出线性回归方程;返回到原来的函数关系,得到要求的回归方程返回到原来的函数关系,得到要求的回归方程4.4非线性回归分析非线性回归分析4.4.2一元多项式回归一元多项式回归n任何复杂的一元连续函数都可用高阶多项式近似表达任何复杂的一元连续函数都可用高阶多项式近似表达:n 可以转化为多元线性方程:可以转化为多元线性方程:4.4.3多元非线性回归多元非线性回归n如果试验指标如果试验指标y与多个试验因素与多个试验因素xj之间存在非线性关系,之间存在非线性关系,如二次回归模型如二次回归模型:4.5Excel在回归分析中的应用在回归分析中的应用4.5.1“规划求解规划求解”在回归分析中应用在回归分析中应用n解方程组解方程组n最优化最优化4.5.2Excel内置函数在回归分析中应用内置函数在回归分析中应用4.5.3Excel图表功能在回归分析中的应用图表功能在回归分析中的应用4.5.4分析工具库在回归分析中应用分析工具库在回归分析中应用