线性回归分析的数学模型(共31页).doc
《线性回归分析的数学模型(共31页).doc》由会员分享,可在线阅读,更多相关《线性回归分析的数学模型(共31页).doc(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上线性回归分析的数学模型 摘 要 在实际问题中常常遇到简单的变量之间的关系,我们会遇到多个变量同处于一个过程之中,它们之间互相联系、互相制约这些问题中最简单的是线性回归线性回归分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的研究由于客观事物的联系错综复杂经济现象的变化往往用一个变量无法描述,故本篇在深入分析一元线性回归及数学模型的情况下,又详细地介绍了多元线性回归方程的参数估计和其显著性检验等全面揭示了这种复杂的依存关系,准确测定现象之间的数量变动以提高预测和控制的准确度 本文中详细的阐述了线性回归的定义及其
2、线性模型的简单分析并应用了最小二乘法原理具体介绍了线性回归分析方程参数估计办法和其显著性检验并充分利用回归方程进行点预测和区间预测 但复杂的计算给分析方法推广带来了困难,需要相应的操作软件来计算回归分析求解操作过程中的数据以提高预测和控制的准确度从而为工农业生产及研究起到强有力的推动作用 关键词:线性回归;最小二乘法;数学模型 目 录 第一章 前言1 第二章 线性模型2 第一节 一元线性模型2 第二节 多元线性模型4 第三章 参数估计 5 第一节 一元线性回归方程中的未知参数的估计5 第二节 多元线性回归模型的参数估计8 第四章 显著性检验13 第一节 一元线性回归方程的显著性检验 13 第二
3、节 多元线性回归方程的显著性检验 20 第五章 利用回归方程进行点预测和区间预测21 第六章 总结26 致谢 27 参考文献 第一章 前 言 回归分析是对客观事物数量依存关系的分析是数理统计中的一个常用的方法是处理多个变量之间相互关系的一种数学方法 在现实世界中,我们常与各种变量打交道,在解决实际问题过程中,我们常常会遇到多个变量同处于一个过程之中,它们之间互相联系、互相制约常见的关系有两种:一类为“确定的关系”即变量间有确定性关系,其关系可用函数表达式表示例如:路程s,时间t,与速度v之间有关系式:s=vt 在圆体给与半径r之间有关系式v= 另外还有一些变量他们之间也有一定的关系,然而这种关
4、系并不完全确定,不能用函数的形式来表达,在这种关系中至少有一个变量是随机的例如:人的身高与体重有一定的关系,一般来讲身高高的人体重相对大一些但是它们之间不能用一个确定的表达式表示出来这次变量(或至少其中有一个是随机变量)之间的关系我们称之为相关关系又如环境因素与农作物的产量也有相关关系,因为在相同环境条件下 农作物的产量也有区别,这也就是说农作物的产量是一个随机变量回归分析就是研究相关关系的一种数学方法,是寻找不完全确定的变量间的数学关系式并进行统计推断的一种方法它能帮助我们从一个变量取得的值去估计另一个变量的值在这种关系中最简单的是线性回归 线性回归分析是对客观事物数量关系的分析,是一种重要
5、的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的研究由于客观事物的联系错综复杂经济现象的变化往往用一个变量无法描述, 故本篇在深入分析一元线性回归及数学模型的情况下,又详细地介绍了多元线性回归方程的参数估计和其显著性检验等全面揭示了这种复杂的依存关系,准确测定现象之间的数量变动以提高预测和控制的准确度 第二章 线性模型 第一节 一元线性模型在工农业生产及科研中最常遇到的配直线问题,就是回归分析的统计推断方法来求经验公式(线性回归)的问题如: 例1 今有某种大豆脂肪含量x(%)与蛋白质含量y(%)的测定结果如下表所示:试求它们之间的关系(检验公式) x 165 175 185
6、 195 205 215 225 y 435 426 426 406 403 387 372 首先将这组数据在直角坐标系上描成点,如下图: 一般的,按此方法描点所得的图成为散点图 从图上可以看出:这些数据描出的点分布在一条直线附近于是推出他们大致可以表示为线性关系 这里再y上加“ ”是为了区别于他的实际值y,因为y与x一般不具有确定的函数关系,这样,在散点图的启发下,我们选定了回归方程是线性的然后根据统计推断方法来估计出未知数 和 从而确定所求的经验公式一般的,设随机变量y与x之间的相关关系可以用线性模型 , N(0, ) (1) 来表示这里x是试验或观察中可以控制或精确观测的变量即非随机变量
7、,y是可观测的随机变量 是不可观测的随机变量(它表示模型误差,是除去x对Y的先行影响之外的且不能测出的其它各个随机因素对Y的影响的总和) 通过实验观测可得到关于变量x和Y的一组数据( , ),( , ),( , )因为对于任意一个 (i=1,2,n),在 的观测值在取定前不能精确预言它一定能取什么值,故把 看作是随机变量Y的观测值而相互独立的随机变量 , , 为Y的样本我们知道,样本与样本观测值之间的区别是:前者是随机变量,后者为取定的数值,但为了叙述方便,今后把样本观察值也成为样本在符号上均用 , , 来表示具体表示的意义也可由上下文分析清楚,设观测值 与样本 之间满足关系式: = (i=1
8、,2,n) (2) 其中 (i=1,2,n)且相互独立 如果两个变量间的关系用上述线性模型描述,则它们之间存在线性相关关系由(1)有: E(Y)= 我们希望根据观测的数据 ,求出 , 的估计量 , 这样就可以利用方程 (3) 去估计随机变量Y的数学期望E(Y)也就是说,将 , 代入方程 (1)并略去误差 ,就得到了随机变量Y和变量x的线性关系式(3)方程(3)通常称为Y对x的线性回归方程或回归方程,其图形称为回归直线 对于(1)和(2)所确定的线性模型,所考虑的统计推断主要问题是:未知参数 和 的估计:检验x和Y之间的关系是否可确信是线性关系,即对假设(1)进行检验,对Y进行预测等 第二节 多
9、元线性模型 一般来讲,影响结果Y的因素往往不止一个设有 , 共p个元素这时要用图来确定它们的关系是困难的常可根据经验做出假设其中最简单的是假设它们之间有线性关系: (4) 式中 , 都是可精确测量或可控制的一般变量,Y是可观测的随机变量, , , 都是未知参数, 是服从 分布的不可观测的随机误差我们对(4)获得了n组相互独立的观测值(样本) ( ; , , ) (i=1,2,n) (5) 于是由(4)式可知 具有数据结构式: i=1,2,n (6) 其中各个 ( i=1,2,n)相互独立,且均服从 这就是p元线性回归模型 对于(4)所确定的模型统计推断的主要问题是:根据样本去估计未知参数 ,
10、, 、 ,从而建立Y与 , 间的数量关系式和对比得到的数量关系式的可信度进行统计检验;检验各变量 , 分别对指标是否有显著影响2 第二章 参数的估计 第一节 一元线性回归方程参数的估计 有多种确定回归方程也就是确定未知参数 , 的估计量 , ,的方法其中最常用的是“最小二乘法” 我们将采用“最小二乘法原理”来求出 , 也就是求,使误差 ( i=1,2,n)的平方和 Q= = (7) 为最小的 , 值作为参数 , 的估计量 由(7)知Q是 , 的二元函数即Q=Q( , )按二元函数求极值的方法可得联立方程组: (8) 这个方程组称为正规方程组 即: (9) 解此方程组由(9)的第一式得 因此 的
11、估计量为: (10) 其中 , 将(10)式代入(9)中的第二式可解得 的估计量为 (11) 这样:利用(10)和(11)确定的 , 使平方和Q达到最小,从而求出回归方程 这里 , 分别表示由(10)和(11)确定的 , 的值并称 为经验截距; 为经验回归系数,简称为回归系数,而 是 的无偏估计量 由(10)可得回归方程的另一种形式: (12) 由此可知,回归直线通过点( , ),即通过由馆测值的平均值组成的点,并且回归方程由回归系数 完全确定一般的,把由回归方程确定的x的对应值 称为回归值 根据观测数据,利用 (10)和(11)来求回归直线时,常把(11)中的分子和分母分别记为 和 ,且按下
12、面的公式计算: 所以(10)和 (11)两式可记作: (13) (14) 又有公式: = = (15) 然而,对总体中的未知参数进行估计,其主要目的还是建立一元线性回归方程虽然有一个正规方程组存在实际上并不研究它以下是建立一元线性回归方程的具体步骤: (1) 计算 , , , , ; (2) 计算 , , (在回归方程作显著性检验时用); (3) 计算 和 写出一元线性回归方程3 序号 1 165 435 27225 189225 71775 2 175 426 30625 181476 74550 3 185 426 34225 181476 78810 4 195 406 38025 16
13、4836 79170 5 205 403 42025 162409 82615 6 215 387 46225 149769 83205 7 225 372 50625 138384 83700 8 235 360 55225 129600 84600 9 245 340 60025 115600 83300 1845 3555 384225 1412775 721725 从而可求得 =205, =395, =60, =-705, -1175, = - =63588 所求回归方程为 63588-1175x 例2 设两个变量x与Y由某种相关关系,测得它的一组数据如下表所示,试求其回归方程 x 4
14、92 500 493 490 490 495 498 499 502 502 Y 167 170 168 166 167 168 168 170 170 171 解:根据计算得 =4961, =1685, =2461351, =835994 =03293, = - =05129 所以回归方程为 05129+03293x 第二节 多元线性回归模型的参数估计 设 , ,Y有一组观测值(样本);( , , )(i=1,2,n)我们希望由估计 , , 所决定出的回归方程能使一切 与 之间的偏差达到最小根据最小二乘法的原理 即:要求 = 所以只要求偏离平方和 达到最小的 为书写方便以下把“ ”书写成“
15、” 根据微积分中值原理和最小二乘法估计 是下列方程组的解 ( j=1,2,,n) (16) 经整理即得关于 的一个线性方程组 (17) 此方程组(17)称为正规方程组借此方程组就可求得参数 的回归值 为了求解方便我们将(17)是写成矩阵的形式,令 1 X= 1 ,Y= , B= 1 记(17)式的系数矩阵为A,常数项矩阵为B,则A恰为 ,B恰为 即: 1 1 1 1 = 1 1 n = =A 1 1 1 = = =B 因此用矩阵的形式可表式为 = 在回归分析中通常 存在这时最小二乘估计 可表式为: = (18) 当我们求出了 的最小二乘估计 后,就可以建立多元回归方程5 例 3 某地区所产原棉
16、的纤维能力Y与纤维的公制支数 ,纤维的成熟度 有关,现实测得28组数据(见下表)试建立Y关于 , 的二元线性回归方程 i i 1 5415 158 403 15 6208 170 381 2 5700 138 401 16 5798 159 400 3 5674 157 400 17 5551 161 419 4 5698 155 409 18 6059 157 381 5 6165 152 373 19 6060 153 396 6 5929 160 409 20 6059 155 393 7 7505 114 295 21 6370 145 372 8 5920 150 390 22 61
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 分析 数学模型 31
限制150内