2022年线性回归分析的数学模型.docx
《2022年线性回归分析的数学模型.docx》由会员分享,可在线阅读,更多相关《2022年线性回归分析的数学模型.docx(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022年线性回归分析的数学模型线性回来分析的数学模型摘 要在实际问题中经常遇到简洁的变量之间的关系,我们会遇到多个变量同处于一个过程之中,它们之间相互联系、相互制约这些问题中最简洁的是线性回来线性回来分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的探讨由于客观事物的联系错综困难经济现象的改变往往用一个变量无法描述,故本篇论文在深化分析一元线性回来及数学模型的状况下,又具体地介绍了多元线性回来方程的参数估计和其显著性检验等全面揭示了这种困难的依存关系,精确测定现象之间的数量变动以提高预料和限制的精确度本文中具体的阐述了线性回来的定义
2、及其线性模型的简洁分析并应用了最小二乘法原理详细介绍了线性回来分析方程参数估计方法和其显著性检验并充分利用回来方程进行点预料和区间预料但困难的计算给分析方法推广带来了困难,须要相应的操作软件来计算回来分析求解操作过程中的数据以提高预料和限制的精确度从而为工农业生产及探讨起到强有力的推动作用关键词:线性回来;最小二乘法;数学模型目 录第一章 前言1其次章 线性模型2第一节 一元线性模型2其次节 多元线性模型4第三章 参数估计 5第一节 一元线性回来方程中的未知参数的估计5其次节 多元线性回来模型的参数估计8第四章 显著性检验13第一节 一元线性回来方程的显著性检验 13其次节 多元线性回来方程的
3、显著性检验 20第五章 利用回来方程进行点预料和区间预料21第六章 总结26致谢 27参考文献 第一章 前 言回来分析是对客观事物数量依存关系的分析是数理统计中的一个常用的方法是处理多个变量之间相互关系的一种数学方法在现实世界中,我们常与各种变量打交道,在解决实际问题过程中,我们经常会遇到多个变量同处于一个过程之中,它们之间相互联系、相互制约常见的关系有两种:一类为“确定的关系”即变量间有确定性关系,其关系可用函数表达式表示例如:路程s,时间t,与速度v之间有关系式:s=vt 在圆体给与半径r之间有关系式v= 另外还有一些变量他们之间也有肯定的关系,然而这种关系并不完全确定,不能用函数的形式来
4、表达,在这种关系中至少有一个变量是随机的例如:人的身高与体重有肯定的关系,一般来讲身高高的人体重相对大一些但是它们之间不能用一个确定的表达式表示出来这次变量(或至少其中有一个是随机变量)之间的关系我们称之为相关关系又如环境因素与农作物的产量也有相关关系,因为在相同环境条件下 农作物的产量也有区分,这也就是说农作物的产量是一个随机变量回来分析就是探讨相关关系的一种数学方法,是找寻不完全确定的变量间的数学关系式并进行统计推断的一种方法它能帮助我们从一个变量取得的值去估计另一个变量的值在这种关系中最简洁的是线性回来线性回来分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经
5、济现象变量之间的影响因素和关联的探讨由于客观事物的联系错综困难经济现象的改变往往用一个变量无法描述, 故本篇论文在深化分析一元线性回来及数学模型的状况下,又具体地介绍了多元线性回来方程的参数估计和其显著性检验等全面揭示了这种困难的依存关系,精确测定现象之间的数量变动以提高预料和限制的精确度 其次章 线性模型第一节 一元线性模型在工农业生产及科研中最常遇到的配直线问题,就是回来分析的统计推断方法来求阅历公式(线性回来)的问题如:例1 今有某种大豆脂肪含量x(%)与蛋白质含量y(%)的测定结果如下表所示:试求它们之间的关系(检验公式)x165175185195205215225y435426426
6、406403387372首先将这组数据在直角坐标系上描成点,如下图:一般的,按此方法描点所得的图成为散点图从图上可以看出:这些数据描出的点分布在一条直线旁边于是推出他们大致可以表示为线性关系这里再y上加“ ”是为了区分于他的实际值y,因为y与x一般不具有确定的函数关系,这样,在散点图的启发下,我们选定了回来方程是线性的然后依据统计推断方法来估计出未知数 和 从而确定所求的阅历公式一般的,设随机变量y与x之间的相关关系可以用线性模型 , N(0, ) (1) 来表示这里x是试验或视察中可以限制或精确观测的变量即非随机变量,y是可观测的随机变量 是不行观测的随机变量(它表示模型误差,是除去x对Y的
7、先行影响之外的且不能测出的其它各个随机因素对Y的影响的总和)通过试验观测可得到关于变量x和Y的一组数据( , ),( , ),( , )因为对于随意一个 (i=1,2,n),在 的观测值在取定前不能精确预言它肯定能取什么值,故把 看作是随机变量Y的观测值而相互独立的随机变量 , , 为Y的样本我们知道,样本与样本观测值之间的区分是:前者是随机变量,后者为取定的数值,但为了叙述便利,今后把样本视察值也成为样本在符号上均用 , , 来表示详细表示的意义也可由上下文分析清晰,设观测值 与样本 之间满意关系式: = (i=1,2,n) (2) 其中 (i=1,2,n)且相互独立 假如两个变量间的关系用
8、上述线性模型描述,则它们之间存在线性相关关系由(1)有: E(Y)= 我们希望依据观测的数据 ,求出 , 的估计量 , 这样就可以利用方程 (3)去估计随机变量Y的数学期望E(Y)也就是说,将 , 代入方程 (1)并略去误差 ,就得到了随机变量Y和变量x的线性关系式(3)方程(3)通常称为Y对x的线性回来方程或回来方程,其图形称为回来直线对于(1)和(2)所确定的线性模型,所考虑的统计推断主要问题是:未知参数 和 的估计:检验x和Y之间的关系是否可确信是线性关系,即对假设(1)进行检验,对Y进行预料等 其次节 多元线性模型一般来讲,影响结果Y的因素往往不止一个设有 , 共p个元素这时要用图来确
9、定它们的关系是困难的常可依据阅历做出假设其中最简洁的是假设它们之间有线性关系: (4)式中 , 都是可精确测量或可限制的一般变量,Y是可观测的随机变量, , , 都是未知参数, 是听从 分布的不行观测的随机误差我们对(4)获得了n组相互独立的观测值(样本)( ; , , ) (i=1,2,n) (5)于是由(4)式可知 具有数据结构式: i=1,2,n (6) 其中各个 ( i=1,2,n)相互独立,且均听从 这就是p元线性回来模型对于(4)所确定的模型统计推断的主要问题是:依据样本去估计未知参数 , , 、 ,从而建立Y与 , 间的数量关系式和对比得到的数量关系式的可信度进行统计检验;检验各
10、变量 , 分别对指标是否有显著影响2其次章 参数的估计第一节 一元线性回来方程参数的估计有多种确定回来方程也就是确定未知参数 , 的估计量 , ,的方法其中最常用的是“最小二乘法” 我们将采纳“最小二乘法原理”来求出 , 也就是求,使误差 ( i=1,2,n)的平方和 Q= = (7)为最小的 , 值作为参数 , 的估计量由(7)知Q是 , 的二元函数即Q=Q( , )按二元函数求极值的方法可得联立方程组: (8) 这个方程组称为正规方程组即: (9) 解此方程组由(9)的第一式得因此 的估计量为: (10) 其中,将(10)式代入(9)中的其次式可解得 的估计量为 (11) 这样:利用(10
11、)和(11)确定的 , 使平方和Q达到最小,从而求出回来方程这里 , 分别表示由(10)和(11)确定的 , 的值并称 为阅历截距; 为阅历回来系数,简称为回来系数,而 是 的无偏估计量由(10)可得回来方程的另一种形式: (12) 由此可知,回来直线通过点( , ),即通过由馆测值的平均值组成的点,并且回来方程由回来系数 完全确定一般的,把由回来方程确定的x的对应值 称为回来值依据观测数据,利用 (10)和(11)来求回来直线时,常把(11)中的分子和分母分别记为 和 ,且按下面的公式计算:所以(10)和 (11)两式可记作: (13) (14) 又有公式: = = (15)然而,对总体中的
12、未知参数进行估计,其主要目的还是建立一元线性回来方程虽然有一个正规方程组存在事实上并不探讨它以下是建立一元线性回来方程的详细步骤:(1) 计算 , , , , ;(2) 计算 , , (在回来方程作显著性检验时用);(3) 计算 和 写出一元线性回来方程3序号11654352722518922571775217542630625181476745503185426342251814767881041954063802516483679170520540342025162409826156215387462251497698320572253725062513838483700823536055
13、2251296008460092453406002511560083300184535553842251412775721725从而可求得 =205, =395, =60, =-705,-1175, = - =63588所求回来方程为 63588-1175x例2 设两个变量x与Y由某种相关关系,测得它的一组数据如下表所示,试求其回来方程x492500493490490495498499502502Y167170168166167168168170170171解:依据计算得 =4961, =1685, =2461351, =835994 =03293, = - =05129所以回来方程为 051
14、29+03293x其次节 多元线性回来模型的参数估计设 , ,Y有一组观测值(样本);( , , )(i=1,2,n)我们希望由估计 , , 所确定出的回来方程能使一切 与 之间的偏差达到最小依据最小二乘法的原理 即:要求=所以只要求偏离平方和达到最小的为书写便利以下把“ ”书写成“ ”依据微积分中值原理和最小二乘法估计 是下列方程组的解 ( j=1,2,,n) (16) 经整理即得关于 的一个线性方程组 (17)此方程组(17)称为正规方程组借此方程组就可求得参数 的回来值 为了求解便利我们将(17)是写成矩阵的形式,令 1 X= 1 ,Y= , B= 1 记(17)式的系数矩阵为A,常数项
15、矩阵为B,则A恰为 ,B恰为 即: 1 1 1 1 = 1 1 n = =A 1 1 1 = = =B 因此用矩阵的形式可表式为 = 在回来分析中通常 存在这时最小二乘估计 可表式为:= (18)当我们求出了 的最小二乘估计 后,就可以建立多元回来方程5例 3 某地区所产原棉的纤维实力Y与纤维的公制支数 ,纤维的成熟度 有关,现实测得28组数据(见下表)试建立Y关于 , 的二元线性回来方程i i 1541515840315620817038125700138401165798159400356741574001755511614194569815540918605915738156165152
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 线性 回归 分析 数学模型
限制150内