《一元线性回归分析.ppt》由会员分享,可在线阅读,更多相关《一元线性回归分析.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学模型与数学建模之数学模型与数学建模之于晶贤E-mail:一元线性回归分析回归分析的几个任务回归分析的几个任务(1 1)从一组样本数据出发,确定变量之间的数学关系式;)从一组样本数据出发,确定变量之间的数学关系式;(2 2)对这些关系式的可信程度进行各种统计检验,并从影响)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;些不显著;(3 3)利用所求的关系式,根据一个或几个变量的取值来预测)利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制
2、的或控制另一个特定变量的取值,并给出这种预测或控制的精确程度;精确程度;一个自变量一个自变量一个自变量一个自变量两个及以上自变量两个及以上自变量两个及以上自变量两个及以上自变量回归分析回归分析多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归回归分析的分类回归分析的分类一元线性回归模型一元线性回归模型样本回归函数与总体回归函数区别样本回归函数与总体回归函数区别1、总体回归线是未知的,只有一条。样本回归线是根据样本数、总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。据拟合的,每抽取一组样
3、本,便可以拟合一条样本回归线。2、总体回归函数中的、总体回归函数中的0和和1是未知的参数,表现为常数。而样本是未知的参数,表现为常数。而样本回归函数中的回归函数中的 是随机变量,其具体数值随所抽取的是随机变量,其具体数值随所抽取的样本观测值不同而变动。样本观测值不同而变动。3、总体回归函数中的、总体回归函数中的ut是是t与未知的总体回归线之间的纵向距与未知的总体回归线之间的纵向距离,它是离,它是不可直接观测不可直接观测的。而样本回归函数中的的。而样本回归函数中的t 是是t与与样本回归线之间的纵向距离,当根据样本观测值拟合出样本样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以
4、计算出回归线之后,可以计算出t 的具体数值。的具体数值。误差项的基本标准假定误差项的基本标准假定XYtY 。ut 参数参数 0和和 1的点估计的点估计最小二乘法:最小二乘法:通过使得残差平方和通过使得残差平方和(各样本点与拟合直(各样本点与拟合直线的纵向距离的平方线的纵向距离的平方和)为最小来估计回和)为最小来估计回归系数的一种方法。归系数的一种方法。食品序号食品序号脂肪脂肪X Xt t热量热量Y Yt tX Xt t平方平方Y Yt t平方平方X Xt tY Yt t1 14 4110110161612100121004404402 26 61201203636144001440072072
5、03 36 6120120363614400144007207204 48 816416464642689626896131213125 51919430430361361184900184900817081706 611111921921211213686436864211221127 712121751751441443062530625210021008 812122362361441445569655696283228329 926264294296766761840411840411115411154101021213183184414411011241011246678667811
6、111111249249121121620016200127392739121216162812812562567896178961449644961313141416016019619625600256002240224014149 9147147818121609216091323132315159 9210210818144100441001890189016165 512012025251440014400600600求和求和18918934613461279927999077179077174952649526例例总体方差总体方差2 2估计估计最小二乘估计的性质最小二乘估计的性质根据
7、误差项的基本标准假定根据误差项的基本标准假定可以证明可以证明参数参数 0 0和和 1 1的区间估计的区间估计回归分析的回归分析的ExcelExcel实现实现“工具工具”-“数据分析数据分析”-“回归回归”一元线性回归模型的检验一元线性回归模型的检验回归模型的检验包括:理论意义的检验、一级检验、二级检验。回归模型的检验包括:理论意义的检验、一级检验、二级检验。(1)理论意义检验:理论意义检验:主要检查参数估计值的符号和取值区间的合主要检查参数估计值的符号和取值区间的合理性,如果它们与实质性科学的理论以及人们的实践经验不相理性,如果它们与实质性科学的理论以及人们的实践经验不相符,则说明模型不能很好
8、地解释现实的现象。符,则说明模型不能很好地解释现实的现象。(2)一级检验:一级检验:又称为统计学检验,具体分为拟合程度评价和显又称为统计学检验,具体分为拟合程度评价和显著性检验(回归方程的显著性检验和回归方程中参数的显著性著性检验(回归方程的显著性检验和回归方程中参数的显著性检验)。检验)。(3)二级检验:二级检验:对标准线性回归模型的假定条件能否满足进行检对标准线性回归模型的假定条件能否满足进行检验,主要包括:序列相关检验、异方差检验、多重共线性检验验,主要包括:序列相关检验、异方差检验、多重共线性检验等。等。拟合程度评价拟合程度评价拟合程度是指样本观测值聚集在样本回归线周围的紧拟合程度是指
9、样本观测值聚集在样本回归线周围的紧 密程度密程度.决定系数越大,模型拟合程度越好;决定系数越小,决定系数越大,模型拟合程度越好;决定系数越小,模型拟合程度越差;模型拟合程度越差;对于一元线性回归分析,决定系数就是两变量之间对于一元线性回归分析,决定系数就是两变量之间相关系数的平方。相关系数的平方。回归方程的显著性检验回归方程的显著性检验离差名称离差名称平方和平方和自由度自由度均方差均方差F回归平方和回归平方和SSR1SSR/1残差平方和残差平方和SSEn-2SSE/n-2总离差平方和总离差平方和SSTn-1P值是由检验统计量的样本观察值得出的原假设可被值是由检验统计量的样本观察值得出的原假设可
10、被拒绝的最小显著性水平。拒绝的最小显著性水平。P值越小值越小(P值小于显著性水平值小于显著性水平),越拒绝原假设。,越拒绝原假设。回归方程的显著性检验过程回归方程的显著性检验过程参数的显著性检验参数的显著性检验一元线性回归模型的预测一元线性回归模型的预测续例:假定一种新型点心中含有续例:假定一种新型点心中含有10克脂肪,利用样本克脂肪,利用样本的回归方程和相关数据,计算置信度为的回归方程和相关数据,计算置信度为95%的热量的的热量的预测区间预测区间.回归分析的回归分析的SPSS实现实现“Analyze-Regression-Linear”练习:练习:某国营农场在试验田上研究耕种深度对水稻产量的
11、关系,所得某国营农场在试验田上研究耕种深度对水稻产量的关系,所得资料如下表。要求资料如下表。要求:(1)(1)试求水稻产量与耕种深度的直线回归方程;试求水稻产量与耕种深度的直线回归方程;(2)(2)计算相关系数;计算相关系数;(3)(3)在显著性水平在显著性水平=0.05=0.05时,对回归方程进行显著性检验;时,对回归方程进行显著性检验;(4)(4)计算估计标准误差;计算估计标准误差;(5)(5)若耕种深度为若耕种深度为1717厘米,在厘米,在95%95%的概率保证下,试推算水稻产的概率保证下,试推算水稻产量的区间范围。量的区间范围。耕种深度(厘米)耕种深度(厘米)81012141618公顷产量(吨)公顷产量(吨)6.07.57.89.210.812.0离差名称离差名称平方和平方和 自由度自由度均方差均方差F回归平方和回归平方和24.37124.37187.46残差平方和残差平方和0.5240.13总离差平方和总离差平方和24.895谢谢 谢谢 大大 家家
限制150内