数理统计线性回归学习教案.pptx
《数理统计线性回归学习教案.pptx》由会员分享,可在线阅读,更多相关《数理统计线性回归学习教案.pptx(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1数理统计数理统计(sh l tn j)线性回归线性回归第一页,共77页。变量变量(binling)(binling)之之间的关系间的关系确定性关系确定性关系(gun x)(gun x)相相关关(x xi i n ng gg gu u n n)关关系系确定性关系确定性关系身高和体重身高和体重相关关系相关关系相关关系的特征是相关关系的特征是:变量之间的关系很难用一变量之间的关系很难用一种精确的方法表示出来种精确的方法表示出来.回归分析的基本思想回归分析的基本思想第1页/共77页第二页,共77页。变量变量(binling)之间的之间的关系关系n n1.函数关系函数关系(gun x):变量之间
2、依:变量之间依一定的函数形成的一一对应关系一定的函数形成的一一对应关系(gun x),若两个变量分别记做,若两个变量分别记做Y与与X,则当,则当Y与与X之间存在函数关之间存在函数关系系(gun x)时,时,X值一旦被指定,值一旦被指定,Y值就是唯一确定的。如圆的面值就是唯一确定的。如圆的面积与其半径之间的关系积与其半径之间的关系(gun x).第2页/共77页第三页,共77页。n n2.统计相关关系:变量之间存在统计相关关系:变量之间存在某种关系,但变量某种关系,但变量Y并不是由变并不是由变量量X唯一确定的,它们之间没有唯一确定的,它们之间没有(mi yu)严格的一一对应关系。严格的一一对应关
3、系。两个变量间的这种关系就是统两个变量间的这种关系就是统计关系,亦称相关关系。例如计关系,亦称相关关系。例如:小麦的产量小麦的产量Y与施肥量与施肥量x1,品种品种x2等存在关系等存在关系,但给定但给定x1,x2的数值的数值后后Y的值还是无法确定的的值还是无法确定的.两个变量之间若存在线性关系称为线性相关两个变量之间若存在线性关系称为线性相关(xinggun),存在非线性关系称为曲线相关存在非线性关系称为曲线相关(xinggun),通常通过适当的变量变换,曲线,通常通过适当的变量变换,曲线相关相关(xinggun)可转换为线性相关可转换为线性相关(xinggun)。第3页/共77页第四页,共77
4、页。一般说来一般说来,在给定在给定X=x条件下条件下Y的条件概的条件概率分布率分布 ,则则Y与与X的关系就清楚的关系就清楚了了.但在实际中要求解往往是非常困难的但在实际中要求解往往是非常困难的.事实上事实上,对对Y而言而言,在实际中只需知道它的在实际中只需知道它的某个数字特征某个数字特征:条件数学期望条件数学期望 就可以了就可以了.把把 称为称为Y关于关于X的回归方程的回归方程.回归分析的作用回归分析的作用:在于通过对变量在于通过对变量X的观的观测值就可预测测值就可预测Y的取值的取值,并且当并且当 时时,为为Y在方差误差意义下的最佳预测值在方差误差意义下的最佳预测值.第4页/共77页第五页,共
5、77页。确定性关系和相关确定性关系和相关(xinggun)关系的联系关系的联系:由于存在测量误差等原因由于存在测量误差等原因,确定性关系在实际确定性关系在实际问题中往往通过相关关系表示出来问题中往往通过相关关系表示出来;另一方面另一方面,当对当对事物内部事物内部(nib)规律了解得更加深刻时规律了解得更加深刻时,相关关系也有可相关关系也有可能转化为确定性关系能转化为确定性关系.回归分析回归分析处理变量之间的相关关系的一处理变量之间的相关关系的一种数学方法种数学方法(sh xu fn f),它是最常用的数理统计方法它是最常用的数理统计方法.线性回归分析线性回归分析非线性回归分析非线性回归分析回回
6、归归分分析析一元线性回归分析一元线性回归分析多元线性回归分析多元线性回归分析第5页/共77页第六页,共77页。问题问题(wnt)的分析的分析 4.1 4.1 一元线性回归一元线性回归(hugu)(hugu)分分析析第6页/共77页第七页,共77页。问题问题(wnt)的一般提法的一般提法第7页/共77页第八页,共77页。求解求解(qi ji)步骤步骤1.推测推测(tuc)回归函数的形式回归函数的形式方法方法(fngf)一根据专业知识或者经验公式确定一根据专业知识或者经验公式确定;方法二作散点图观察方法二作散点图观察.温度温度x(oC)得率得率Y(%)10011012013014015016017
7、018019045 51 54 61 66 70 74 78 85 89用用MATLAB画出散点图画出散点图例例1为研究某一化学反应过程中为研究某一化学反应过程中,温度温度 对产对产品得率品得率Y(%)的影响的影响,测得数据如下测得数据如下.第8页/共77页第九页,共77页。x=100:10:190;y=45,51,54,61,66,70,74,78,85,89;plot(x,y,.r)第9页/共77页第十页,共77页。一元一元(y yun)线性回归问题线性回归问题2.建立建立(jinl)回归模型回归模型一元线性回归模型一元线性回归模型第10页/共77页第十一页,共77页。3.未知参数未知参数
8、a,b的估计的估计(gj)-最小二乘法最小二乘法第11页/共77页第十二页,共77页。意义:实际测得的点与意义:实际测得的点与直线上的理论直线上的理论(lln)点之间的误差的平方和点之间的误差的平方和最小最小第12页/共77页第十三页,共77页。正规正规(zhnggu)方程组方程组第13页/共77页第十四页,共77页。回归回归(hugu)方程回归方程回归(hugu)直线直线第14页/共77页第十五页,共77页。参参数数估估计计量量的的性性质质(xngzh)第15页/共77页第十六页,共77页。例例2 例例1中的随机变量中的随机变量(su j bin lin)Y 符合一元线性回归模型所符合一元线
9、性回归模型所述的条件述的条件,求求 Y 关于关于 x 的线性回归方程的线性回归方程.温度温度x(oC)得率得率Y(%)10011012013014015016017018019045 51 54 61 66 70 74 78 85 89在在MATLAB中求解中求解(qi ji)x=100:10:190;y=45,51,54,61,66,70,74,78,85,89;polytool(x,y,1,0.05)源程序源程序程序运行结果程序运行结果(ji gu)回归图形回归图形参数传送参数传送置信区间置信区间帮助帮助第16页/共77页第十七页,共77页。残差平方和反应的是在试验残差平方和反应的是在试验
10、(shyn)中由随机因素中由随机因素的影响而引起的误差的影响而引起的误差第17页/共77页第十八页,共77页。离差平方和反应整批数离差平方和反应整批数据据(shj)的波动程度的波动程度回归平方和反应回归直回归平方和反应回归直线引起线引起(ynq)的偏差的偏差平方和分解平方和分解(fnji)式式第18页/共77页第十九页,共77页。例例3 求例求例2中方差的无偏中方差的无偏(w pin)估计估计.第19页/共77页第二十页,共77页。5.线性相关性的显著性检验线性相关性的显著性检验(jinyn)1).F1).F检验法检验法第20页/共77页第二十一页,共77页。2).2).相关系数检验法相关系数
11、检验法第21页/共77页第二十二页,共77页。例例4 检验例检验例 2 中的回归中的回归(hugu)效果是否显著效果是否显著,取显著性取显著性水平为水平为 0.05.3).t3).t检验法检验法第22页/共77页第二十三页,共77页。6.预测预测(yc)与控与控制制控制控制怎样控制怎样控制x的值才能使的值才能使Y的值在要求的值在要求(yoqi)的范围内的范围内预测预测在自变量在自变量 时,估计时,估计Y的观测值所在范围的观测值所在范围(1).回归函数函数值回归函数函数值 的估计的估计预预测测(yc)第23页/共77页第二十四页,共77页。(2).Y 的观察值的观察值 的估计的估计预预测测(yc
12、)第24页/共77页第二十五页,共77页。例例5(续例续例2)解解(1)已知已知第25页/共77页第二十六页,共77页。计算计算(j sun)第26页/共77页第二十七页,共77页。(2)在在MATLAB中求解中求解(qi ji)输出参数输出参数回归直线回归直线第27页/共77页第二十八页,共77页。控制:怎样控制自变量控制:怎样控制自变量x的值才能的值才能(cinng)使使Y的值以的值以1-的置信度落所在要求的区间的置信度落所在要求的区间a,b内内,即即控控制制(kngzh)第28页/共77页第二十九页,共77页。例例6 对某产品的表面进行腐蚀刻线对某产品的表面进行腐蚀刻线(k xin)试验
13、,设腐试验,设腐蚀蚀深度深度Y与时间与时间x的结果如下表:的结果如下表:时间时间x(秒秒)深度深度Y(mm)5 6 10 20 30 40 50 60 65 90 4 6813 16 17 19 25 25 29Y=a+bx+12046(1 1)求)求Y与与x的相关关系;(的相关关系;(2 2)当)当 秒时秒时 的置信度为的置信度为95%95%置信区间;(置信区间;(3 3)要深度在)要深度在10102121之间时腐蚀时间应如何控制。之间时腐蚀时间应如何控制。解:)在解:)在xy坐标系上将描出的散点图坐标系上将描出的散点图由图看出点在一条直线附近,因此可假设由图看出点在一条直线附近,因此可假设
14、(jish)与与x之间有线性相关关系设为:之间有线性相关关系设为:第29页/共77页第三十页,共77页。显著性检验显著性检验(jinyn):参数估计:参数估计:第30页/共77页第三十一页,共77页。预测预测(yc):控制控制(kngzh):第31页/共77页第三十二页,共77页。方法方法通过适当的变量变换通过适当的变量变换,化成一元线性化成一元线性回归问题回归问题(wnt)进行分析处理进行分析处理.两边两边(lingbin)取取对数对数可化为一元可化为一元(y yun)线线性回归的问题性回归的问题第32页/共77页第三十三页,共77页。两边两边(lingbin)取对数取对数曲线曲线(qxin
15、)回归方程回归方程第33页/共77页第三十四页,共77页。例例 表表 9.18 是是 1957 年美国旧轿车价格的调查资料年美国旧轿车价格的调查资料,今今以以 x 表示轿车的使用年数表示轿车的使用年数,Y 表示相应的平均价格表示相应的平均价格(以美以美元元(miyun)计计),求求 Y 关于关于 x 的回归方程的回归方程.表表9.18年数年数x价格价格Y123456789102651194314941087765538484290226204在在MATLAB中求解中求解(qi ji)首先首先(shuxin)作散点图作散点图x=1:1:10;y=2651,1943,1494,1087,765,5
16、38,484,290,226,204;plot(x,y,.r)第34页/共77页第三十五页,共77页。第35页/共77页第三十六页,共77页。选择选择(xunz)模型模型变量变量(binling)变换变换数据变换数据变换 xx=x;yy=log(y);求回归方程求回归方程polytool(xx,yy,1)第36页/共77页第三十七页,共77页。第37页/共77页第三十八页,共77页。线性假设线性假设(jish)的显著性检验的显著性检验线性回归线性回归(hugu)效果高度显著效果高度显著.代回原变量代回原变量(binling),得曲线回归方程得曲线回归方程第38页/共77页第三十九页,共77页。
17、小结小结1.回归分析回归分析(fnx)的任务的任务2.一元线性回归一元线性回归(hugu)的步骤的步骤3.可化为一元可化为一元(y yun)线性回归的问题线性回归的问题研究变量之间的相关关系研究变量之间的相关关系(1)推测回归函数推测回归函数;(2)建立回归模型建立回归模型;(3)估计未知参数估计未知参数;(4)进行假设检验进行假设检验;(5)预测与控制预测与控制.关键关键:选择适当的选择适当的变量代换变量代换.第39页/共77页第四十页,共77页。4.2 4.2 多元多元(du yun)(du yun)线性回线性回归分析归分析第40页/共77页第四十一页,共77页。多元线性回归模型多元线性回
18、归模型 多元线性回归的参数估计、线性相关性的多元线性回归的参数估计、线性相关性的检验以及预测控制检验以及预测控制(kngzh)等问题都可采用等问题都可采用一元线性回归类似的方法求解。一元线性回归类似的方法求解。第41页/共77页第四十二页,共77页。第42页/共77页第四十三页,共77页。化简可得化简可得参数估计:参数估计:达到最小达到最小.使误差平方和使误差平方和第43页/共77页第四十四页,共77页。正规正规(zhnggu)方程组方程组第44页/共77页第四十五页,共77页。最大似然估计值最大似然估计值P元经验线性回归方程元经验线性回归方程正规方程组的矩阵正规方程组的矩阵(j zhn)形式
19、形式第45页/共77页第四十六页,共77页。残差平方和残差平方和估计量的性质估计量的性质(xngzh):离差平方和离差平方和回归平方和回归平方和第46页/共77页第四十七页,共77页。F F检验法检验法:线性相关性的显著性检验线性相关性的显著性检验(jinyn):第47页/共77页第四十八页,共77页。多元多元(du yun)线性回归线性回归1.确定确定(qudng)回归系数的点估计值回归系数的点估计值,用命令用命令:b=regress(Y,X)2.求回归系数的点估计和区间求回归系数的点估计和区间(q jin)估计估计,并检验回并检验回归模型归模型,用命令用命令:b,bint,r,rint,s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 线性 回归 学习 教案
限制150内