数理统计-线性回归.ppt
《数理统计-线性回归.ppt》由会员分享,可在线阅读,更多相关《数理统计-线性回归.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章 回归分析,4.1 一元线性回归分析 4.2 多元线性回归分析,变量之间的关系,确定性关系,相关关系,确定性关系,身高和体重,相关关系,相关关系的特征是:变量之间的关系很难用一 种精确的方法表示出来.,回归分析的基本思想,变量之间的关系,1.函数关系:变量之间依一定的函数形成的一一对应关系,若两个变量分别记做Y与X,则当Y与X之间存在函数关系时,X值一旦被指定,Y值就是唯一确定的。如圆的面积与其半径之间的关系.,2.统计相关关系:变量之间存在某种关系,但变量Y并不是由变量X唯一确定的,它们之间没有严格的一一对应关系。两个变量间的这种关系就是统计关系,亦称相关关系。例如:小麦的产量Y与施肥
2、量x1,品种x2等存在关系,但给定x1,x2的数值后Y的值还是无法确定的.,两个变量之间若存在线性关系称为线性相关,存在非线性关系称为曲线相关,通常通过适当的变量变换,曲线相关可转换为线性相关。,一般说来,在给定X=x条件下Y的条件概率分布 ,则Y与X的关系就清楚了.但在实际中要求解往往是非常困难的.,事实上,对Y而言,在实际中只需知道它的某个数字特征:条件数学期望 就可以了.把 称为Y关于X的回归方程.,回归分析的作用:在于通过对变量X的观测值就可预测Y的取值,并且当 时, 为Y在方差误差意义下的最佳预测值.,确定性关系和相关关系的联系:,由于存在测量误差等原因,确定性关系在实际 问题中往往
3、通过相关关系表示出来;另一方面,当对 事物内部规律了解得更加深刻时,相关关系也有可 能转化为确定性关系.,回归分析处理变量之间的相关关系的一 种数学方法,它是最常用的数理统计方法.,回 归 分 析,问题的分析,4.1 一元线性回归分析,问题的一般提法,求解步骤,1.推测回归函数的形式,方法一根据专业知识或者经验公式确定;,方法二作散点图观察.,用MATLAB画出散点图,例1为研究某一化学反应过程中,温度 对产 品得率Y ( % )的影响, 测得数据如下 .,x=100:10:190;y=45,51,54,61,66,70,74,78,85,89; plot(x,y,.r),一元线性回归问题,2
4、.建立回归模型,3.未知参数a,b的估计-最小二乘法,意义:实际测得的点与直线上的理论点之间的误差的平方和最小,正规方程组,回归方程回归直线,参数估计量的性质,例2 例1中的随机变量 Y 符合一元线性回归模型所 述的条件, 求 Y 关于 x 的线性回归方程 .,在MATLAB中求解,程序运行结果,残差平方和反应的是在试验中由随机因素 的影响而引起的误差,离差平方和反应整批数据的波动程度,回归平方和反应回归直 线引起的偏差,平方和分解式,例3 求例2中方差的无偏估计.,5.线性相关性的显著性检验,1).F检验法,2).相关系数检验法,例4 检验例 2 中的回归效果是否显著,取显著性水平为 0.0
5、5 .,3).t检验法,6.预测与控制,控制怎样控制x的值才能使Y的值在要求的范围内,预测在自变量 时,估计Y的观测值所在范围,(1).回归函数函数值 的估计,预测,(2). Y 的观察值 的估计,预测,例5 (续例2),解(1)已知,计算,(2)在MATLAB中求解,控制:怎样控制自变量x的值才能使Y的值以1-的置信度落所在要求的区间a,b内,即,控制,例6 对某产品的表面进行腐蚀刻线试验,设腐蚀 深度Y与时间x的结果如下表:,Y=a+bx+,(1)求Y与x的相关关系;(2)当 秒时 的置信度为95% 置信区间;(3)要深度在1021之间时腐蚀时间应如何控制。,解:)在xy坐标系上将描出的散
6、点图,由图看出点在一条直线附近,因此可假设与x之间有线性相关关系设为:,显著性检验:,参数估计:,预测:,控制:,方法通过适当的变量变换,化成一元线性 回归问题进行分析处理.,两边取对数,可化为一元线性回归的问题,两边取对数,曲线回归方程,例 表 9.18 是 1957 年美国旧轿车价格的调查资料,今以 x 表示轿车的使用年数, Y 表示相应的平均价格(以美元计), 求 Y 关于 x 的回归方程 .,在MATLAB中求解,首先作散点图,x=1:1:10; y=2651,1943,1494,1087,765,538,484,290,226,204; plot(x,y,.r),选择模型,变量变换,
7、线性假设的显著性检验,线性回归效果高度显著.,代回原变量,得曲线回归方程,小结,1.回归分析的任务,2.一元线性回归的步骤,3.可化为一元线性回归的问题,研究变量之间的相关关系,(1) 推测回归函数; (2) 建立回归模型; (3) 估计未知参数; (4) 进行假设检验; (5) 预测与控制.,关键:选择适当的变量代换.,4.2 多元线性回归分析,多元线性回归的参数估计、线性相关性的检验以及预测控制等问题都可采用一元线性回归类似的方法求解。,化简可得,参数估计:,正规方程组,最大似然估计值,正规方程组的矩阵形式,残差平方和,估计量的性质:,离差平方和,回归平方和,F检验法:,线性相关性的显著性
8、检验:,多元线性回归,1.确定回归系数的点估计值,用命令: b=regress(Y,X),2.求回归系数的点估计和区间估计,并检验回 归模型,用命令: b,bint,r,rint,stats=regress(Y,X,alpha),3.画出残差及其置信区间,用命令: rcoplot(r,rint),附:MATLAB中回归分析的实现,符号说明,(1),(2) alpha为显著性水平, 默认为 0.05;,(3) bint为回归系数的区间估计;,(4) r与rint分别为残差及其置信区间;,(5) stats 是用于检验回归模型的统计量, 有三个 数值, 第一个是相关系数 r2, 其值越接近于 1,
9、 说明回 归方程越显著; 第二个是 F 值, FF1-alpha(p,n-p-1) 时 拒绝 H0, F 越大, 说明回归方程越显著; 第三个是与 F对应的概率 p, palpha 时拒绝, 回归模型成立.,例1测得16名女子的身高和腿长如下(单位:cm):,试研究这些数据之间的关系.,输入数据,x=143,145,146,147,149,150,153,154,155,156,157, 158,159,160,162,164; X=ones(16,1),x; Y=88,85,88,91,92,93,93,95,96,98,97,96,98,99,100, 102;,回归分析及检验,b,bin
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 线性 回归
限制150内