一元线性回归分析预测法与多元回归分析.docx
《一元线性回归分析预测法与多元回归分析.docx》由会员分享,可在线阅读,更多相关《一元线性回归分析预测法与多元回归分析.docx(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 一元线性回归分析预测法一、 概念(思路)根据预测变量(因变量)Y和影响因素(自变量)X的历史统计数据,建立一元线性回归方程,然后代入X的预测值,求出Y的预测值的方法。基本公式:y=a+bx其中:aa、b为为回归系系数,是是未知参参数。基本思路路:1、 利用X,Y的历历史统计计数据,求出合合理的回回归系数数:a、b,确确定出回回归方程程2、 根据预计计的自变变量x的的取值,求出因因变量yy的预测测值。二、 一元线性性回归方方程的建建立1、 使用散点点图定性性判断变变量间是是否存在在线性关关系例:某地地区民航航运输总总周转量量和该地地区社会会总产值值由密切切相关关关系。年份总周转量量(亿吨
2、吨公里)Y社会总产产值(百亿元元)X112.5530214.5536314.7738415.1141515.5548616.8852717.5553818.2253.55918.88552、 使用最小小二乘法法确定回回归系数数使实际值值与理论论值误差差平方和和最小的的参数取取值。对应于自自变量xxi,预测测值(理理论值)为b+m*xi,实际际值yii,min(yi-b-mxi)2,求aa、b的的值。使用微积积分中求求极值的的方法,得:由下列方方程代表表的直线线的最小小二乘拟拟合直线线的参数数公式:其中 mm 代表表斜率 ,b 代表截截距。一元线性性回归.xlss三、 回归方程程的显著著性检验验
3、判断X、Y之间间是否确确有线性性关系,判定回回归方程程是否有有意义。有两类检检验方法法:相关关系数检检验法和和方差分分析法1、 相关系数数检验法法构造统计计量r相关系数数的取值值范围为为:-1,11,|rr|的大大小反映映了两个个变量间间线性关关系的密密切程度度,利用用它可以以判断两两个变量量间的关关系是否否可以用用直线方方程表示示。r值两变量之之间的关关系r=1完全正相相关1r0正相关,越接近近1,相相关性越越强。越越接近00,相关关性越弱弱r=0不线性相相关0r-1负相关,越接近近-1,相关性性越强;越接近近0,相相关性越越弱r=-11完全负相相关两个变量量是否存存在线性性相关关关系的定定
4、量判断断规则: 对于给定定的置信信水平,从相相关系数数临界值值表中查查出r临临(n-2),把其与与用样本本计算出出来的统统计量rr0比较:若|r00|rr临(n-2)成成立,则则认为XX、Y之之间存在在线性关关系,回回归方程程在水平上上显著。差异越越大,线线性关系系越好。反之则则认为不不显著,回归方方程无意意义,变变量间不不存在线线性关系系。其中:nn为样本本数。2、 方差分析析法:方差分析析的基本本特点是是把因变变量的总总变动平平方和分分为两部部分,一一部分反反映因变变量的实实际值与与用回归归方程计计算出的的理论值值之差,一部分分反映理理论值与与实际值值的平均均值之差差。Y的总变变差=YY的
5、残余余变差+Y的说说明变差差,SSST=SSSE+SSRR或:总离离差平方方和=剩剩余平方方和+回回归平方方和回归平方方和U与与剩余平平方和QQ相比越越大,说说明回归归效果越越好。注:在方方差分析析中,已已被解释释的和未未被解释释的变差差除以相相应的自自由度的的个数即即变为方方差。YY的方差差是Y的的总偏差差平方和和除以nn-1,被解释释的方差差等于被被解释的的变差(因为回回归只比比估计YY的均值值多用一一个约束束条件),残余余方差等等于残差差偏差平平方和除除以n-2,残残差的方方差S22是误差差方差的的无偏且且一致的的估计(S叫做做回归标标准差)S2=Q/(n-m)定量判断断回归有有效性有有
6、两种方方法:(1) 可决系数数检验法法拟合优度度统计量量;判定定系数 :r22=SSSR/SSST=U/SSyy调整的rr2 =11-QQ/(nn-m)/Syyy/(nn-1)复相关系系数检验验法:构构造统计计量R=SQRRT11-Q/Syyy=SSQRTT(U/Syyy)判断规则则:对于给定定的置信信度,从相相关系数数r分布布表中查查出r临临(n-m),把其与与用样本本计算出出来的统统计量RR0比较:若R0r临(n-m)成成立,则则认为回回归方程程在水平上上显著。反之则则认为不不显著,回归方方程无意意义,变变量间不不存在线线性关系系。(2) F检验法法:构造造统计量量F=(U/mm-1)/Q
7、Q/(nn-m)其中:mm为变量量个数(总数);n为为样本数数。统计量FF服从第第一自由由度为mm-1、第二自自由度为为n-mm的F(m-1,nn-m)分布。F=r22/(11-r22)*(n-mm)/(m-11)判断规则则:对于给定定的置信信度,从FF分布表表中查出出F(m-1,nn-m),把其其与用样样本计算算出来的的统计量量F0比较:若F0F(m-1,nn-m)成立,则认为为回归方方程在水平上上显著。反之则则认为不不显著,回归方方程无意意义,变变量间不不存在线线性关系系。四、 回归方程程没有通通过检验验的原因因1、 定性分析析选择的的各变量量间,本本来不存存在因果果关系。定性分分析设想想
8、不准确确。2、 选择的变变量间存存在因果果关系,但还存存在其它它起着更更重要作作用的变变量尚未未列入模模型之中中。3、 选择变量量之间的的关系是是非线性性关系。五、 利用检验验通过的的回归方方程进行行预测y=6.34+0.2213xx点估计值值:若给给定x值值,则yy的预测测值为66.344+0.2133*588=188.699区间估计计:标准误差差:S=sqrrt(e22)/(n-mm)第二节 一元非线线性回归归分析预预测法思路:与与一元线线性回归归分析基基本相同同。即通通过变量量替换将将非线性性方程转转化为线线性方程程;使用用最小二二乘法建建立线性性回归方方程;在在通过逆逆变换将将线性方方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 分析 预测 多元
限制150内