应用回归分析_总复习.pdf
《应用回归分析_总复习.pdf》由会员分享,可在线阅读,更多相关《应用回归分析_总复习.pdf(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一元线性回归线性回归多元线性回归讨论如何从数据推断回归模型基本假设的合理性回归诊断当基本假设不成立时如何对数据进行修正自变量选择的准则回归变量的选择回归分析逐步回归分析方法岭回归参数估计方法的改进主成分回归非线性回归 可化为线性回归的曲线回归自变量含定性变量的情况含有定性变量的回归因变量是定性变量的情况一元线性回归1 一元线性回归模型2 参数0、1的估计3 最小二乘估计的性质4 回归方程的显著性检验5 残差分析6 回归系数的区间估计7 预测1 一元线性回归模型一元线性回归模型y=0+1x+2)var(0)(E回归方程E(y|x)=0+1x01 yx经验回归方程2 参数0、1的估计一、普通最小二
2、乘估计(Ordinary Least Square Estimation,简记为OLSE)niiiniiixyxyQ1210,121010)(min )(),(10最小二乘法就是寻找参数0、1的估计值使离差平方和达极小2 参数0、1的估计得OLSE 为niniiixxxnxxxL11222)()(niiiniiixyyxnyxyyxxL11)(xxxyLLxy/110记2 参数0、1的估计二、最大似然估计二、最大似然估计在假设iN(0,2)时,知yi服从正态分布:),(210iixNyxxxyLLxy/110220111()niiiyxn3 最小二乘估计的性质一、线性一、线性是y1,y2,yn
3、的线性函数:niiniiiniiniiiyxxxxxxyxx1121211)()()(10、其中用到3 最小二乘估计的性质二、无偏性二、无偏性1110121121)()()()()(niinjjiniinjjixxxxxyExxxxE 0)(xxi)()(2xxxxxiii3 最小二乘估计的性质三、三、的方差的方差njjniinjjixxyxxxx12212121)()var()()var(10、2220)()(1)var(xxxni210),cov(xxLx3 最小二乘估计的性质三、三、的方差的方差10、)(1(,(2200 xxLxnN),(211xxLN在正态假设下,n),(i,j j
4、,ij,i),(,n,i)E(jii210cov2102GaussMarkov条件4 回归方程的显著性检验一、一、t 检验检验原假设:H0:1=0对立假设:H1:10),(211xxLN由当原假设H0:1=0成立时有:),0(21xxLN4 回归方程的显著性检验一、一、t 检验检验构造t 统计量121LxxLtxxniiiniiyynen121222121其中4 回归方程的显著性检验二、二、F检验检验平方和分解式niiiniiniiyyyyyy121212)()()(SST=SSR+SSE构造F检验统计量)2/(1/nSSESSRF4 回归方程的显著性检验三、相关系数的显著性检验三、相关系数的
5、显著性检验 )()()(12121niiniiniiiyyxxyyxxryyyyxxxyLLLLLxx14 回归方程的显著性检验五、三种检验的关系五、三种检验的关系212rrnt121LxxLtxx)2/(1/nSSESSRFH0:=0H0:r=0H0:回归无效4 回归方程的显著性检验六、样本决定系数六、样本决定系数niiniiyyyySSTSSRr12122)()(222)(rLLLSSTSSRryyxxxy可以证明6 回归系数的区间估计回归系数的区间估计等价于),(211xxLN)2()(/11211ntLLtxxxx1)2()(2/11ntLPxx1)(2/112/1xxxxLtLtP)
6、,(2/12/1xxxxLtLt1的的1-置信区间置信区间因变量新值的区间预测因变量新值的区间预测1)2(12/0000nthyyPy0的置信概率为1-的置信区间为1)2(002/0hntyy0的置信度为95%的置信区间近似为20y因变量平均值的区间估计因变量平均值的区间估计得E(y0)的1-的置信区间为E(y0)=0+1x0是常数)(1(,0()(22000 xxLxxnNyEy)2(002/0hnty多元线性回归多元线性回归1 多元线性回归模型2 回归参数的估计3 参数估计量的性质4 回归方程的显著性检验5 中心化和标准化6 相关阵与偏相关系数1 多元线性回归模型一、多元线性回归模型的一般
7、形式一、多元线性回归模型的一般形式y=0+1x1+2x2+pxp+2)var(0)(E1 多元线性回归模型一、多元线性回归模型的一般形式一、多元线性回归模型的一般形式写成矩阵形式为:y y=XX+,其中,nyyy21y)1(11 1pnnpn2n12p22211p1211 x x x x x x x x xXp10 0n211 多元线性回归模型二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定在正态假定下:yN(X,2In)E(y y)=XXvar(y)=2In2 回归参数的估计回归参数的估计一、回归参数的普通最小二乘估计一、回归参数的普通最小二乘估计最小二乘估计要寻找使得,,210
8、pniippiiiniippiiipxxxyxxxyQp1222110,1222110210)(min )(),(210y yX XX XX X-1)(2 回归参数的估计回归参数的估计二、回归值与残差二、回归值与残差cov(e,e)=cov(cov(e,e)=cov((I I-H H)Y,Y,(I I-H H)Y)Y)=(I I-H H)cov(Y,Y)cov(Y,Y)(I I-H H)=2 2(I I-H H)I In n(I I-H H)=2 2(I I-H H)得 D(ei)=(1-hii)2,i=1,2,nH)yH)y-(I(IHyHyy yy yy ye e2 回归参数的估计回归参数
9、的估计二、回归值与残差二、回归值与残差niiepnpnSSEpn12211(1111)e ee e是2的无偏估计2112)1()()(pneDeEniinii得2 回归参数的估计回归参数的估计三三、回归参数的最大似然估计、回归参数的最大似然估计y yN(X,X,2I In)y yX XX XX X-1)(3 参数估计量的性质参数估计量的性质性质性质1是随机向量y的一个线性变换。y yX XX XX X-1)(性质性质2是是的无偏估计。的无偏估计。XXX XX XX XXXX XX XX Xy yX XX XX Xy yX XX XX X)1-1-1-1)()E()()E()()(E(E3 参数
10、估计量的性质参数估计量的性质性质性质3 D()=2(XX)-1 y yX XX XX Xy yX XX XX XE EE E1 11 1E)(E()(E(),cov()(D)11-X XX XX X-X XX XX XXXX XX XX XXXX XX XX X1 11 1()(EE1 11 11 11 11 11 11 1X XX XX XX XX XI IX XX XX XX XX X)X)XX XX XX XX XX XX XX XX XX X2n2)E(E(E3 参数估计量的性质参数估计量的性质性质性质4 Gauss-Markov定理预测函数020210100ppxxxy是的线性函数G
11、auss-Markov定理定理在假定E(y)=X,D(y)=2In时,的任一线性函数的最小方差线性无偏估计(Best Lnear Unbiased Estimator简记为BLUE)为c,其中c是任一p+1维向量,是的最小二乘估计。C4 回归方程的显著性检验回归方程的显著性检验一、一、F检验检验H0:1=2=p=0niiiniiniiyyyyyy121212)()()(SST=SSR+SSE)1/(/pnSSEpSSRF当H0成立时服从)1,(pnpF4 回归方程的显著性检验回归方程的显著性检验二、回归系数的显著性检验二、回归系数的显著性检验H0j:j=0,j=1,2,p(,(X)-1)记(X
12、)-1=(cij)i,j=0,1,2,p构造t统计量jjjjct 其中niiiniiyypnepn121211114 回归方程的显著性检验回归方程的显著性检验四四、复相关系数、复相关系数SSTSSESSTSSRR12决定系数为:y关于x1,x2,xp的样本复相关系数SSTSSRRR2)1(11122RpnnRa2/(1)1/(1)aSSEnpRSSTn Adjusted R-square5 中心化和标准化中心化和标准化一、中心化一、中心化经验回归方程ppxxxy22110经过样本中心);,(21yxxxp将坐标原点移至样本中心,即做坐标变换:,jijijxxx yyyii回归方程转变为:ppx
13、xxy2211ppxxxy22110回归常数项为5 中心化和标准化中心化和标准化二、标准化回归系数二、标准化回归系数样本数据的标准化公式为:,*jjjijijLxxx*yyiiLyyy得标准化的回归方程*2*2*1*1*ppxxxyp,1,j ,*jyyjjjLL违背基本假设的情况违背基本假设的情况),2,1,()(,2,1,)(ni,j j0 ,ij,i,cov n0,iE2jiiGauss-Markov条件违背基本假设的情况违背基本假设的情况2016/12/4JSNU Zhou Qin37 The error ,i =1,2,n,has a normal distribution.The
14、errors,i =1,2,n,have mean zero.The errors,i =1,2,n,have the same variance 2Hetero geneity(方差齐性)or the heteroscedasticity(异方差)problem.(Chapter 7).The errors,i =1,2,n,are independent of each other.Independent-errors assumption.The auto correlation problem is considered in Chapter 8.212,i.i.d(0,)nN5 残差
15、分析残差分析iiiiixyyye10残差误差项iiixy10残差ei是误差项i的估计值。011221122The hat or projection matrixThe l the residual of(1,2,)=.,1,2,()-ev erage value(-)-iiipipiiiiinnijn niiyxxxeyyy inyp yp yp y inpp-1yX=X(XX)XyPyP 杠杆值iiiiii-is the ith diagonal element of are elements of iiijppPP2016/12/4JSNU Zhou Qin4022var()var()v
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 复习
限制150内