数理统计课件 62 多元线性回归分析.pdf
《数理统计课件 62 多元线性回归分析.pdf》由会员分享,可在线阅读,更多相关《数理统计课件 62 多元线性回归分析.pdf(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 6.2 多元线性回归分析多元线性回归分析 一、多元线性回归模型一、多元线性回归模型 上节讨论了一元回归模型,在实际问题中,遇到更多的是讨论随机变量上节讨论了一元回归模型,在实际问题中,遇到更多的是讨论随机变量Y与非随机变量与非随机变量12,mxxx?之间的关系,本节假设它们具有线性关系之间的关系,本节假设它们具有线性关系 011mmYxx=+?=+?(6.15)这里这里2(0,)N ,201,m?都是未知参数,都是未知参数,1m 。一般称由式。一般称由式(6.15)定义的模型为多元线性回归模型,称定义的模型为多元线性回归模型,称12,mxxx?为回归变量,为回归变量,01,m?为回归系数。为
2、回归系数。设设12(,)TiiimixxxY?(1,2,)in=?是是12(,)TmxxxY?的的n个独立观测,则它们满足关系个独立观测,则它们满足关系 01122,1,iiimimiYxxxin=+=+=?(6.16)假设假设i 相互独立相互独立,且且2(0,)(1,)iNin=?由于假设由于假设i 相互独立,由式相互独立,由式(6.16)知知iY亦相互独立,且亦相互独立,且 01122iiimimEYxxx=+=+?,2iDY=,则有则有 201122(,),(1,2,)iiimimYNxxxin+=+=?。对式对式(6.15)求数学期望求数学期望 01122mmEYxxx=+=+?一般称
3、一般称 01122mmYxxx=+?=+?为为Y关于关于12,mxxx?的的(理论理论)线性回归方程。线性回归方程。为了今后讨论方便,引入向量、矩阵记号,则式为了今后讨论方便,引入向量、矩阵记号,则式(6.16)可写成矩阵形式。令可写成矩阵形式。令 1201(,),(,)nmYY YY=?,12(,)n =?111212122212111mmnnnmxxxxxxXxxx =?式式(6.16)的矩阵表达式为的矩阵表达式为 YX =+(6.16)EYX=因因 nnijYY=)(),cov(,=jijiYYjjij,0,),cov(2 故故 2cov(,)()()nY YE YEY YEYI =这里
4、这里nI表示表示n阶单位阵。对式阶单位阵。对式(6.15)给出的给出的m元线性回归模型,通常所考虑的问题是,对未知参数元线性回归模型,通常所考虑的问题是,对未知参数 和和2 进行估计,对进行估计,对 的某种假设进行检验,对的某种假设进行检验,对Y进行预报等。在下述讨论中,一般总假定进行预报等。在下述讨论中,一般总假定nm 和矩阵和矩阵X的秩等于的秩等于1m+。二、参数的估计二、参数的估计 对式对式(6.16),通常采用最小二乘法寻求,通常采用最小二乘法寻求 的估计量的估计量,即寻找,即寻找 的估计的估计 满足下面的条件满足下面的条件 221010()min()nmnmiijjiijjijijY
5、xYx =,j (6.17)这里这里01,(1,2,)ixin=?,或写成矩阵形式,或写成矩阵形式 22|min|YXYX =(6.17)一般可用微分法求式一般可用微分法求式(6.17)的解的解.令令210()()nmiijjijQYx =求解方程组求解方程组 210()()0nmiijjijkkjjYxQ=,可得可得 10()0,0,1,nmiijjikijYxxkm=?,将上式变形可写为将上式变形可写为 110nnmiikijikjiijY xx x=01(),0,1,mnijikjjix xkm=?用矩阵表示,上述方程组可写为用矩阵表示,上述方程组可写为 ()X YX X=,(6.18)
6、式式(6.18)一般称为正规方程,由于假设了一般称为正规方程,由于假设了X的秩为的秩为1m+,所以,所以X X 是正定矩阵,因而存在逆阵是正定矩阵,因而存在逆阵1()X X ,由式,由式(6.18)可得可得 1()X XX Y=(6.19)将将 代入线性回归方程,于是可得代入线性回归方程,于是可得 0Y=+=+11x+22x+?mmx (6.20)以后将式以后将式(6.20)亦简称为线性回归方程,由此出发,可对亦简称为线性回归方程,由此出发,可对Y进行预测。进行预测。类似上节对一元线性回归模型对类似上节对一元线性回归模型对2 的讨论,可用统计量的讨论,可用统计量 2*2101()1nmiijj
7、ijYxnm =(6.21)作为作为2 的估计,式的估计,式(6.21)也可用矩阵表示为也可用矩阵表示为 2*1()1YXnm =()YX 111()()1YX X XX YYX X XX Ynm=11()11()1nYIX X XXYnmY YX Ynm=例题 6.5 例题 6.5 某种水泥在凝固时放出的热量某种水泥在凝固时放出的热量Y(单位:cal)与水泥中下列四种化学成分有关:(1)(单位:cal)与水泥中下列四种化学成分有关:(1)123:3xCaO Al O;(2);(2)22:3xCaO SiO;(3);(3)32323:4xCaO Al OFe O;(4);(4)42:2xCaO
8、 SiO 通过实验得到数据列于表 6.2 中,求通过实验得到数据列于表 6.2 中,求Y对对1234(,)Txxxx的线性回归方程。将数据代入式(6.9),经计算可得 的线性回归方程。将数据代入式(6.9),经计算可得 01234(,)(62.45021.55110.51010.10190.1441)=则所求的线性回归方程为 则所求的线性回归方程为 123462.45021.55110.51010.10190.1441Yxxxx=+=+表 6.3 给出了 表 6.3 给出了iiYY 的数据表。的数据表。表 6.2 表 6.2 序号 1%x 2%x 3%x 4%x Y 1 2 3 4 5 6 7
9、 8 9 10 11 12 13 7 1 11 11 7 11 3 1 2 21 1 11 10 26 29 56 31 52 55 71 31 54 47 40 66 68 6 15 8 8 6 9 17 22 18 4 23 9 8 60 52 20 47 33 22 6 44 22 26 34 12 12 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 1 2 3 4 5 6 7 8 9 10 11 12 13 7 1 11 11 7 11 3 1 2 21 1 11 10 26 29 56 3
10、1 52 55 71 31 54 47 40 66 68 6 15 8 8 6 9 17 22 18 4 23 9 8 60 52 20 47 33 22 6 44 22 26 34 12 12 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 表 6.3 表 6.3 序号 iY iY iiYY 1 2 3 4 5 6 7 8 9 10 11 12 13 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 78.5
11、0 72.79 105.97 89.33 95.65 105.27 104.15 75.67 91.72 115.62 81.81 112.33 111.69 0.00 1.51-1.67-1.73 0.25 3.93-1.45-3.18 1.38 0.28 1.99 0.97-2.29 1 2 3 4 5 6 7 8 9 10 11 12 13 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 78.50 72.79 105.97 89.33 95.65 105.27 104.15 75.67 91.
12、72 115.62 81.81 112.33 111.69 0.00 1.51-1.67-1.73 0.25 3.93-1.45-3.18 1.38 0.28 1.99 0.97-2.29 三、估计量的分布及性质 三、估计量的分布及性质 一般来说,给定一组观测数据,代入式式一般来说,给定一组观测数据,代入式式(6.19)(6.19)中,便可得到线性回归方程,即使中,便可得到线性回归方程,即使Y与回归变量与回归变量1(,)Tmxx?不具有线性关系,形式上也能得到线性回归方程,因此,须对回归系数做类似一元情形的假设检验.为此,先讨论估计量的分布,由式(6.19)可知:不具有线性关系,形式上也能得到
13、线性回归方程,因此,须对回归系数做类似一元情形的假设检验.为此,先讨论估计量的分布,由式(6.19)可知:1()X XX Y=,即,即 的任一分量均是独立正态随机变量的任一分量均是独立正态随机变量1,nYY?的线性组合,由多元分布理论,随机向量的线性组合,由多元分布理论,随机向量 服从服从1m+维正态分布 维正态分布 111()()()EE X XX YX XX EYX XX X=所以,所以,是是 的无偏估计。由公式:的无偏估计。由公式:cov(,)cov(,)TAX BYAX Y B=得 得 cov(,11)()cov(,)()X XXY Y X X X =12121()()()()nX X
14、XIX X XX X=令 令21()CX X=,则,则 服从服从1m+维正态分布,密度函数为 维正态分布,密度函数为 1111221()(2)|exp()(),2mmf xCxCxxR+=性质 1.性质 1.是是Y的线性函数,服从的线性函数,服从1m+维正态分布,均值维正态分布,均值E =,协方差阵为,协方差阵为21()X X 注:注:如果估计量是如果估计量是Y的线性函数,则称这一估计量为线性估计.由性质 1 知的线性函数,则称这一估计量为线性估计.由性质 1 知 是是 的线性无偏估计。若的线性无偏估计。若T是是 的另一估计,且的另一估计,且T Tcov(,)cov(,)为非负定矩阵,则称为非
15、负定矩阵,则称 的方差不大于的方差不大于T的方差。的方差。性质 2.性质 2.是是 的最小方差线性无偏估计 的最小方差线性无偏估计 证明.证明.设设T是是 的任一线性无偏估计,则的任一线性无偏估计,则T必可表为:必可表为:TAY=且且ETAEYAX =。由于。由于 的任意性,则必有:的任意性,则必有:1mAXI+=,由 ,由 2cov(,)cov(,)()T TAY Y AAA =,并考虑到,并考虑到 1111111110()()()()()()()()()()()()AX XXAX XXAAX XX XX AAX X XAAX XX XX XAAX X =+=+=+=+=则 则1()()AA
16、X X 为非负定矩阵。由为非负定矩阵。由T的任意性,且 的任意性,且 221 cov(,)cov(,)()()cov(,)T TAY Y AAAX X =所以 所以 是是 的最小方差线性无偏估计。令 的最小方差线性无偏估计。令 YYX=?=?则有则有1(),nYIX X XXY=?Y?称为残差向量。称为残差向量。性质 3性质 3 Y?和和 互不相关。互不相关。由于 由于 11cov(,)()cov(,)()nYIX X XXY YX XX =?211()()0nIX X XXX XX =故性质 3 成立。故性质 3 成立。性质 4 性质 4 0EY=?21cov(,)()nY YIX X XX
17、 =?=?事实上,事实上,()0EYE YXXX=?=?1121cov(,)()cov(,)()()nnnY YIX X XXY YIX X XXIX X XX =?=?令 令2QY YY=?=?,称,称Q为残差平方和,则 为残差平方和,则 21121()()cov(,)()nniiiinE QE Y YEYDYtrY Ytr IX X XX=?2121()()nntrItr X X XXtrItr X X X X=221()(1)mntrInm+=这里 这里1niiitrAa=称为称为nn 矩阵矩阵A的迹,由的迹,由2*的定义知 的定义知 2*21()1EE Qnm =定理 6.2定理 6.
18、2 若 若1(,)(1,2,)iimixxYin=?满足式(6.16),则:(1)满足式(6.16),则:(1)和和Y?相互独立,且服从于正态分布;(2)相互独立,且服从于正态分布;(2)和和2*相互独立;(3)相互独立;(3)2*2(1)nm 服从服从2(1)nm 分布 分布 证明证明 (1)由于(1)由于(,)Y?为为Y的线性函数,的线性函数,1,nYY?独立且服从正态分布,故独立且服从正态分布,故(,)Y?服从正态分布,由性质 3,服从正态分布,由性质 3,Y?和和 互不相关,从而互不相关,从而 和和Y?相互独立。(2)由相互独立。(2)由2*的定义和(1)知,的定义和(1)知,和和2*
19、相互独立。(3)记相互独立。(3)记1()BX X XX=,由于,由于B是是nn 非负定阵,秩为非负定阵,秩为1m+,则存在,则存在n阶正交阵阶正交阵D,使得,使得 11000mDBD+=?,这里 ,这里 ,0,1,1niDDIim =+?=+?由 由 211()()BBBX X XXX X XXB =,则 ,则 2DB DDBD=所以有 所以有2ii =,即,即1,1,2,1iim=+?=+?,则,则 1000mIDBD+=作变量变换 作变量变换 1(,)()nZZZD YX =?,则,则 22()0cov(,)nnEZDE YXZ ZDI DI =由于 由于Z为正态随机向量,上式表明为正态
20、随机向量,上式表明1,nZZ?相互独立,同服从于相互独立,同服从于2(0,)N 分布。由 分布。由 111()()()()XXX X XX YXX X XXYXX X XX D Z=则 则 2()()XXXXXX =?Z DX X XX D Z1()=12211000mmIZZZZ+=+?=+?由 由 11122221112222221()()()()()()(),nnnnmmnniiQYIX X XXYYXIX X XXYXZ D IX X XXD ZZZZZZZYXZQXX+=+=+=+=+=+=+=+?故 故2Q 服从服从2(1)nm 分布,即 分布,即 2*22(1)(1)nmnm 亦
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计课件 62 多元线性回归分析 数理统计 课件 多元 线性 回归 分析
限制150内