《应用多元分析》第三版(第四章--多元正态总体的统计推断).ppt
《《应用多元分析》第三版(第四章--多元正态总体的统计推断).ppt》由会员分享,可在线阅读,更多相关《《应用多元分析》第三版(第四章--多元正态总体的统计推断).ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4.2 单个总体均值的推断v一、均值向量的检验v二、置信区域v三、联合置信区间一、均值向量的检验v设x1,x2, ,xn是取自总体xNp (, )的一个样本,这里0,np,欲检验H0:=0,H1:0v1.已知 检验统计量为 拒绝规则为:若 ,则拒绝H021000Tnxx 220Tpv2. 未知 检验统计量为 称之为霍特林(Hotelling)T2 统计量。当 H0 为真时 服从F(p,np) ,对给定的显著性水平,拒绝规则为: 若 ,则拒绝H0 其中。2100TnxSx21,p nTFp npnp21npTp n22TTv例4.2.1 对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量
2、,得样本数据如表4.2.1所示。根据以往资料,该地区城市2周岁男婴的这三个指标的均值0=(90,58,16),现欲在多元正态性假定下检验该地区农村男婴是否与城市男婴有相同的均值。这是假设检验问题:H0:=0,H1:0表4.2.1 某地区农村男婴的体格测量数据编 号身高(cm)胸围(cm)上半臂围(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0查表得F0.01(3,3)=29.5,于是故在显著性水平=0.01下,拒绝原假设H0,即认为农村与城市的2周岁男婴上述三个指标的均值有显著差异(p=0.002)。0
3、11282.08.060.2 ,2.214.51.531.6008.0400.5008.0403.1721.3100.5001.3101.9004.310714.62108.946423.1384814.621059.790037.37608.946437.376035.5936TxxSS1006 70.0741420.445nxSx20.010.013 53,3147.53TF二、置信区域212212,1,111TnnpTF p npp nnpPTFp npp nP nT xSxxSxv的置信度为1的置信区域为 当p=1时,它是一个区间;当p=2时,它是一个椭圆,这时可将其在坐标平面上画出;
4、当p=3时,它是一个椭球;当p3时,它是一个超椭球;它们均以 为中心。v同置信区间与假设检验的关系一样,置信区域与假设检验之间也有着同样的密切关系。一般来说,0包含在上述置信区域内,当且仅当原假设 H0:=0在显著性水平下被接受。因此,可以通过构造的置信区域的方法来进行假设检验。12:nTxSxx三、联合置信区间即以1的概率对一切aRp成立,称它为一切线性组合a,aRp的置信度为1的联合置信区间(simultaneous confidence intervals)。v对k个线性组合ai,i=1,2, ,k,有TnTn a xa Saa a xa Sa1PTnTn aa xa Saa a xa
5、Sa11kiiiiiiiiPTnTn a xa Saa a xa Sav当k很小时,联合T2置信区间的置信度一般会明显地大于1,因而上述区间会显得过宽,即精确度明显偏低。这时,我们可以考虑采用邦弗伦尼 (Bonferroni)联合置信区间:它的置信度至少为1。v若t/2k(n1)T ,则邦弗伦尼区间比T2区间要窄,这时宜采用前者作为联合置信区间;反之,若t/2k(n1)T,则邦弗伦尼区间比T2 区间宽,宜采用后者作为联合置信区间。v当k=p时,邦弗伦尼区间要比T2 区间窄。故在求的所有p个分量1, 2, , p的联合置信区间时,应采用邦弗伦尼区间。,1,2,iiiiiiiTnTnika xa
6、Saa a xa Sa/2/2111,2,ikiiiikiitnntnnika xa Saa a xa Sav例4.2.2 为评估某职业培训中心的教学效果,随机抽取8名受训者,进行甲和乙两个项目的测试,其数据列于表4.2.2。假定x=(x1,x2)服从二元正态分布。n=8,p=2,取1=0.90,F0.10(2,6)=3.46,于是,T0.10=2.841。表4.2.2 两个项目的测试成绩编 号12345678甲项成绩x16280668475805479乙项成绩x27077758787916184172.5112.571496.1429,7996.1429103.14290.04360.040
7、60.04060.0475xSS的0.90置信区域为即 0.0436(172.5)20.0812(172.5)(279)+0.0475(279)21.009这是一个椭圆区域。1和2的0.90联合T2置信区间为即61.84183.16,68.80289.20这两个区间分别正是椭圆在1轴和2轴上的投影。112272.50.04360.0406872.5,798.073790.04060.04751272.52.841112.5714/872.52.841112.5714/8792.841103.1429/8792.841103.1429/81和2的0.90邦弗伦尼联合置信区间为(t0.025(7)
8、=2.3646)即63.63181.37,70.51287.49这个联合置信区间在精确度方面要好于T2联合置信区间。由该联合置信区间可得到置信度至少为0.90的矩形置信区域(见图4.2.1中的实线矩形),但其矩形面积要大于椭圆面积。1272.52.3646112.5714/872.52.3646112.5714/8792.3646103.1429/8792.3646103.1429/8图4.2.1 置信椭圆和联合置信区间利用置信区域进行假设检验v在例4.2.2中,如果在 =0.10下对假设 H0:=0,H1:0 进行检验,其中=(1,2),0=(01,02) ,则我们容易利用图4.2.1中的椭
9、圆得出检验的结果。若被检验值0位于图4.2.1中的椭圆外,则拒绝;反之,则接受。v图4.2.1中的虚线矩形在1和2轴上的区间范围分别是1和2的0.90置信区间。当0位于椭圆外虚线矩形内的位置(如图中A点)时,检验结果虽拒绝H0,但如在=0.10下分别检验H01:1=01,H11:101 和 H02:2=02,H12:202则检验结果都将接受原假设;当0位于椭圆内虚线矩形外的位置(如图中B点)时,检验结果虽接受H0,但H01:1=01和H02:2=02都将会被拒绝。4.3 单个总体均值分量间结构关系的检验v设x1,x2, ,xn是取自多元正态总体Np(,)的一个样本,0,np,欲检验H0:C=,
10、H1:C其中C为一已知的kp矩阵,kp,rank(C)=k,为已知的k维向量。v根据多元正态分布的性质知CxNk(C,CC)由于 111222rankrankrankrankk CCCCCC故CC0。故我们可以用上一节检验假设H0:=0的方法来检验上述假设。检验统计量为当原假设H0:C=为真时,对于给定的显著性水平,拒绝规则为:若 ,则拒绝H0其中 。v特别地,若欲检验H0:C=0,H1:C0则T2可简化为 12TnCxCSCCx2,1nkTF k nkk n22TT21,k nTFk nknk12Tn x C CSCCxv例4.3.1 设xNp(,),=(1,2, ,p),0,x1,x2,
11、,xn是取自该总体的一个样本,欲检验H0:1=2= =p,H1:ij,至少存在一对ij令则上面的假设可表达为H0:C=0,H1:C0检验统计量为110010101001C12Tn x CCSCCx对于给定的显著性水平,拒绝规则为:若 ,则拒绝H0其中由于C是行满秩的,且每行均为对比向量(即有一个1和一个1,其余皆为0),故称C为对比矩阵。该例中对比矩阵C的选择不是惟一的,比如也可以选取对比矩阵为22TT2111,11pnTFpnpnp*110001100001Cv例4.3.2 在例4.2.1中,假定人类有这样一个一般规律:身高、胸围和上半臂围的平均尺寸比例为6:4:1,我们希望检验表4.2.1
12、中的数据是否符合这一规律,也就是欲检验H0:1/6=2/4=3,H1:1/6, 2/4, 3至少有两个不等令则上面假设可表达为H0:C=0,H1:C0经计算从而230106C16.658.46856.660,4.056.66094.000 CxCSC故又因所以拒绝原假设H0,即认为这组数据与人类的一般规律不一致(p=0.008)。上述的C也可以选择为检验的结果是不变的。1194.00056.6602285.636456.66058.468CSC126 8.45050.700Tn x C CSCCx220.010.0112 5,18.0454k nTFk nkTnk*014106C4.4 两个总
13、体均值的比较推断v一、两个独立样本的情形v二、成对试验的T2统计量一、两个独立样本的情形v设从两个总体Np(1,)和Np(2,)中各自独立地抽取一个样本 和 ,0,欲检验H0:1=2,H1:121,2的无偏估计的联合无偏估计其中12111211,nniiiinnxxyy112,nx xx212,ny yy112212112pnnnnSSS1212111211,11nniiiiiinnSxxxxSyyyy为两个样本协方差矩阵。霍特林T2检验统计量当原假设H0为真时,对给定的,拒绝规则为:若 ,则拒绝H0其中121112121211ppn nTnnnnxySxyxySxy21212121,12nn
14、pTF p nnpp nn22TT12212122(1)1p nnTFpnnpnnp,v在实际应用中,一旦H0:1=2被拒绝了,则可以考虑对所有的i(1ip),在相同的显著性水平下再进一步检验H0i:1i=2i,以判断是否有分量及(若有)具体是哪些分量对拒绝H0:1=2起了较大作用,这样做常常是有益的。va(12),aRp的1联合置信区间为v当k很小时,可采用邦弗伦尼不等式给出ai(12),i=1,2, ,k的1联合置信区间1212121212ppnnnnTTn nn n axya S aaaxya S a12/212121212/2121222ikipiiikipinntnnn nnntnn
15、n naxya S aaaxya S av例4.4.1(例4.2.1续) 表4.4.1给出了相应于表4.2.1的9名2周岁女婴的数据。我们欲在多元正态性假定下检验2周岁的男婴与女婴的均值向量有无显著差异。表4.4.1 某地区农村女婴的体格测量数据编 号身高(cm)胸围(cm)上半臂围(cm)18058.414.027559.215.037860.315.047557.413.057959.514.067858.114.577558.012.586455.511.098059.212.5从例4.2.1得从表4.4.1计算得1116,82.0, 60.2,14.5158.0040.202.5014
16、0.2015.866.552.506.559.50nnxS222976.0,58.4,13.5196.0045.1034.50145.1015.7611.6534.5011.6514.50nnyS,所以因,故不能拒绝原假设H0,即认为两个均值向量无显著差异(p=0.27)。1122122112126.0,1.8,1.027.23086.56152.8462116.56152.43231.400022.84621.40001.84625.312ppnnnnn nTnnxySSSxySxy1220.050.0512120.052(1)13 133 133,113.5912.7281111p nnT
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用多元分析 应用 多元 分析 第三 第四 总体 统计 推断
限制150内