多元正态分布统计推断讲稿.ppt
多元正态分布统计推断第一页,讲稿共四十六页哦3 单个总体均值分量间结构关系的检验单个总体均值分量间结构关系的检验是取自该总体的样本。检验:一、问题引入例 设第三页,讲稿共四十六页哦与上面的假设等价的是,寻找常数矩阵第四页,讲稿共四十六页哦 注:矩阵C不是唯一的,第五页,讲稿共四十六页哦 在例4.2.1中,假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验:第六页,讲稿共四十六页哦则上面的假设可以表达为 第七页,讲稿共四十六页哦二、统计量及方法 其 中 C为 一 已 知 的 kp阶 矩 阵,kp,rank(C)=K,为已知的K维向量。根据多元正态分布的性质可知,检验:第八页,讲稿共四十六页哦 当 为真时,故可以将霍特林分布的统计量换算成F统计量。第九页,讲稿共四十六页哦 对给定的显著性水平,检验的规则 第十页,讲稿共四十六页哦某地区农村男婴的体格测量数据如下编号身高(cm)胸围(cm)上半臂长(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0检验三个指标的均值是否有关系第十一页,讲稿共四十六页哦第十二页,讲稿共四十六页哦4 两个总体均值的检验两个总体均值的检验一、两个独立样本的情形一、两个独立样本的情形 与一元随机变量的情形相同,常常我们需要检验两个总体的均值是否相等。设从总体 ,中各自独立地抽取样本 和 ,。考虑假设 第十三页,讲稿共四十六页哦 根据两个样本可得1和2的无偏估计量为其中第十四页,讲稿共四十六页哦当原假设为真的条件下,检验的规则为:第十五页,讲稿共四十六页哦例:中小企业的破产模型 为了研究中小企业的破产模型,首先选定了X1总负债率(现金收益/总负债),X2收益性指标(纯收入/总财产),X3短期支付能力(流动资产/流动负债)和X4生产效率性指标(流动资产/纯销售额)4个经济指标,对17个破产企业为(1)和21正常运行企业(2)进行了调查,得资料,检验所选择的指标在不同类型企业之间是否有显著的差异。第十六页,讲稿共四十六页哦二、成对试验的T2统计量 n 前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。思考:两独立样本和成对样本的观测值有何不同。第十七页,讲稿共四十六页哦 设(xi,yi),),i=1,2,3,n,时成对的试验数据,由于总体X X和Y Y均服从p维正态分布,且协方差相等。假设检验 第十八页,讲稿共四十六页哦 检验的统计量为 其中 当原假设为真时第十九页,讲稿共四十六页哦例1 一组学生共5人,采用两种不同的方式进行教学,然后对5个学生进行测验,得如下得分数:学生序号教学方式AB数学物理数学物理189908285298888083375696170476706766590766365分析不同的教学方式是否有差异。第二十页,讲稿共四十六页哦5 两个总体均值分量间结构关系的检验两个总体均值分量间结构关系的检验 一、问题提出 设从总体 ,中各自独立地抽取样本 和 ,。他们的均值向量差为:第二十一页,讲稿共四十六页哦 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何?回答采用没有、很小、有些、很大和非常大5个等级,得到结果如表。第二十二页,讲稿共四十六页哦丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4235544555544455545554455434445553355445533453344344443544455345545554454443334444455455555445555第二十三页,讲稿共四十六页哦 现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。第二十四页,讲稿共四十六页哦二、统计量与检验 检验 在原假设为真的条件下,检验的统计量为:第二十五页,讲稿共四十六页哦第二十六页,讲稿共四十六页哦第一节 单因素方差分析问题的提出统计的模型及检验方法多重比较检验第二十七页,讲稿共四十六页哦问题的提出第二十八页,讲稿共四十六页哦某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。a=0.05,0.01。早班中班晚班344939374740355142334839335041355142365140第二十九页,讲稿共四十六页哦为什么各值会有差异?可能的原因有两个。一是,各个班次工人的劳动效率可能有差异,从而导致了不同水平下的观察值之间差异,即存在条件误差。二是,随机误差的存在。如何衡量两种原因所引起的观察值的差异?总平均劳动效率为:第三十页,讲稿共四十六页哦三个班次工人的平均劳动效率分别为:总离差平方和ss组间离差平方和(条件误差)ssA第三十一页,讲稿共四十六页哦组内离差平方和(随机误差)sse统计量F第三十二页,讲稿共四十六页哦把计算的F值与临界值比较,当FF时,拒绝原假设,不同水平下的效应有显著性差异;当FF时,接受原假设。方差来源离差平方和自由度方差F值组间A组内E总和NEXT第三十三页,讲稿共四十六页哦查F分布表得临界值因为故应拒绝原假设,即不同班次工人的劳动效率有显著的差异。方差分析:比较3个或3个以上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。NEXT第三十四页,讲稿共四十六页哦 50家上市公司,按行业计算其1999年底的资产负债情况,如下:序号制造业商业运输业公用事业房地产业165905025702559565307535090584560445936350805409264406565890602570760855830728758856307698090603568106092552566平均58.890.558.933.570.2第三十五页,讲稿共四十六页哦多重比较检验 1、多重比较检验 前面的F检验只能说明在单一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设:因而还应该进一步讨论到底是哪些总体之间存在差异。第三十六页,讲稿共四十六页哦 Scheffe检验检验的结论:第三十七页,讲稿共四十六页哦第三十八页,讲稿共四十六页哦第二节 多元方差分析一、假设第三十九页,讲稿共四十六页哦二、多元方差分析的离差平方和的分解总离差平方和 第四十页,讲稿共四十六页哦第四十一页,讲稿共四十六页哦由于交叉乘积项为零,故组间叉积矩阵组内叉积矩阵总叉积矩阵 组内叉积矩阵:主要由随机因素构成组间叉积矩阵:主要由系统因素构成第四十二页,讲稿共四十六页哦 SSE和SS(TR)之和等于总离差平方和SST。当SSE在SST中占有较大的份额时,可以认为随机因素影响过大,反之SSE所占份额小,SS(RT)所占份额就大,不同试验间的观测值会有显著性差异。三、统计量第四十三页,讲稿共四十六页哦对给定的显著性水平,检验规则为:拒绝原假设;接受原假设;注:关于统计量与F统计量的换算,参看附录。第四十四页,讲稿共四十六页哦例4.6.1n 有四种不同的商品x1,x2,x3和x4,按三种不同的方式销售,有数据如程序数据行,检验三种消费方式是否有显著性差异。第四十五页,讲稿共四十六页哦第四十六页,讲稿共四十六页哦