[统计学]多元统计分析2第二章均值向量和协方差阵的检验课件.ppt
《[统计学]多元统计分析2第二章均值向量和协方差阵的检验课件.ppt》由会员分享,可在线阅读,更多相关《[统计学]多元统计分析2第二章均值向量和协方差阵的检验课件.ppt(98页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/1/91 多元统计分析多元统计分析中国人民大学中国人民大学出版社出版社2023/1/9中国人民大学六西格玛质量管理研究中心2第第二二章章 均值向量和协方差阵的检验均值向量和协方差阵的检验 目录 上页 下页 返回 结束 2.1 均值向量的检验均值向量的检验2.2 协方差阵的检验协方差阵的检验2.3 形象分析形象分析2.4 有关检验的上机实现有关检验的上机实现2023/1/9中国人民大学六西格玛质量管理研究中心3第第二二章章 均值向量和协方差阵的检验均值向量和协方差阵的检验 目录 上页 下页 返回 结束 以以做检验。做检验。2023/1/9中国人民大学六西格玛质量管理研究中心4第第二二章
2、章 均值向量和协方差阵的检验均值向量和协方差阵的检验 目录 上页 下页 返回 结束 2023/1/9中国人民大学六西格玛质量管理研究中心5 目录 上页 下页 返回 结束 2.1 2.1 均值向量的检验均值向量的检验2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2.1.2 2.1.2 多元均值检验多元均值检验 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 2.1.4 2.1.4 多总体均值的检验多总体均值的检验2023/1/9中国人民大学六西格玛质量管理研究中心6 目录 上页 下页 返回 结束 2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2023/1/9
3、中国人民大学六西格玛质量管理研究中心7 目录 上页 下页 返回 结束 2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2023/1/9中国人民大学六西格玛质量管理研究中心8 目录 上页 下页 返回 结束 2.1.1 2.1.1 一个指标检验的回顾一个指标检验的回顾2023/1/9中国人民大学六西格玛质量管理研究中心9 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 2023/1/9中国人民大学六西格玛质量管理研究中心10 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 2023/1/9中国人民大学六西格玛质量管理研究中
4、心11 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 2023/1/9中国人民大学六西格玛质量管理研究中心12 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 ()协方差阵)协方差阵已知已知 类似于(类似于(2.32.3)的统计量(注意()的统计量(注意(2.32.3)的形式)是)的形式)是可以证明,在假设可以证明,在假设 为真时,统计量为真时,统计量 遵从自由度为遵从自由度为p p的的 分布;事实上由分布;事实上由1.5 1.5 2023/1/9中国人民大学六西格玛质量管理研究中心13 目录 上页 下页 返回 结束 2.1.2
5、 2.1.2 多元均值检验多元均值检验 统计量统计量 实质上是样本均值实质上是样本均值 与已知平均水平与已知平均水平 之间的马之间的马氏距离的氏距离的 倍,这个值越大,倍,这个值越大,与与 相等的可能性就越小,相等的可能性就越小,因而,在备择假设因而,在备择假设 成立时,成立时,有变大的趋势,所以拒绝域应有变大的趋势,所以拒绝域应取为取为 值较大的右侧部分。式中值较大的右侧部分。式中 是样本均值,是样本均值,是样本容量。是样本容量。当给定显著性水平当给定显著性水平 后,由样本值可以算出后,由样本值可以算出 的值,当的值,当时,便拒绝零假设时,便拒绝零假设 ,说明均值,说明均值不等于不等于 ,其
6、中,其中 是是自由度为自由度为P P的的 分布的分为点。即分布的分为点。即2023/1/9中国人民大学六西格玛质量管理研究中心14 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 ()协方差阵)协方差阵未知未知 此时此时的无偏估计是的无偏估计是 ,类似于式(,类似于式(2.3)的统计量是:的统计量是:可以证明,统计量遵从参数为可以证明,统计量遵从参数为p p,n n-1,-1,,的,的 分布,即分布,即 。统计量。统计量 实际上也是样本均值实际上也是样本均值 与已知均值向量与已知均值向量 之间的之间的马氏距离再乘以马氏距离再乘以n n(n n-1)-1),这个值
7、越大,这个值越大,与与 相等的可能性相等的可能性就越小。就越小。2023/1/9中国人民大学六西格玛质量管理研究中心15 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 因而,在备择假设成立时,因而,在备择假设成立时,的值有变大的趋势,所以的值有变大的趋势,所以拒绝域可取为拒绝域可取为 值较大的右侧部分。因此,当给定显著性值较大的右侧部分。因此,当给定显著性水平水平 后,由样本的数值可立即算出后,由样本的数值可立即算出 值,当值,当时,便拒绝零假设时,便拒绝零假设 。分布的分布的5%5%及及1%1%的分位点已列成专表,由网上下载,的分位点已列成专表,由网上下载,
8、为为 的上的上 分位点。分位点。2023/1/9中国人民大学六西格玛质量管理研究中心16 目录 上页 下页 返回 结束 2.1.2 2.1.2 多元均值检验多元均值检验 由由1.51.5,将,将 统计量乘上一个适当的常数后,便成为统计量乘上一个适当的常数后,便成为F F 统计量,也可用统计量,也可用F F分布表获得零假设的拒绝域。即分布表获得零假设的拒绝域。即关于关于 、的合理性及推证见参考文献的合理性及推证见参考文献33 在实际工作中,一元检验与多元检验可以联合使用,在实际工作中,一元检验与多元检验可以联合使用,多元的检验具有概括和全面考察的特点,而一元的检验多元的检验具有概括和全面考察的特
9、点,而一元的检验容易发现各指标之间的关系和差异,能帮助我们找出存容易发现各指标之间的关系和差异,能帮助我们找出存在差异的侧重面,提供了更多的统计分析信息。在差异的侧重面,提供了更多的统计分析信息。2023/1/9中国人民大学六西格玛质量管理研究中心17 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 在许多实际问题中,往往要比较两个总体之间的在许多实际问题中,往往要比较两个总体之间的平均水平有无差异。例如,两所大学新生录取成绩是平均水平有无差异。例如,两所大学新生录取成绩是否有明显差异;研究职工工资总额的构成情况,若按否有明显差异;研究职工工资总额的构成
10、情况,若按国民经济行业分组,就是例如要研究工业与建筑业这国民经济行业分组,就是例如要研究工业与建筑业这两个行业之间,是否有明显的不同之处;同理,可按两个行业之间,是否有明显的不同之处;同理,可按工业领导关系(中央、省、市、县属工业)分组;也工业领导关系(中央、省、市、县属工业)分组;也可按工业行业分组。组与组之间的工资总额构成有无可按工业行业分组。组与组之间的工资总额构成有无显著差异,本质上就是两个总体的均值向量是否相等,显著差异,本质上就是两个总体的均值向量是否相等,这类问题,通常也称为两样本问题。两总体均值比较这类问题,通常也称为两样本问题。两总体均值比较的问题,又可分为两总体协方差阵相等
11、与两总体协方的问题,又可分为两总体协方差阵相等与两总体协方差阵不等两种情形。差阵不等两种情形。2023/1/9中国人民大学六西格玛质量管理研究中心18 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 1.1.协方差阵相等的情形协方差阵相等的情形进行检验。与前面类似的统计量的形式是进行检验。与前面类似的统计量的形式是:设设 为来自为来自p p元正态元正态总体总体 的容量为的容量为 的样本,的样本,是来自是来自p p元正态总体元正态总体 容量为容量为 的样的样本,且两样本之间相互独立,本,且两样本之间相互独立,假定两总体协假定两总体协方差阵相等,但未知,现对
12、假设方差阵相等,但未知,现对假设 2023/1/9中国人民大学六西格玛质量管理研究中心19 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 2023/1/9中国人民大学六西格玛质量管理研究中心20 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 因为因为 的值与总体均值的马氏距离的值与总体均值的马氏距离 成正成正比例,此值愈大,说明两总体的均值很接近的可能性就愈小,比例,此值愈大,说明两总体的均值很接近的可能性就愈小,因而拒绝域可以取为因而拒绝域可以取为 值较大的右侧区域,即当给定显著性水值较大的右侧区域,即当给定
13、显著性水平平 的值时,若的值时,若时,拒绝时,拒绝 ,否则没有足够理由拒绝,否则没有足够理由拒绝 。2023/1/9中国人民大学六西格玛质量管理研究中心21 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 2.2.协方差阵不相等情形协方差阵不相等情形 设从两个总体设从两个总体 和和 ,分别抽,分别抽取容量为取容量为 和和 的两个样本,的两个样本,假定两总体协方差阵不相等,我们考假定两总体协方差阵不相等,我们考虑对假设(虑对假设(2.92.9)作检验。这是著名)作检验。这是著名BehrensBehrensFisherFisher问题。长期以来,统计学家用许
14、多方法试问题。长期以来,统计学家用许多方法试图解决这个问题。当图解决这个问题。当 与与 相差较大时,相差较大时,统计量统计量的形式是的形式是:2023/1/9中国人民大学六西格玛质量管理研究中心22 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 式中,式中,的统计含义与前相同,再令的统计含义与前相同,再令2023/1/9中国人民大学六西格玛质量管理研究中心23 目录 上页 下页 返回 结束 2.1.3 2.1.3 两总体均值的比较两总体均值的比较 当假设(当假设(2.92.9)的)的 成立时,可以证明(见文献成立时,可以证明(见文献3)3)近似遵从第一
15、自由度为近似遵从第一自由度为 、第二自由度为、第二自由度为 的的F F分布,即分布,即2023/1/9中国人民大学六西格玛质量管理研究中心24 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验 在许多实际问题中,我们要研究的总体往往在许多实际问题中,我们要研究的总体往往不止两个。例如,要对全国的工业行业的生产经不止两个。例如,要对全国的工业行业的生产经营状况做一比较时,一个行业可以看成一个总体,营状况做一比较时,一个行业可以看成一个总体,此时要研究的总体就达几十甚至几百个之多。这此时要研究的总体就达几十甚至几百个之多。这类问题的研究就需要多元方差分析的知识
16、。多元类问题的研究就需要多元方差分析的知识。多元方差分析是一元方差分析的直接推广,为了易于方差分析是一元方差分析的直接推广,为了易于理解多元方差分析的方法,我们先回顾理解多元方差分析的方法,我们先回顾一元的方一元的方差分析。差分析。2023/1/9中国人民大学六西格玛质量管理研究中心25 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验 假设r个总体的方差相等,要检验的假设就是2023/1/9中国人民大学六西格玛质量管理研究中心26 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验这个检验的统计量与下列平方和密切相关这
17、个检验的统计量与下列平方和密切相关2023/1/9中国人民大学六西格玛质量管理研究中心27 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验2023/1/9中国人民大学六西格玛质量管理研究中心28 目录 上页 下页 返回 结束 2.1.4 2.1.4 多总体均值的检验多总体均值的检验用类似于一元方差分析的办法,前面所述的三个平方和变成了用类似于一元方差分析的办法,前面所述的三个平方和变成了矩阵,形式如下:矩阵,形式如下:很显然很显然W W=B B+E E关于的检验可用关于的检验可用Wilks Wilks 分布分布,再化为再化为F F分布分布,详细参考详细参
18、考1.51.5节节2023/1/9中国人民大学六西格玛质量管理研究中心29 目录 上页 下页 返回 结束 2.2 协方差阵的检验协方差阵的检验2.2.1 2.2.1 检验检验2.2.2 2.2.2 检验检验2023/1/9中国人民大学六西格玛质量管理研究中心30 目录 上页 下页 返回 结束 2.2 协方差阵的检验协方差阵的检验 上面讨论了多元正态分布均值的检验。但这仅上面讨论了多元正态分布均值的检验。但这仅仅研究了问题的一个方面,倘若要进一步深究不同仅研究了问题的一个方面,倘若要进一步深究不同总体的平均水平(均值)波动的幅度,前面介绍的总体的平均水平(均值)波动的幅度,前面介绍的方法就无能为
19、力了。本节所介绍的协方差阵的检验方法就无能为力了。本节所介绍的协方差阵的检验可以解决该类问题可以解决该类问题2023/1/9中国人民大学六西格玛质量管理研究中心31 目录 上页 下页 返回 结束 2.2.1 2.2.1 检验检验是样本协方差阵,关于统计量是样本协方差阵,关于统计量M M的推证过程见参考文献的推证过程见参考文献11。其中其中2023/1/9中国人民大学六西格玛质量管理研究中心32 目录 上页 下页 返回 结束 2.2.1 2.2.1 检验检验2023/1/9中国人民大学六西格玛质量管理研究中心33 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验 上面讨论的检验上面
20、讨论的检验 ,是帮助我们分析当前,是帮助我们分析当前的波动幅度与过去的波动情形有无显著差异。但在的波动幅度与过去的波动情形有无显著差异。但在实际问题中,我们往往面临多个总体,需要了解这实际问题中,我们往往面临多个总体,需要了解这多个总体之间的波动幅度有无明显的差异。例如在多个总体之间的波动幅度有无明显的差异。例如在研究职工工资构成时,若按工业行业分组,就有采研究职工工资构成时,若按工业行业分组,就有采掘业、制造业、文化教育、金融保险等,不同行业掘业、制造业、文化教育、金融保险等,不同行业间工资总额的构成存在波动,研究波动是否存在显间工资总额的构成存在波动,研究波动是否存在显著的差异,就是做行业
21、间协方差阵相等性的检验。著的差异,就是做行业间协方差阵相等性的检验。用统计理论来描述就是:用统计理论来描述就是:设有设有r r个总体,从各个总体中抽取样品如下:个总体,从各个总体中抽取样品如下:2023/1/9中国人民大学六西格玛质量管理研究中心34 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验2023/1/9中国人民大学六西格玛质量管理研究中心35 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验 当当 不大且不大且 时时,本书附表本书附表4 4中列出了中列出了M M 的的上上 分位点分位点;若若 较大且较大且 互不相当时互不相当时,附表附表4 4中未列出它们
22、中未列出它们对应的临界值对应的临界值,此时可用此时可用F F分布去近似分布去近似,M M 近似遵从近似遵从 ,记记作作 M M (2.22)(2.22)2023/1/9中国人民大学六西格玛质量管理研究中心36 目录 上页 下页 返回 结束 2.2.2 2.2.2 检验检验其中其中2023/1/9中国人民大学六西格玛质量管理研究中心37 目录 上页 下页 返回 结束 2.3 2.3 形象分析形象分析2.3.1 2.3.1 形象分析的基本思想形象分析的基本思想2.3.2 2.3.2 形象分析的基本理论形象分析的基本理论2.3.3 2.3.3 多个总体的形象分析多个总体的形象分析 2.3.4 2.3
23、.4 需要注意的问题需要注意的问题 上面我们论述了多个遵从多元正态分布的总体的均值比较问上面我们论述了多个遵从多元正态分布的总体的均值比较问题,在实际研究中,人们常常需要对来自两正态总体的样本做题,在实际研究中,人们常常需要对来自两正态总体的样本做更细致的分析。比如,比较两总体各个指标之间变动的幅度是更细致的分析。比如,比较两总体各个指标之间变动的幅度是否相等,进一步,如果两总体各指标之间的变量幅度相等,比否相等,进一步,如果两总体各指标之间的变量幅度相等,比较两总体的均值是否相等,更进一步,当通过了两总体均值相较两总体的均值是否相等,更进一步,当通过了两总体均值相等的假设之后,检验两总体各个
24、指标的取值是否相等。统计学等的假设之后,检验两总体各个指标的取值是否相等。统计学家将对这类问题的解决方法归结为本节所讲的形象分析家将对这类问题的解决方法归结为本节所讲的形象分析(Profile AnalysisProfile Analysis)。形象分析广泛地用于实验设计数据的)。形象分析广泛地用于实验设计数据的检验,同时,也可应用于其他领域对多个指标的比较研究。本检验,同时,也可应用于其他领域对多个指标的比较研究。本节主要讲述形象分析的基本思想,分析过程及用节主要讲述形象分析的基本思想,分析过程及用SPSSSPSS软件进行软件进行形象分析的方法。形象分析的方法。2023/1/9中国人民大学六
25、西格玛质量管理研究中心38 目录 上页 下页 返回 结束 2.3 2.3 形象分析形象分析2023/1/9中国人民大学六西格玛质量管理研究中心39 目录 上页 下页 返回 结束 2.3.1 2.3.1 形象分析的基本思想形象分析的基本思想 形象(形象(profileprofile)又称轮廓图,是将总体样本的均值绘制到)又称轮廓图,是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点,若总体有一点,若总体有 个指标,则其形象即由坐标轴里个指标,则其形象即由坐标轴里 个点连接个点连接而成。注意这里的而成。注意这里的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 多元 统计分析 第二 均值 向量 和协 方差 检验 课件
限制150内