最新多元正态分布(新)幻灯片.ppt
《最新多元正态分布(新)幻灯片.ppt》由会员分享,可在线阅读,更多相关《最新多元正态分布(新)幻灯片.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元正态分布的重要性:多元正态分布的重要性:(1)多元统计分析中很多重要的理论和方法都是直接或间接)多元统计分析中很多重要的理论和方法都是直接或间接 地建立在正态分布地建立在正态分布 基础上的,许多统计量的极限分布往往和基础上的,许多统计量的极限分布往往和 正态分布有关。正态分布有关。(2)许多实际问题涉及的随机向量服从多元正态分布或近似)许多实际问题涉及的随机向量服从多元正态分布或近似 服从正态分布。因此多元正态分布是多元统计分析的基础。服从正态分布。因此多元正态分布是多元统计分析的基础。一、多元正态分布的定义一、多元正态分布的定义定义定义1:若若p维随机向量维随机向量 的密度函数为:的密度
2、函数为:其中,其中, 是是p维向量维向量 是是p阶阶正定矩阵,则称正定矩阵,则称X服从服从p维正态分布,记为维正态分布,记为 ),(1pXXX)()(21exp)2(1),(12/11xxppxxfx),(1pxx),(XpN1多元正态分布的定义及其性质多元正态分布的定义及其性质二、多元正态分布的性质二、多元正态分布的性质 性质性质1:若:若 , 是对角矩阵,则是对角矩阵,则 相互独立。相互独立。 性质性质2:若:若 则则 ),(),(1XppNXX pXX ,1),(XpN维常数向量为阶常数矩阵,为sdpsA),(AAdANdAXs性质性质3:若:若 ,将,将 作剖分:作剖分:则则),(Xp
3、N,XqqpqqpqqpXXX22211211)2() 1 ()2() 1 (,),(),(22)2()2(11) 1 () 1 (qqNXNX性质4:p 元正态分布的条件分布仍服从正态分布。即在某些变量取固定值时,另外一些变量的分布仍然服从多元正态分布。 三、正态分布数据的变换三、正态分布数据的变换若一批多元数据不满足正态分布时,可以对数据进行正态变换。一般来说常采用幂变换,如果想使值变小可以采用变换:21411,ln,xxxx如果想使值变大,则采用变换:32,xx不管使用哪种幂变换,还应该对变换后的数据的正态性做检验.2多元正态分布的参数估计多元正态分布的参数估计 一、多元样本及其样本数字
4、特征一、多元样本及其样本数字特征多元样本阵多元样本阵记记npnnppXXXXXXXXX212222111211XniXXXXipiii2 , 1),(21)(2、多元样本的数字特征、多元样本的数字特征样本均值:样本均值:pnpnppniiXXXXXXXXXXXXnn2112122221112111)(11样本均值向量可以用样本矩阵表示出来,即) 1 , 1 , 1 (11nn11XnXp因为:XXXXXXXXXXXXXnXXXXXXXXXnnpnpppnnpnnnpp21212221212111212221212111n111111X样本离差阵样本离差阵ppijppppppnipippipip
5、ippipiiiipipiiiipipiinipipiiiniippssssssssssXXXXXXXXXXXXXXXXXxXXXXXXXXXXXXXXXXXXXXXXXXXXXXS)()()()()()()()()()()( )(212222111211122211122222112112211211221112211)(1)(样本协方差矩阵样本协方差矩阵 或或 SnV1SnV11样本离差阵用样本资料阵表示为:XX)1(nn11 nISn因为XXXXXXXXXX)1(1)()()()( )()( )(1)(1)()()()()(1)(1)()(1)(nnnn1111nInXXnXXXXXXX
6、XXXXXXXXXXXXXXXSnniiniiiiiiniiniiinii二、多元正态总体的最大似然估计及其性质二、多元正态总体的最大似然估计及其性质利用最大似然法求出利用最大似然法求出 和和 的最大似然估计为:的最大似然估计为:SnX1)()(21exp)()(1)(12iininpxx2)()()(),()()2() 1 (nxfxfxfL)()(21exp)2()(1)(2121 iipnixx求解过程求解过程似然函数为:似然函数为:)()(21exp)()(1)(12iininpxxtr2)(21exp)()()(112iininpxxtr2)(21(exp)()()(112iinin
7、pxxtr2对数似然函数为:对数似然函数为:)(21|ln22ln2),(ln)()(11iinixxtrnnpL)(21|ln22ln211xxnStrnnp)()(2)(21|ln22ln211xxnStrnnp)(21|ln22ln21Strnnp时等号成立仅当x)()()()()()()()()(1)(11)()()(1)()(1)()(xxnSxxnxxxxxxxxxxxxxxxxxxniininiiiiniiiniii)(21|ln22ln2),(ln1StrnnpXL)(|ln22ln21nStrnnp)(|ln|ln22ln211nStrnSnSnnp)(|ln|ln22ln2
8、21212121nStrnSnSnnp|ln222ln2nSnnpnpnS时等号成立,即pInSA2/12/1(引理:设A为p阶正定矩阵,则 当A=I等号成立。pAAtrln)(最大似然估计的性质最大似然估计的性质 ,即,即 是是 的无偏估计的无偏估计 。 ,即,即 不是不是 的无偏估计。的无偏估计。 ,即,即 是无偏估计。是无偏估计。 分别是分别是 的最小方差无偏估量。的最小方差无偏估量。3. 分别是分别是 的一致估计。的一致估计。 )(XEXnnSnE1)1(Sn1)11(SnESn 11SnX11,)11(1,SnSnX,三、维斯特三、维斯特(Wishart)分布分布-一元一元 分布的推
9、广分布的推广定义:定义: 设设 个随机向量个随机向量 独立同分布于独立同分布于 , 则随机矩阵则随机矩阵 服从自由度服从自由度为为n的非中心维斯特分布,记为的非中心维斯特分布,记为n), 3 , 2 , 1(),(21)(niXXXipiiiX ),( pNni 1)()(iiW),(nWWp2随机矩阵的分布:随机矩阵的分布:npnnppXXXXXXXXXX212222111211将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直向量,拉直向量的分布定义为该矩阵的分布,如果是对称矩阵则向量,拉直向量的分布定义为该矩阵的分布,如果是对
10、称矩阵则只取其下三角的部分拉直即可。只取其下三角的部分拉直即可。性质:性质:(1)若)若W1和和W2独立,其分布分别为独立,其分布分别为 和和 ,则,则 分布为分布为 ,即维斯特,即维斯特(Wishart)分布有可加性。分布有可加性。(2) ,C为为mp阶的矩阵,则阶的矩阵,则 的分布为的分布为 ),(nWWpCCW),(1nWp),(2nWp21WW ),(21nnWp ),(CC nWm定理:定理: 设设 分别是来自正态总体分别是来自正态总体 的样本均值的样本均值和离差阵和离差阵 ,则,则(1) (2) 相互独立。相互独立。 S为正定矩阵的充分必要条件是为正定矩阵的充分必要条件是 np 。
11、SX,),(pN)1,(nNXp), 1(nWSpSX,11一元正态总体:nXX ,1为来自一元正态总体的一组样本211)(1niiniiXXSXnX定理:是相互独立的。与SX证明: 构造正交矩阵) 1() 1() 1(1) 1(1) 1(1) 1(10023223123100012112111111nnnnnnnnnnnnnnnnA做变换nnXXXAYYY2121XnXnYnii1112121212)(XnXXXXXAXAXYYYniiniiniiniiniiYYYS2221122第三章多元正态总体参数的假设检验第三章多元正态总体参数的假设检验一、一、Hotelling T2分布分布 一元一
12、元t分布的推广分布的推广定义定义 设设 ,且,且X与与S相互独立,相互独立, ,则称统计量则称统计量 的分布为非中心的的分布为非中心的Hotelling T分布,记为分布,记为 ,当,当 时称为中心时称为中心的的HotellingT2分布。记为分布。记为),(),(nWSNXpppn XSXnT12),(22npTT0。),(22npTT一元一元t分布分布:设总体设总体 是一组样本是一组样本 ,则统计量则统计量 ),(2NXnXX ,1) 1()(ntXnt其中niiXXn12)(11)()()()(12222XXnXntXSXnT12与 类似并且) 1, 1 ()()()()(12222nF
13、XXnXnt定理:设定理:设 且且X与与S相互独立,相互独立, 令令基本性质基本性质:),(),(nWSNXpp0XSXnT12则则) 1,(12pnpFTnppn二、多元正态总体均值向量的假设检验二、多元正态总体均值向量的假设检验1.单个正态总体单个正态总体(1) 协方差矩阵协方差矩阵 已知时均值向量的检验已知时均值向量的检验01000:为已知向量)(:HH检验统计量检验统计量)()()()(201020pXXnT设水平为设水平为 ,查表确定,查表确定 ,使得,使得(当(当H0成立时)成立时))(20TP拒绝域为:拒绝域为:20T当原假设成立时)1,(0nNXppZZZXnZ2102/1)(
14、令pIDZEZ , 0), 0(ppINZZZT20(2) 协方差矩阵协方差矩阵 未知时均值向量的检验未知时均值向量的检验 01000:为已知向量)(:HH检验统计量检验统计量),() 1(2pnpFTpnpn) 1,()()(1(20102npTXSXnnT拒绝域为:拒绝域为:),() 1()(2pnpFTpnpn例:人的出汗多少于人体内钾和钠的含量有一定的关系。测得20名健康成年女性的出汗多少(X1)、钠的含量(X2)和钾的含量(X3)的数据,做如下的假设检验:0100:)10,50, 4(:HH例:在企业市场结构研究中,起关键作用的指标有市场份额X1,企业规模(资产净值总额的对数)X2,
15、资本收益率X3,总收益增长率X4.为了研究市场结构的变动Shepherd(1972)抽取了美国231个大型企业,调查了这些企业1960-1969年的资料。假设以前企业市场结构指标的均值向量为:而该次调查得到的企业市场结构指标的均值向量和协方差矩阵为:)2 ,10, 5 . 7 ,20(009. 178.1106. 892.20X346. 1233. 2019. 0156. 0233. 2626.26222. 0639. 1019. 0222. 0513. 1080. 0156. 0639. 1080. 0260. 0试问市场结构是否发生了变化?0100:)2 ,10, 5 . 7 ,20(:H
16、H865. 0066. 0007. 0105. 0066. 0068. 0030. 0397. 0007. 0030. 0687. 0405. 0105. 0397. 0405. 0536. 6191. 078. 156. 092. 00X带入到T2统计量中得到78.3074 .1247423042314 .124740. 5*2312FT临界值37. 2)227, 4(05. 0F因此拒绝原假设,认为市场结构已经发生了显著的变化。2.协方差阵相等时,两个正态总体均值向量的检验设且两组样本相互独立。(1 )有共同已知的协方差矩阵 mYYYYnXXXXpp,2 , 1),(,2 , 1),(21
17、)(21)(211210:HH检验统计量为:成立时)02120()()()(HpYXYXmnnmT拒绝域为:20T(2)有共同的未知协方差矩阵211210:HH检验统计量为:成立时)02() 1,()2(1)2(HpmnpFTpmnpmnF)( )()2(12YXmnnmSYXmnnmmnT 21SSS)( )()( )()(1)(2)(1)(1YYYYSXXXXSnn用 代替即可得到上述统计量。2) 1() 1(21mnSmSn例:为了研究日美企业在华投资企业对中国经营环境的评价是否存在差异,现从两国在华投资企业中各抽出10家,让其对如下 指标进行打分。假设两组来自正态总体,有共同的未知协方
18、差矩阵,且两组样本相互独立。211210:HH经计算)5 .70,40,51, 5 .50()63, 5 .30,43,64(YX101)()(1510844228845 .3323804223510170880170410)(XXXXS101)()(25 .7625 .5213955 .31475140165561140390605165605 .512)(YYYYS21SSS0025. 00002. 00016. 00002. 00002. 00013. 00004. 00002. 00016. 00004. 00022. 00003. 00002. 00002. 00003. 00011
19、. 01S代入统计量中得:查F分布表得:显然有:故拒绝原假设,认为日、美两国在华投资企业对中国经营环境的评价存在差别。6913. 7F89. 4)15, 4(01. 0F)15, 4(01. 0FF 3.协方差阵不相等时,两个正态总体均值向量的检验略一元方差分析一、方差分析的概念及有关术语 方差分析是根据实验数据来推断一个或多个因素在其状态变化时是否会对实验指标产生显著影响的一种数理统计方法。方差分析可以用来研究分类型自变量(名义测度)对数值型因变量的影响。包括它们之间有没有关系、关系的强度如何等,也就是研究一个或多个因素变化时不同总体的某个指标是否有显著差异,所采用的方法就是检验各个总体的均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 多元 正态分布 幻灯片
限制150内