应用多元统计分析课后答案-暴强整理(共61页).docx
《应用多元统计分析课后答案-暴强整理(共61页).docx》由会员分享,可在线阅读,更多相关《应用多元统计分析课后答案-暴强整理(共61页).docx(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上第二章2.1 试述多元联合分布和边缘分布之间的关系。设X=X1,X2,Xp是p维随机向量,称由它的q(0,x20 0 , 其他 x1-1212-2x1-1x2-212+ x2-2222=x1-1212-2x1-1x2-212+ x2-2222+2x1-1212-2x1-1212=x1-11-x2-222+(1-2)x1-1212所以指数部分变为-12x1-11-21-x2-21-222+x1-1212令t=x2-21-22-x1-11-21 dt=11-22dx2 fx1=-+fx1,x2dx2=1212(1-2)1/2exp-x1-12212-+exp(-12t2)
2、11-22dt=121exp-x1-12212 121exp-x1-12212 , x10fx1= 0 ,其他同理, 122exp-x2-22222 , x20fx2= 0 ,其他2.3 已知随机向量X=X1,X2的联合分布密度函数为fx1,x2=2d-cx1-a+b-ax2-c-2(x1-a)(x2-c)(b-a)2(d-c)2,其中,ax1b,cx2d。求:(1) 随机变量各自的边缘密度函数、均值与方差。 解:fx1=cdfx1,x2dx2=cd2d-cx1-a+b-ax2-c-2(x1-a)(x2-c)(b-a)2(d-c)2 dx2 =2d-cx1-a(b-a)2(d-c)2+b-a(
3、b-a)2(d-c)2cd2x2-cdx2-2x1-a(b-a)2(d-c)2cd2x2-cdx2=1b-a同理,fx2=abfx1,x2dx1=ab2d-cx1-a+b-ax2-c-2(x1-a)(x2-c)(b-a)2(d-c)2 dx1 =1d-c同理可得同理可得(2) 随机变量的协方差和相关系数。E(x1)= abx1fx1dx1=abx11b-adx1=b+a2E(x2)= cdx2fx2dx2=cdx21d-cdx2=d+c2E(x12)= abx12fx1dx1=abx121b-adx1=13b2+ab+a2E(x22)= cdx22fx2dx2=cdx221d-cdx2=13d
4、2+dc+c2D(x1)= E(x12)-E(x1)2=112(b-a)2D(x2)= E(x22)-E(x2)2=112(d-c)2Covx1,x2= E(x1x2)-E(x1)E(x2)E(x1x2)=abdx1cdx1x2 fx1,x2 dx2=162b+ad+c+162d+cb+a-192b+a(2d+c)Covx1,x2.=136a-bd-c=Covx1,x2D(x1)D(x2)=136a-bd-c112b-ad-c=-13(3) 判断是否独立。fx1 fx2=1(b-a)1(d-c)fx1,x2x1,x2不相互独立。2.4设随机向量X=X1,X2,Xp服从正态分布,已知其协差阵为对
5、角阵,证明的分量是相互独立的随机变量。=11 22 ppij=0 , ij xi与xj不相关 又X=X1,X2,Xp服从正态分布xi与xj相互独立。(ij,i,j=1,2,p)2.5解: 依据题意,X= 1 6E(X)=1n=16x()=35650,12.33,17325,152.5D(X)= 1n=16(x-x)x-x = 416.67 32415.66710.8889 -29.833 25-29.833 -.5-.583注:利用 , S 其中 在SPSS中求样本均值向量的操作步骤如下:1. 选择菜单项AnalyzeDescriptive StatisticsDescriptives,打开D
6、escriptives对话框。将待估计的四个变量移入右边的Variables列表框中,如图2.1。 图2.1 Descriptives对话框2. 单击Options按钮,打开Options子对话框。在对话框中选择Mean复选框,即计算样本均值向量,如图2.2所示。单击Continue按钮返回主对话框。 图2.2 Options子对话框3. 单击OK按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表2.1,即样本均值向量为(35.3333,12.3333,17.1667,1.5250E2)。 表2.1 样本均值向量在SPSS中计算样本协差阵的步骤如下:1. 选择菜单项AnalyzeCorr
7、elateBivariate,打开Bivariate Correlations对话框。将三个变量移入右边的Variables列表框中,如图2.3。 图2.3 Bivariate Correlations对话框2. 单击Options按钮,打开Options子对话框。选择Cross-product deviations and covariances复选框,即计算样本离差阵和样本协差阵,如图2.4。单击Continue按钮,返回主对话框。 图2.4 Options子对话框3. 单击OK按钮,执行操作。则在结果输出窗口中给出相关分析表,见表2.2。表中Covariance给出样本协差阵。(另外,P
8、earson Correlation为皮尔逊相关系数矩阵,Sum of Squares and Cross-products为样本离差阵。) 2.6均值向量和协差阵的最大似然估计量具有哪些优良性质?1,即是的无偏估计; ,即不是的无偏估计, 而,即是的无偏估计;2,分别是,的有效估计;3,(或)分别是,的一致估计(相合估计)。 limnE(1n S)=limnE(1n-1 S)=2.7 试证多元正态总体 的样本均值向量证明: EX=E1nX()=1nEX()=nn= DX=D1nX()=1n2D(X())=1n2n=nXNP(, n)2.8 试证多元正态总体NP(, ) 的样本协差阵 1n-1
9、S 为 的无偏估计。证明:E()=1nEi=1n(xi-x)xi-x =1nEi=1n(xi-x-xi-)-(x- =1nEi=1n(xi-)(xi-)-nx-x- =Ei=1n(V(xi)-nV(x)= 1n(n-n1n) =n-1nnn-1是的无偏估计,S=n 1n-1S 为 的无偏估计2.9 设X1,X2,Xn 是从多元正态总体NP(, ) 中独立抽取的一个随机样本,试求样本协差阵1n-1S 的分布。解:,且相互独立,则样本离差阵,其中样本协差阵1n-1S的分布为Wp(1, )2.10 设 Xinip是来自NP(, )的数据阵,i=1,2, ,k(1)已知1=k= 且 1=k=,求和 的
10、估计。(2)已知1=k=,求1,k 和 的估计。这道题我对自己的答案不是很确定。第三章3.1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为:答: 第一,提出待检验的假设H0和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界 值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。均值向量的检验: 统计量 拒绝域均值向量的检验:在单一变量中当已知 当未知 (作为的估计量)一个正态总体协差阵已知 协差阵未知 () 两个正态总体有共同已知协差阵 有共
11、同未知协差阵 (其中 )协差阵不等 协差阵不等 多个正态总体单因素方差 多因素方差 协差阵的检验检验 检验 统计量3.2 试述多元统计中霍特林T2分布和威尔克斯分布分别与一元统计中t分布和F分布的关系。答:(!)霍特林T2分布是t分布对于多元变量的推广。而若设,且与相互独立,则称统计量T2=nX-S-1(X-)的分布为非中心霍特林T2分布。若,且与相互独立,令,则 。(2)威尔克斯分布在实际应用中经常把统计量化为统计量进而化为统计量,利用统计量来解决多元统计分析中有关检验问题。 与统计量的关系统计量及分别任意任意1任意任意21任意任意2任意任意3.3 试述威尔克斯统计量在多元方差分析中的重要意
12、义。答:威尔克斯统计量在多元方差分析中是用于检验均值的统计量。 用似然比原则构成的检验统计量为 给定检验水平,查Wilks分布表,确定临界值,然后作出统计判断。第四章4.1 简述欧几里得距离与马氏距离的区别和联系。答: 设p维欧几里得空间Rp中的两点X=(X1, X2XP)和Y=Y1, Y2YP。则欧几里得距离为i=1p(Xi-Yi)2。欧几里得距离的局限有在多元数据分析中,其度量不合理。会受到实际问题中量纲的影响。设X,Y是来自均值向量为,协方差为的总体G中的p维样本。则马氏距离为D(X,Y)=X-Y-1X-Y。当-1=I即单位阵时,D(X,Y)=X-YX-Y=i=1p(Xi-Yi)2即欧几
13、里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2 试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为Rp,则称R1,R2Rp为Rp的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。4.3 简述距离判别法的基本思想和方法。答:距离判别问题分为两个总体的距离判别问题和多个总体的判别问题。其基本
14、思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵相等的两个总体G1和G2,其均值分别是m1和m 2,对于一个新的样品X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),则 X G1 ,D2(X,G1) D2(X,G2)X G2 ,D2(X,G1) D2(X,G2,具体分析, 记 则判别规则为 X G1 ,W(X)0X G2 ,W(X)0多个总体的判别问题。设有个总体,其均值和协方差矩阵分别是和,且。计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。具体分析, 取,。可以取线性判
15、别函数为, 相应的判别规则为 若 4.4 简述贝叶斯判别法的基本思想和方法。基本思想:设k个总体,其各自的分布密度函数,假设k个总体各自出现的概率分别为,。设将本来属于总体的样品错判到总体时造成的损失为,。设个总体相应的维样本空间为 。在规则下,将属于的样品错判为的概率为 则这种判别规则下样品错判后所造成的平均损失为 则用规则来进行判别所造成的总平均损失为 贝叶斯判别法则,就是要选择一种划分,使总平均损失达到极小。基本方法:令,则 若有另一划分,则在两种划分下的总平均损失之差为 因为在上对一切成立,故上式小于或等于零,是贝叶斯判别的解。从而得到的划分为 4.5 简述费希尔判别法的基本思想和方法
16、。答:基本思想:从个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答: 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当k=2时,若1=2=则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。 当12时,费希尔判别用1+
17、2作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X G1 ,W(X)lndX G2 ,W(X)lnd距离判别的判别规则是 X G1 ,W(X)0X G2 ,W(X)0 X G1即样品X属于总体G14.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。销售情况产品序号销售价格口味评分信任度评分畅销12.25822.56733.03943.286平销52.87663.58774.898滞销81.73492.242102
18、.743 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。解:增加group变量,令畅销、平销、滞销分别为group1、2、3;销售价格为X1,口味评分为X2,信任度评分为X3,用spss 解题的步骤如下:1. 在SPSS窗口中选择AnalyzeClassifyDiscriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将X1、X2、X3变量选入自变量中,并选择Enter independents together单选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 课后 答案 整理 61
限制150内