应用多元统计分析课后答案_朱建平版.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《应用多元统计分析课后答案_朱建平版.pdf》由会员分享,可在线阅读,更多相关《应用多元统计分析课后答案_朱建平版.pdf(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X=(X X 2,X,)的联合分布密度函数是一个P维的函数,而边际分布讨论是X=(X”X2,X/,)的子向量的概率分布,其概率密度函数的维数小于P。2.2 设二维随机向量(X1 X2)服从二元正态分布,写出其联合分布。/2 解:设(X|X 2)的均值向量为p 4 2),协 方 差 矩 阵 为1:,则其联合分布密度函数为/2 -1-(x-g)z 5%(x-ft)L2。2 )2.3已知随机向量(X1 X2)的联合密度函数为f(xvx2)2(J c)(x)a)+(ba)(x2 c)2(Xj
2、 a)(x2 c)(b a)2(d其中 c x2d,求(1)随机变量X1和*2的边缘密度函数、均值和方差;(2)随机变量X1和X 2的协方差和相关系数;(3)判断X1和X?是否相互独立。(1)解:随机变量X1和X 2的边缘密度函数、均值和方差;/,()=,2 (1。)(王 一。)+3 )(%2一,)一2(王 一。)(九2一。)工*1 I (h-a)2(d-c)2_ 2(d-c)(x1-a)x2(h-a)d-c)2ri2(,b-a)(x2-c)-2(xt-a)(x2-c)1(b-a)d-c)2 2_ 2(tZ-c)(Xj-d)x2(b-a)2(d-c)2 c+-。2(2 4尸 一2(1 一a)出
3、L-(b-a)d-c)2 _ 2(J-cX%1-a)x1 d(b-a)t2-2(再 一)产一(h-a)d-c)2:(h-a)d-c)2d-c1o b a所以由于X|服从均匀分布,则均值为h+a 他 一,方差为L2121同理,由于X?服从均匀分布fX2(x2)=d-0“苦 匕 可,则均值为5其它2方 差 力 一 姨力 左 为-12(2)解:随机变量X 1和X 2的协方差和相关系数;cov(xpx2)a+b%.-1 2d+c 2(J-c)(X-a)+(b-a)(x2-c)-2(玉-a)(x2-?)2(b-a)d-c)2-dxdx2(c d)(b a)36_ C0V(X,X 2)_ 1P-=一3(J
4、M (Jx2(3)解:判断X 1和X?是否相互独立。X 1和X 2由于/(占,)。人(%)九(工2),所以不独立。2.4设X =(X X 2,X)服从正态分布,已知其协方差矩阵X为对角阵,证明其分量是相互独立的随机变量。解:因为X=(XX 2,X J的密度函数为f(xv.,xp又由于E-(x-p/L_ 1(x-p)国=5%;可1%121则/(芭,1 p|国=1-1/2expBivariate,打开Bivariate Correlations对话框。将三个变量移入右边的Variables列表框中,如图2.3。图 2.3 Bivariate Correlations 对话框2.单 击 Option
5、s按钮,打 开 Options子对话框。选择Cross-product deviations and covariances复选框,即计算样本离差阵和样本协差阵,如图2.4。单击Continue按钮,返回主对话框。图2.4 Options子对话框3.单 击 O K 按钮,执行操作。则在结果输出窗口中给出 相 关 分 析 表,见 表2.2o表 中 Covariance给出样本协差阵。(另外,PearsonCorrelation为皮尔逊相关系数矩阵,Sum of Squares and Cross-products为样本离差阵。)相关注X1x2x3X 1 Pearson相关性1758975-402
6、显著性(效悟).081001430平方与叉租的和1.008E9194500.0004186E8-3684000.000协方差2.016E838900.0008.372E7-736800.000N6666x2 Pearson相关性7581764077!若 性(毁他)081077885平方与叉税的和194500 00065.33383550000179 000协方差38900.00013.06716710000-35800N6666x3 Pearson相关性.975”7641-256我若性(双偶)001.077625军方与叉税的和4.186E883550.0001 829E8-999375000协
7、方差8.372E716710.0003.657E7-199875 000N6666x4 Pearson相关性-402-.077-2561H 著 性(效例)430885625平方与叉税的和-3684000 000179 000-99937500083475 500办方差-736800.00035.800-199875 00016695100N66662.6 渐近无偏性、有效性和一致性;2.7 设总体服从正态分布,X N,(H,E),有样本X 3X 2,.,X。由于*是相互独立的正态分布随机向量之和,所 以*也服从正态分布。又E(又)=No(、)=d x,所以又 N p 3,E)。2.8 方法 1
8、:=一汽(X,.文)(X;又)n-,=i1一1 x X-欢/=11n _(t)=;E(XX-欣*)n-1,=i1n-iE(X,X;)-E(X X,)=1-H-n=(-1)E=E。/I-11 _ ,-=|n J n-1方法2:s=(X j-(X j-N)/=1r=l=f(X,-|i)(Xj-1!)-2(X,.-M)(X-H),+H(X-|i)(XM-刘)i=l i=l=(X,.-M)(X,.-JI)2 (又-g)(X-H)+n(X-fi)(X-ji)/=!=之(Xf )(X f)-(又 一|1)(X-H)/=1昌*暄(Xi)(x,rj(j(*7i f n _ _=-E(X,-N)(XP)_ E(
9、*_N(*-H)=E。-ME)故一 色 为2的无偏估计。n 12.9.设X(1),X是从多元正态分布X N JN,E)抽出的一个简单随机样本,试求S的分布。证明:设*、*=(%)为一正交矩阵,即r r =i。111yjn S,令 Z=(Zzn)=(x,x2 Xn)r,由于X (i =1,2,3,4,)独 立 同正态分布,月T为正交矩阵所以Z =(Z Z2Z )独 立 同 正 态 分 布。且有Z“=;fx,,七亿)=。&*)=痂,V r(Zn)=L0yjn 三i yjn/=IE(Z)=E(x,)(a =1,2,3,,-1)j=lj=l廊=0/=1VMZ)=”(%XJ)j=l所以Z|Z2 Z,“独
10、立同N(O,E)分布。又因为 s =(X)-x)(xy-xyi=l=X7X;.-n XX,J=1因为双=z z:八 yJn 1=J又因为 EX;XXX.X2 X,)X?7=11X”X、=(x2 xn)rT工Z、,、z;=(ZI Z2 zn):2所以原式 X jX;-Z,Z:=z w z“z:j=l j=l=Z1Z;+Z2Z;+.+ZZ;,-Z Xn-1故S=Z Z/Z;,由于Z”Z2,Z“T独立同正态分布N/O.E),所以j=ln-1S=Z Z jZ;叫,5 T,Z)j=l2.10,设4(%x p)是来自N(出,二)的简单随机样本,i=1,2,3,(1)已知%=.=M=|i且4 =2=2人=E
11、,求p和X的估计。(2)已知=L2=.=&=工求出,.,人和E的估计。1k%解:(。ji=x=-/+%+%.a=/=!-力 一(X:-可 卜:-可 _ a=l i=l_n+%+%(2)InL(内,%,E)=In(24国 广exp-乞 之(x:-七 尔 区3.)a=1=1|n|k 4lnL(g,S)=-p n ln(2%)-l n t-X ),E 区”),乙 0=1 i=l)(X;-K)T)2=。6 乙,/a=/=131nL(p,E)3 .=T(X%)=0(j=l,2,.,Q解之,得i%E E(xij-)(xij-)第三章3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本
12、思想和步骤均可归纳为:答:第一,提出待检验的假设即和H 1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决 策(拒绝或接受)。均值向量的检验:统计量拒绝域均值向量的检验:在单一变量中当。2已知(J1 Z l q/2当G 未知sI f 1%2(一1)(S1 _2=y(X,.-又A 作为c r2的估计量)M-l ,=l一个正态总体0:协差阵N-知协差阵未知 2=(N-)N T(N-4)2 2(P)(一 1)一 p+1 2 /h T Fn p)叶/n-p T2
13、F(D p(T2=(/2-I)V(X-M0)/S-1 V(X-H0)两个正态总体“:内=有共同已知协差阵年=2 L Z L(X-Y/E-1(X-Y)r(/?)窗/n+m有共同未知协差阵r(n+m-2)-p +l 2F=,c T F(p,+m p 1)F Fa(n+m-2)pr_ _/r _(其 中 T2=(n+,n-2)J-(X-Y)S-l -(X-Y)N n+m n +m协差阵不等=加p=(7?-l!L zzS-Z F(p,n-p)FFap协差阵不等 H mF=(二 p)空s-乞 F(p,n p)FFap多个正态总体”0:M =2 =.=单因素方差F=SSA(A=1)F(k-l,n-k)F
14、FaSSE/(n-k)a多因素方差|E|E|A=T=|A +EA(P i I)协差阵的检验检验=”0:E f =e x p|-1r r s j|S|,/2 QH。:E:=E f 4=e x p 卜*检验 2 =2 2 =Z ”0:X =Z =统计量4 =,2口 国 邛 八S2 n%m,/21=1/r=13.2试述多元统计中霍特林炉分布和威尔克斯A分布分别与一元统计中t分布和F分布的关系。答:(!)霍特林炉分布是t分布对于多元变量的推广。t2=(”“)=n(X )(S2)T(%)而若设X ,E),S 叫 5,E)且X 与 SS相互独立,n p,则称统计量如=1)。一|0 2一】。一|1)的分布为
15、非中心霍特林/分布。若 X NJO,E),S%,(,)且 X 与 S 相 互 独 立,令 =nXS-X,则n-p +l 2-T 尸(p,-p +1)onp(2)威尔克斯A分布在实际应用中经常把A统计量化为统计量进而化为F统计量,利用F统计量来解决多元统计分析中有关检验问题。A与尸统计量的关系P2F统计量及分别任意任意1nx-p +1-A(p,n1,l)4/:、F(P,/p+1)P A(p,|,l)任意任意2p 1 JA(P,”2)-p-F(2p,2(|p)P jA(p,I,2)1任意任意-!上-F(n2,n.)n2 A(l,2)2任意任意“I1 1-JA(2,/,2)八-;-P(2 2,2(|
16、1)%,A(2,|,2)3.3试述威尔克斯统计量在多元方差分析中的重要意义。答:威尔克斯统计量在多元方差分析中是用于检验均值的统计量。o:内=,=%1:至 少 存 在iw,使出用似然比原则构成的检验统计量为 A=日=回1 A 5,-女,女-1)给定检验水|T|A+E|平a,查Wilks分布表,确定临界值,然后作出统计判断。第四章4.1 简述欧几里得距离与马氏距离的区别和联系。答:设 P 维欧几里得空间R R 中的两点X=(XVX2,“鼻)和丫=(匕用。则欧几里得距离 为 欧 几 里 得 距 离 的 局 限 有 在 多 元 数 据 分 析 中,其度量不合理。会受到实际问题中量纲的影响。设 X.Y
17、 是来自均值向量为l,协方差为 的 总 体 G中 的 p 维样本。则马氏距离为D(X,Y)=(X-Y)/o 当=7=1 即单位 阵时,D (X,Y)=(X-Y)(X-Y)巨 二 值 -YL)3G P 欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2 试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设 R I,R 2,,R k 是 p 维空间 R p 的 k 个子集,如果它们互不相交,且它们的和集为R P,则称R“区 2”心为1的一个划
18、分。判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间R p构造一个“划分”,这 个“划分”就构成了一个判别规则。4.3简述距离判别法的基本思想和方法。答:距离判别问题分为两个总体的距离判别问题和多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵2 相等的两个总体G和 a其均值分别是4/和 z,对于一个新的样品尤要判断它来自哪个总体。计算新样品才到两个总体的马氏距离g Q X,G)和G(尤&),则-X q G j.,D(X,G)户(X,G2)、X C 同,加(X,G J (X,G2,具体分析,D2(X
19、,Gt)-D X,G2)=(X-fi1),E-,(X-Ml)-(X-n2)X-,(X-H2)=X-X _ 2X/2-nl+HAH-(XTX-2 X )2 +1广出)Max,%-内)+陪 口 一 依 修=2 X I仙-内)+(冉+%)1(内 一小)=-汇 仙 f)=-2(X R)a=-2a(X-ji)记W(X)=a(X-m 则判别规则为X w G j.,W(X)/OX e (,W(X)2(X,Ga)=(X-liJ,L-,(X-M(z)=X,E-X-2JI;L-1X+H;L-JIC=X T X-2(I:X+Ca)取Ot=1,2,-,k o可以取线性判别函数为W(X)=I;X+Ca,a =1,2,A
20、相应的判别规则为X e Gj若iy(X)=ma x(I;X +Ca)4.4简述贝叶斯判别法的基本思想和方法。基本思想:设k个总体,G*,其各自的分布密度函数力(x),%(x),,九(x),假设k个总体各自出现的概率分别为名,%,/,%2 0,=1。设将本来属于G,总体的样品f=l错判到总体G,时造成的损失为C(jl/),i,j=1,2,,女。设k个总体G,G 2,G.相应的p维样本空间为/?=(居,生,,号)。在规则R下,将属于G,的样品错判为G,的概率为产(jli,R)=(x)dx i,j=1,2,k ij则这种判别规则卜样品错判后所造成的平均损失为r(i R)=%C(j I i)P(j i
21、,/?)i =1,2,-Jj=l则用规则R来进行判别所造成的总平均损失为g(R)-g(R*)=Z Z J=1 j=g(H)=Z q/(i,R)/=11=1 六 1贝叶斯判别法则,就 是 要 选 择 种 划 分,/,使总平均损失g(K)达到极小。k k基本方法:g(R)=、,5 C(,l i)P(jl i,R)/=1 j=Zq,Z c(/i i)(力汽如i=l j=l J=Z I i)(x)dxj=l j i=l令Zq,C(,li)/(x)=%(x),则 g(R)=Z (x)dxi=lj=l%若有另一划分 R*=(R:,R;,R;),g(R*)=之(x)dx则在两种划分下的总平均损失之差为CRZ
22、(X)-勺(x)dx因为在凡上4(x)j(x)对一切/成立,故上式小于或等于零,是贝叶斯判别的解。从而得到的划分 八 区 风.,&)/山似正黑明4.5 简述费希尔判别法的基本思想和方法。答:基本思想:从左个总体中抽取具有0个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数U(X)=ulXi+u2X2+-+upXp=uX系数U =(小,%,”p)可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的个指标值代入线性判别函数式中求出。(X)值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答:费希尔判别与距离判别
23、对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。当 k=2 时,若&=&=2则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。当 局*国 时,费 希 尔 判 别 用 作 为 共 同 协 差 阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是X SG1,W(X)a:lndX eGz,W(X)lnd距离判别的判别规则是1 X Gt,W(X)2口x e G s ,w(x)(R-I-v-2)=a13y邨 尸 同 备(0靠)=晶。X
24、 eG即样品X 属于总体G4.8某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这卜种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。销售情况产品序号销售价格口味评分信任度评分12.258畅销22.56733.03943.28652.876平销63.58774.89881.734滞销92.242102.743根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。解:增 加group变量,令畅销、平销、滞销分别为groupl
25、、2、3;销售价格为X1,口味评分为X 2,信任度评分为X3,用s p s s解题的步骤如下:1.在S P S S窗口中选择AnalyzefClassifyf Discrim inate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将 汽、X2、X3变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判别分析。2.点 击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。如图4.1图4.1判别分析主界面
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 课后 答案 建平
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内