多元统计分析模拟试题.pdf
多 元 统 计 分 析 模 拟 试 题 两 套:每 套 含 填 空、判 断 各 二 十 道A A 卷卷判别分析常用的判别方法有距离判别法距离判别法、贝叶斯判别法贝叶斯判别法、费歇判别法费歇判别法、逐步判别法逐步判别法;Q 型聚类分析是对 样品样品 的分类,R 型聚类分析是对变量变量_的分类;主成分分析中可以利用协方差矩阵方差矩阵和相关矩阵相关矩阵求解主成分;因子分析中对于因子载荷的求解最常用的方法是主成分法主成分法、主轴因子法主轴因子法、极大似然极大似然法法聚类分析包括系统聚类法系统聚类法、模糊聚类分析模糊聚类分析、K-K-均值聚类分析均值聚类分析分组数据的 Logistic 回归存在异方差性异方差性 ,需要采用加权最小二乘估计1)2)3)4)4)5)6)7)7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为=8)最短距离法适用于条形的类,最长距离法适用于椭圆形椭圆形的类;9)主成分分析是利用降维降维的思想,在损失很少的信息前提下,把多个指标转化为几个综合指标的多元统计方法;10)在进行主成分分析时,我们认为所取的mmp,p为所有的主成分个主成分的累积贡献率达到 85%85%以上比较合适;11)聚类分析的目的在于使类内对象的同质性同质性最大化和类间对象的异质性异质性最大化12)1是随机变量,并且有1(0,1),那么12服从卡方卡方分布;13)13)在对数线性模型中,要先将概率取对数,再分解处理,公式:=+.+,=,14)14)将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公公共因子共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子特殊因子15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一个以上,解释变量解释变量必须是可测量的16)当被解释变量是属性变量而解释变量是度量变量时判别分析判别分析是合适的统计分析方法17)多元正态分布是一元正态分布一元正态分布的推广18)多元分析的主要理论都是建立在多元正态总体多元正态总体基础上的,多元正态分布是多元分析的基础19)因子分析中,把变量表示成各因子的线性组合各因子的线性组合,而主成分分析中,把主成分表示成各各变量的线性组合变量的线性组合;20)统计距离包括欧氏距离欧氏距离和马氏距离马氏距离两类1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度;p1472)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法;p243)判别分析其被解释变量为属性变量,解释变量是度量变量;p904)Logistic 回归对于自变量有要求,度量变量或者非度量变量都不可以进行回归;p2205)在系统聚类过程中,聚合系数越大,合并的两类差异越小;P596)spss 只能对单变量进行正态性检验;7)Logistic 回归中的估计参数0,1,2,,)反应优势比率的变化,如果是正的,它的反对数值指数一定小于 1;2288)密度函数可以是负的;p39)计算典型函数推导的典型权重有较小的不稳定性;p20510)10、对应分析可以用图形的方式提示变量之间的关系,同时也可以给出具体的统计量来度量这种相关关系,使研究者在作用对应分析时得到主观性较强的结论;p17911)多元检验具有概括和全面考察的特点,容易发现各指标之间的关系和差异;p25p2512)名义尺度的指标用一些类来表示,这些类之间有等级关系,但没有数量关系;p43p4313)k-均值法是一种非谱系聚类法p44p4414)一般而言,不同聚类方法的结果不完全相同p6p615)判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的p90p9016)非谱系聚类法是把变量聚集成 k 个类的集合;p64p6417)主成分的数目大大少于原始变量的数目;p114p11418)因子分析只能用于研究变量之间的相关关系;p143p14319)聚类分析中的分类方法中,系统聚类法和分解法相似相反;P43P4320)聚类分析的目的就是把相似的研究对象归类;P42P42B B 卷卷一、填空题一、填空题1.因子分析中因子载荷系数的统计意义是第 i 个变量与第 j 个公因子的相关系数;146)2.类平均法的两种形式为组间联结法和组内联结法P563.设xx(,),i 1,2,10.则W(x)W(10,)10i3i1i3p54.聚类分析根据实际的需要可能有两个方向,一是对样品,一是对指标聚类;P435.模糊聚类分析方法中对原始数据进行变换,变换方法通常有标准化变换,极差变换,对数变换p636、设X N(,),其中X (x,x),(,),11,则Cov(x x,x x)=07.非谱系聚类法是把样品聚集成 K 个类的集合;P648.因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组间的相关性较低;P1429.两总体均值的比较问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形;P2510.因子旋转分为正交旋转和斜交旋转;P15011.Q 型聚类是指对样品进行聚类,R 型聚类是指对指标变量进行聚类;42 页12.一元回归的数学模型是:y=0+1x+,多元回归的数学模型是:_y=0+1x 1+2x 2+p x p+_;13.变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_.43 页14.判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判别法、Bayes 判别法、逐步判别法;80 页15 若A1Wp(n1,),n1 p,A2Wp(n2,),0,且 A1和 A2相互独立,则AA11A(p,.n1,n2)2;19 页16.对应分析是将 R 型因子分析和 Q 型因子分析结合起来进行的统计分析方法;170 页17.典型相关分析是研究两组变量之间相关分析的一种多元统计方法;194页18.判别分析适用于被解释变量是非度量变量的情形;19.主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法;113 页20.设xi,i 1,2,16是来自多元正态总体Np(,),X和 A 分别为正态总体P)Np(,)的样本均值和样本离差阵,则T154(X)A4(X)T(15,或15pF(p,np).16 p212二、判断题二、判断题1、对于任何随机向量 X=(X1,X2,.,Xp)来说,其协方差阵都是对称阵,同时总是非负定的;T P52、能够体现各个变量在变差大小上的不同,以及有时存在的相关性还要求距离与各变量所用的单位无关,这种距离是欧式距离;F P73、最长距离法中,选择最小的距离作为新类与其他类之间的距离,然后将类间距离最小的两类进行合并,一直合并到只有一类为止;F P554、当总体G1和G2为正态总体且协方差相等时,选用马氏距离;T P905、进行主成分分析的目的之一是减少变量的个数,所以一般不会去 p 个主成分,而是取 mmp 个主成分;T P1196、第 k 个主成分Yk与原始变量Xi的相关系数Yk,Xi称为因子负荷量;TP120(F1,F2,.,Fm)7、F=mp 是不可观测的变量,其均值向量 EF=0,协方差矩阵covF=I,即向量 F 的各分量不是相互独立的;FP1458、每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量;TP2029、分组数据的 Logistic 回归不仅适用于大样本的分组数据,对小样本的未分组数据也适用;FP23210、一个未知参数可以由显变量的协方差矩阵的一个或多个元素的代数函数来表达,就称这个为参数可识别;TP26411、随机向量 的协方差阵一定是对称的半正定阵;TP512、标准化随机变量的协方差阵与原变量的相关系数相同;T P513、对应分析反应的是列变量与行变量的交叉关系;F P17014、若一个随机向量的任何边缘分布均为正态,则它是多元正态分布;Tp1015、特征函数描述空间的元素之间是否有关联,而隶属度描述了元素之间的关联是多少;Tp6216、非谱系聚类法是把变量聚集成 K 个类的集合;F p6417、在对因素 A 和因素 B 进行对应分析之前没有必要进行独立性检验;Tp17318、系统聚类法中的“离差平方和法”的基本思想来源于如果类分得正确,同类样品的离差平方和应该较小,类与类之间的离差平方和应该较大;Tp5719、距离判别法对总体的分布没有特定的要求;Tp9020、Wilks 统计量可以化成 T2 统计量但是化不成 F 统计量;Fp18