多元统计分析方法练习题.pdf
《多元统计分析方法练习题.pdf》由会员分享,可在线阅读,更多相关《多元统计分析方法练习题.pdf(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、附录 B 习题第一章1-1 设 2060 岁的男子大脑重量与头颅长度(Y,cm)服从二元正态分布.已知 X 与 Y 的相关系数为;X 的均数和标准差分别为:和。试写出X 与 Y 的二元正态分布函数。并绘制二元正态分布的正态曲面。1-2 已知成年女子的胸围、腰围和臀围服从三元正态分布, 均数分别为:,协方差矩阵为:30.53025.53639.85919.53220.70327.363试写出相应的三元正态分布函数。1-3 证明,若变量x1,x2服从二元正态分布MN换:,;,;,对x ,x12122212作线性变zixiii,i 1,2则z1,z2亦服从二元正态分布。并分别求出z1,z2的均数、方
2、差及z1与z2的相关系数。1-4 就例资料,图示二元分布的90%参考值范围。1-5 设 S 和 R 分别是随机向量X 的方差-协方差矩阵和相关系数矩阵,证明:S =s11s22L smmR.第二章2-1 对 20 名健康女性的汗水进行测量和化验,数据如下,其中,X1为排汗量,X2为汗水中钾的含量,X3为汗水中钠的含量。试检验,样本是否来自0=(4,50,10)的总体。试验者 X1X2X31.3.5.7.9.11.13.15.17.19.试验者 X1X2X32.4.6.8.10.12.14.16.18.20.资料来源:王学仁、王松桂, 实用多元统计分析 ,上海科学技术出版社,123 页。2-2
3、以两均向量比较为例,证明,队数据阵作线性变换,不改变假设检验的结果。2-3 验证:当 m=1 时,Hotelling T 检验与 t 检验等价。2-4 中学男女若干名,测量其身高, 体重, 胸围,结果见下表。试检验男女生的身体发育状况有无差别。男生女生编号 _编号 _身高体重胸围身高体重胸围123456789101112 1 2 3 4 5 6 7 8 9 102为了解某溶栓药对脑梗塞患者血压的影响,观察10 名患者,分别与疗前、溶后 5 分钟、10分钟、20 分钟测定患者的收缩压(X,mmHg)和舒张压(Y,mmHg) ,结果如下表,问该溶栓药对血压有无影响?疗前溶后 5 分钟溶后 10 分
4、钟溶后 20 分钟ID _ _ _ _ X Y X Y X Y X Y1 175 115 175 110 170 110 170 902 136 93 130 90 135 95 135 973 142 89 138 99 138 99 142 1084 180 100 180 100 180 100 180 905 170 90 170 80 180 70 170 706 125 70 114 67 111 64 112 687 140 100 140 90 140 90 140 908 150 70 144 81 166 87 151 919 150 98 150 98 150 98 14
5、3 8310 105 75 113 75 113 75 113 75资料来源:陈清棠,九五攻关项目。1999为寻找挤压塑料胶卷的最优工艺条件,在研究中考虑两个因子:拉力和添加剂的浓度。观察 3 个指标,耐力(X1) ,光泽(X2) ,不透明度(X3) 。结果如下。问拉力和添加剂的浓度对 3 个指标有无影响?添加剂 1%(A1)添加剂%(A2) _ _ X1 X2 X3 X1 X2 X3低拉速(B1)高拉速(B2)资料来源:王学仁、王松佳, 实用多元统计分析 ,上海科学技术出版社,1990,188 页。第三章3-1证明:在两样本均数的比较,如将分组变量视为自变量, 将观察指标视为因变量,作回归分
6、析,则所得回归系数的 t 检验与两样本均数的 t 检验结果是等价的。3-2下列资料是用三种饲料喂大白鼠后得到的肝重比值。 将分组变量视为自变量, 并用哑变量表示,将观察指标视为因变量,作回归分析。验证,所得回归方程的 F 检验与三组均数比较的方差分析的 F 值是相同的,结论是等价的;三种饲料喂大白鼠后的肝重比值(%)组别甲乙丙y均数3-3以上两个练习题说明, 通常的方差分析模型是线性回归模型的特殊情况。 找一个区组设计的例子,将其用线性模型表示,并比较均数的方差分析结果与模型检验的结果。3-4为研究建立年龄(age) 、体重(weight) 、跑英里所用的时间(runtime) 、休息时的脉搏
7、数(runpluse)及跑步时的最大脉搏数 (maxpluse)与肺活量间的关系,测量了 31 人的数据。结果如下。试进行回归分析。 age weight runtime rstpulse runpulse maxpulse oxy 44 62 178 182 40 62 185 185 44 45 156 168 42 40 166 172 38 55 178 180 47 58 176 176 40 70 176 180 43 64 162 170 44 63 174 176 38 48 170 186 44 45 168 168 45 56 186 192 45 51 176 176 4
8、7 47 162 164 54 50 166 170 49 44 180 185 57 58 174 176 54 62 156 165 51 59 186 188 57 49 148 155 49 56 186 188 48 52 170 176 52 53 170 172资料来源:高惠璇编译, SAS 系统 SAS/STAT 软件使用手册 ,中国统计出版社,1997,148 页。35文中所述逐步回归中的消去变换是从离差阵出发,最后可直接得到偏回归系数 bi和参差平方和 Q。从离差阵出发进行消去变换有一个缺点,当样本含量较大时,离差阵中元素可能很大,则其倒数将很小,此时需要保留足够的小数位数
9、,有时保留 8 位或 10 位还不够。此时,可以考虑从相关矩阵出发进行消去变换等运算, 常保留 6 位小数。 所得变量的剔选过程是等2价的。而最后得到的是相应的标准偏回归系数bi和标准残差平方和 Q =1-R 。试验证之。36试证明,R 是 y 与的 Pearson 相关系数。3-7学校里孩子的体重看成是他们的身高和年龄的函数模型。从学校里调查了237 个小学生的性别(f:女性,m:男性) 、身高(英寸) 、年龄(月)和体重(磅) 。试建立体重与性别、身高、年龄的回归模型。年身体性年身体性性别龄高重别龄高重别f14385F155105f年身龄高体重153108fffffffff16159921
10、8559104140157124145891471151408118510118059112FFFFFFFFF191142139149191180164166210581136910493107114104140fffffffff1711121606217814315014185176112175146f170f139f169f182f168f184f144f197f147f167f183f147f144f191f148f178f147f171f183f186f142f154f163f210f182f141f169m165m150m189m146m173m150m206909610595108
11、11275103112114118101911125756611238462116641128585988467128909359134F162F186F177F173F169F139F177F146F145F183F185F154F154F190F189F164F148F172F143F182F165F150F141F171F144F164F175M157M150M183M160M151M164M250588495143103621126010984110601066011414011498599514211713310774566384619210886105128111841179517
12、2f149f197f185f166f150f147f178f145f155f143f148f156f152f140f143f157f177f190f179f182f165f155f147f167f193f186f180m144m139m147m156m141m153m17612111894591078477751056077112816362676664611151088779112846084mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm176180140144193186175170144144169193140158144149203188174143182162
13、17515017117414020619314616116415314216465666860626557676063725558551191048494133112112113881181001281218481117151120101133105114118112112172150758476140MMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMM14014615116016214317517415614717215715618417614214220016616317317716618816214216015919413915315915516416766576558
14、557166636263566455628386119751081068411211281708414784118112111911169111611213512899112108mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm1851831511781641751731641491881501681561561681881891521451661551771501631411481441491521861961781781891516666616469576071596660651058195921089211284114140112105911211129811285
15、1188972971129811211487382为研究正常少儿的心象面积(y,cm ) ,与性别(x1,男取 1,女取 0) 、年龄(x2,月) 、身高(x3,cm) 、体重(x4,kg) 、胸围(x5,cm)之间的关系,某单位调查了521 名 2 岁半至 15岁的少儿。得各指标均数、离均差平方和如下:, , , , ,,相关矩阵如下:资料来源:史秉璋,杨琦编著, 医用多元分析 ,人民卫生出版社,1990,第 80 页。试进行逐步回归分析。39为研究初生儿体重与胎儿的孕龄,头径,胸径,腹径,股骨长的关系,以预测初生儿童的体重,某医院用超声波测得18 名胎儿的上述指标,结果如下。试建立回归方程
16、。123456789101112131415161718孕龄(天) 头径(mm) 胸径(mm) 腹径(mm)生儿体重股骨长 X5X1X2X3X4(g)Y28910110910773390028286848369250027010210110066340028498969274320027510110010468310028510194986932002709810399683100259978081632400285109102104883800268103951017332002801079910776350026711290987135002711001021047130002831011
17、061036837002871021061077139002731031021026130002761029899883100276106103103743650资料来源:郭祖超主编, 医学统计学 ,1999,人民军医出版社,201 页。第四章41 对某够高中一年级男生 38 人进行体力测试及运动能力测试,包括:X1 一反复横向跳(次) ,X2 一纵跳(cm) ,X3 一背力(Kg) ,X4 一握力(Kg) ,X5 一台阶试验(指数) ,X6 一立定体前驱(cm) ,X7 一俯卧上体后仰(cm) 。运动能力测试的指标为:X8-50 米跑(秒) ,X9 一跳远(cm) ,X10 一投球(m) ,
18、X11引体向上(次) ,X12 一耐力跑(秒) 。试进行主成分分析。序号 x112345678x2x3x4465512652559546691074950105425590486110649601004863122x5x6x7x8517525724281185038981874489816604667268437825584991156052561768x9x10 x11x1285967236034838633139138937936277489274643043032362264052946628453231142021109101112131415161718192021222324252
19、627282930313233343536373845551054864120495210047621004151101525512545529449571105365112477795486012049551134869128425712254641555363120427113846661204556915060120425112648501154252140486710549741514755113497412044521105266130486810048761561386020624253536243866425605623461106250512065477219454790157
20、547729644786126241841560424820634654156351711961425785344651755456222682966185142574153857639505013574856156039692360495420584071196453552259375514574746144545542370777774152441328404234272537225394246767333963984004074093503993373574473813873503882983533703603583483833143483263303313424213553524963
21、010446301144630124202539827485304002843029487294702838026460323982741528447649755264472811511331247027114502810500301241029400295222872950033215052811资料来源:于秀林、任雪松、 多元统计分析 ,中国统计出版社,1999,226 页。4-2 求相关矩阵:的特征根与特征向量。4-3 我国 42 个 10 万人以上的少数民族 80 年代末期部分文化、卫生、经济指标如下表,是O进行主成分评价。 /oo人均工资总产12 岁以上文盲各 类 专 业 技人口密度
22、年平均温度 术人员(%)民族满族朝鲜族出生率标化死亡率 生育率值率(O/oo)(O/oo)(O/oo)(元/年)盲率(%)(人/Km3) (c)4蒙古族回族维吾尔族藏族蠡族白族哈尼族苗族布依族侗族壮族瑶族土家族哈萨克族克组傣族黎族东乡族土族柯尔克孜族佤族傈僳族拉祜族纳西族水族羌族畲族锡伯族景颇族布朗族阿昌族京族独龙族裕固族普米族怒族德昂族基诺族仫佬族撒拉族毛南族3332503672252121812082483512703333453133253753083133483282883961763602903123323763950954921078638924045391304065605110
23、26322535921438112212151621663151831822191920807资料来源:钱建明等, 中国少数民族健康趋势研究 ,成都科学技术出版社,19994-4在我国制定服装标准时,测量了3454 名成年女子的 14 个部位的数据,得协方差矩阵如下,是进行主成分分析。x1x2x3上体长x1手臂长x2胸围颈围x3x4x4x5x6x7x8x9x10 x11x12x13x14总肩宽x5前胸宽x6后背宽x7前腰节高 x8后腰节高 x9总体高x10身高腰围臀围x11x13x14下体长x12资料来源:张尧庭方开泰著多元统计分析方法 ,科学出版社,1982,P115第五章5-1比较因子分析
24、与主成分分析模型的关系,说明它们的相似之处和不同点。5-2对练习 4-1 资料进行因子分析。5-3从协方差矩阵出发,对例4-1 资料进行因子分析,比较两者的结果。5-4Holzinger KJ(1934)报告了 355 名小学生 12 项心理测试项目间的相关系数矩阵如下,试作因子分析。Perception of brightnesscount dotsstraight and curved letters speed in simple codeverbal completion11111understanding paragraphsreading vocabularygeneral inf
25、ormationarithmetic proportionspermutation-combinationsmechanical ability Imechanical ability II1111111资料来源:Harry (1960).Modern Factor Analyses. The University of Chicago 页。第六章6-1 在例中,就下列两种情况解释logistic 回归模型中 x 的系数的涵义,并导出x 的系数,写出相应的 logistic回归方程。 (1)暴露时 xO,非暴露时 x 一 1;(2)暴露时 x 一 1,非暴露时 x- -1。6-2 某研究调查了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 方法 练习题
限制150内