《数理统计期末复习题1.doc》由会员分享,可在线阅读,更多相关《数理统计期末复习题1.doc(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流数理统计期末复习题1.精品文档.2009期末复习题注:这份答案是在2009年最后一晚做出来的,时间比较紧,所以可能有些地方不严谨,有什么错误还请各位多包涵。处理一个问题有很多合理的办法,这份答案所列出的只不过代表个人的想法,仅供参考。这份答案算是送大家的新年礼物吧,预祝大家期末考试顺利,一年都有好运 孟帅1. 设随机变量和相互独立,且都服从正态分布N(0,3),而和分别是来自总体和的样本,则统计量U = 服从什么分布?为什么?解:分子分母同除以9得到 服从N(0,1), 服从X(9)分布,因此U服从 t(9)分布(课本92页)2某大学来自A,
2、B两市的新生中分别抽取10名和11名男生调查身高,测得他们的身高分别为,样本方差分别为,。不妨设两个城市的男生的身高分别服从正态分布和,求的95的置信区间,并请在0.05水平下判断两个城市的男生身高是否相等?解: 但是 未知,构造T= (111页) = 。 =10, =11, =11.3,=9.1, =176, =172。代入T表达式得到T= 。T服从t( + -2)查附表7得到 =2.093得到 的置信区间为:(1.088,6.912) 这个区间不包含0,可以直接判定在0.05水平下两城市男生身高不相等。如果想严谨一点就在进行假设检验: 原假设:两城市男生身高相等;备择:两城市男生身高不等。
3、 检验统计量T= ,和 比较。如果T大于 ,拒绝原假设,否则接受。3随机调查了某校200名沙眼患者,经用某种疗法治疗一定时期后治愈168人,试求总体治愈率的95%置信区间。解:样本率p=0.84,用大样本正态近似法求解,置信区间为:( , )(课本115页) n=200,查附表4得 =1.960 95%置信区间为(0.789,0.891)4.假设从两个总体和等概率地抽取样本并进行分类,分类过程如下:如果样本值大于则判定为总体,否则就判断为总体,试问:将总体错判为总体的概率是多少?将总体错判为总体的概率是多少?解:P(总体X错判为总体Y)=P(X1.96),查附表4, =1.96故P(X1.96
4、)=0.025P(总体Y错判为总体X)=P(Y1.96)=P(Y-10.96),而Y-1服从N(0,1)查附表3得到(0.96)=0.8315,故P(Y1.96)=0.83155.为测定某药的剂量x与血药浓度之间的关系,测得如下数据:剂量51015202530血药浓度15.231.746.758.976.982.8求关于x的回归方程,并检验方程的显著性()。解:求回归方程:可以用公式手算, 当然,考试时允许用计算器的,把上面的数据直接键入,很快便出结果了。 回归方程: 检验方程的显著性:原假设:无线性关系;备择:回归效果显著计算统计量 , , (课本229-230页)剩下的就是狂按计算器。F=
5、343.88,查附表8得到 =21.2,所以拒绝原假设,方程回归效果显著。当然,用r检验也可以,二者本质上是一样的,在此不再赘述。6在诱发大白鼠鼻咽癌的试验中,一组用亚硝酸向鼻腔滴注(鼻注组),另一组在鼻注的基础上加维生素B12肌注(鼻注+B12),试验数据如下: 发癌鼠数 未发癌鼠数 鼻 注 52 19 鼻注+ B12 39 3试问 ”鼻注” 与 ”鼻注+B12” 对大鼠诱发癌的作用是否有关联?用什么方法检验?假如上述数据列表中的第二格的数据变为6,该方法是否还适用?为什么?解:用X检验。 原假设:无关联;备择:有关联a=52,b=19,c=39,d=3,n=113计算统计量 =5.287
6、(课本166页)查附表6得到 所以拒绝原假设。 数据列表中的第二格的数据变为6,这个时候用X检验就有点勉强了,四格表的数据画成柱形图时,成对角线斜坡状是最理想的,而此时出现了6和3两个很小的状态,正态性很差,因而不适合。此时应当用精确概率检验: a=52,b=6,c=39,d=3,n=100代入得 P=0.2440.05,故不拒绝原假设,既无关。7:随机抽取8名健康者的血液,将其的血滤液放置不同时间(0,45m,90m,135m),测定血糖浓度,每个受试者有4个测定值。请问,应该用什么方法分析血糖在不同放置时间的变化?假如要分析各个时间点的差异,应该如何判定?为什么?受试者编号放置时间(分)0
7、14529031354(1)95958983(2)95948884(3)1061059790(4)98979590(5)102989788(6)11211210194(7)1051039788(8)95929080解:时间为单因素,不同时间为不同水平。原假设: ;备择:不全相等。 =1833.96875, =890.38, =943.59 =9.89,F服从于F(3,28)分布 查附表8得到 =2.95,因此拒绝原假设,即时间对血糖浓度有影响。 既然时间对血糖浓度有影响,那么就要进行两两比较,以分析各个时间点的差异。 本题中只有四个水平,用单纯的t检验当然是可以的,但不推荐。下面将以Q检验法为
8、例: =101, =99.5, =94.25, =87.125R=max - =13.875 =5.639 = =13.929在0.05水平,k=4,f=28下查q表(相当郁闷的是,表里没有28自由度的数据,只好用内插法了)q(4,24)=3.90,q(4,30)=3.84。得到q(4,28)=3.86q=13.929q(4,28)因此拒绝原假设。 =3.848四个组的均值两两做差,绝对值大于 的认为有显著性差异,发现从第二组到第三组就有显著差异了。(注:Q、S检验课本上没有细述,在第八章-方差检验的课件上)8:对一组胃炎病人先后服用两种药物,然后分别测定其最大排酸量(mmol/h),请问,应
9、该用什么方法分析两种药的效果之间的差异。为什么?需要注意什么问题?病例甲药乙药病例甲药乙药编号XY编号XY111.518.841214.5612.49212.0510.49139,468.04322.2622.281411.209.4443.111.781516.5314.1252.031.76168.056.6764.613.85174.543.8771.230.91189.227.9382.532.04196.084.9293.962.99208.657.52104.683.922113.9211.931111.769.932210.3614.68解:这是一组配对资料,可以考虑使用配对T检
10、验(课本129页)。采用t检验首要数据考虑的正态性。当然,这一点一般是默许我们使用的。只有当数据波动特别明显是才考虑(第九题就不符合正态性)。 配对T检验:设 ,D服从N(,)原假设:=0;备择:0。 =3.389t服从于t(22-1)分布。查附表7得到 =2.080故拒绝原假设。采用符号检验或者秩检验也可以。例如符号检验,根据原始数据的大小定义+、-号:+、+、-、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、-。即使不计算也能看出来+太多了。S=min =2,在=0.05,n=22情况下,查附表12得到 =5, 因而拒绝原假设。9:用两种方法测定同一批人血清样品中
11、的黄体生成素(HCG-CH)含量(mg/L),试分析两法的效果,能否用固相法取代双抗体法。样品编号含量(mg/L)样品编号含量(mg/L)固相法双抗体法固相法双抗体法XYXY11.40.7571700150022.72.782400352034.11.3931003100428.013.7101184016680583.561.0111800016900610576.0121923018320解:这同样是配对资料的分析,但是和上一题不同,本体绝对不可以用T检验。数据的波动太大,要是这样的数据也能当做正态,那这个世界就和谐了。 可以考虑使用符号检验,wilcoxon符号秩检验。 符号检验法: 原
12、假设:两种方法效果相同;备择:不相同。 差值标记:+、0、+、+、+、+、+、-、0、-、+、+。差值为零的不计入。S=2,n=10,=0.05。查附表12得到 =1, S ,所以接受原假设。符号秩检验:差值绝对值序列:0.65、2.8、14.3、22.5、29、200、910、1100、(-)1120、(-)4840对应的秩为1到10 =1+2+3+4+5+6+7+8=36, =9+10=19T=19 根据n=10,=0.05查附表13得到 =8,T ,因而接受原假设。10:两组大鼠,一组为药物组、另一为空白对照组。两组大鼠在4个不同级别的压力(分别是20、40、60、80mmHg)下测量数
13、据,所得数据为在不同压力作用下测量的计量资料(一只大鼠同时有四个不同的数据)。现要对两组大鼠的测量数据进行统计分析比较,以了解药物对不同压力下测量的数据有无影响。请问采用哪种统计分析方法? 解:上课的时候老师说过10题和11题仅仅是提醒我们处理数据时要 注意同质性原则,统计方法不作要求。老师给的方法是根据数据求出压力与数据的回归,来消除压力对于数据的影响,从而转化成用药与不用药的单因素分析。课本上讲到双因素方差分析时,有一种方法叫做“等重复双因素方差分析”,适用于这类问题,不过很繁琐,简单了解一下吧。11:假设测了一个细胞株在几个不同处理因素下的A指标,每组重复测量6次取均值。然后又测了这几个
14、处理因素下的B指标,同样每组重复测量6次取均值。因为A指标受B指标的干扰,所以,要排除B的影响,最好比较A与B的比值。问题是,两者均数都算出来了,比值就只有一个,如何统计分析呢?是不是可以这么做:假设A指标检测结果是A1A6,B指标检测结果是B1B6,然后用A1/mean(B1+.+B6),A2/mean(B1+.+B6),A3/(B1+B6)依此类推,得到6个比值后,再用方差分析进行各处理组间的比较?解:这一题很让人费解啊,既然A受B的影响,那A1,A2A6同时除以一个相同的数能有啥作用呢。当然,如果B指标的微小波动就会对A产生显著影响的情况下是可行的。我向一些高人请教,他们多数认为直接平均
15、带来的误差太大,建议使用校正平均。我就简介一下这种做法:首先,既然可以通过比值来消除干扰,那么A和B就应该有很好的同向性,即B大A也大,这样A/B才能相对稳定,才符合重复试验的特征(也许有人会提出,把A和B大小排序,对应相除。咋一听是很让人兴奋地,不过请不要忘了,A和B的测量是分开的,不是成对关系);将A、B按大小排序A1A6,B1B6。校正比值是 其实就是在玩线性,没啥意思。12:采取干预措施治疗腹泻,收集两组数据,记录两组样本的基线数据和干预后的发病率数据,两组样本进行干预之后的发病率都有变化。请问用何种分析方法可以分析这两组样本的净变化是否有显著性差异?如基线1、2组腹泻率分别为42.5
16、%、37.7%,最后腹泻率为24.3%、26.4%,1组样本780,2组400人,如何分析?计算疾病的相对净变化率(本期的发病率基期的发病率)/基期的发病率,比较两组净变化率的差异,用u检验。这样是否可以?解:未知,不能用u检验。可以将数据转化为四格表治愈人数未治愈人数合计基线1组142190312极限2组45106151合计187296463可以使用大样本X检验。原假设:没有显著性差异 =6.9813.841拒绝原假设,即两组净变化差异性显著。13.选取4种不同品系的雌性小白鼠,静脉注射巴比妥钠60mg/kg后,观察它们的麻醉维持时间,结果见下表。A1926262321302327B3633
17、29284026C2618231528D1915263034141619请问如何检验这四种不同品系的雌性小白鼠麻醉维持时间是否有显著性差异?解:本题是样本数量不等的方差分析,但基本公式没变。原假设: ;备择:不全相等。 =1170.08 , =737.75, =432.33 =4.493 查附表8得到 ,很明显应当拒绝原假设。 即不同品系之间有明显差异。14某山区小学,205名男生中有31人感染肺吸虫,90名女生中有10人感染肺吸虫。问男女生的肺吸虫感染率是否有显著性差异?可以有几种方法?解:方法一:四格表X检验 原假设:无显著性差异男女合计患病311041不患病17480254合计20590295 =0.5393.841,接受原假设。方法二:两个二项分布总体率的比较记男生患病人数为X,女生患病人数为Y。设X服从B(205,P1),Y服从B(90,P2)原假设:P1=P2;备择P1P2。=0.917 (课本144页) 给定置信度95%U服从N(0,1),查附表4得到 =1.960接受原假设。(这类问题的分析是很基本的,因此方法也很多,不一一详述,总之,只要检验的过程合理即可)
限制150内