医学统计学复习题三及答案(共5页).doc
精选优质文档-倾情为你奉上医学统计学复习题三一、名词解释1. 可信区间 在参数估计时,按一定可信度估计所得的总体参数所在的范围2. 统计推断 随机事件是否发生虽然不确定的,但应用统计方法,通过对局部的观察可发现其有统计规律性3. 参数估计 用样本统计量来估计总体参数,包括点值估计和区间估计4. 构成比 又称构成指标。它说明一事物内部各组成部分所占的比重或分布。 构成比=(某一组成部分的观察单位数同一事物各组成的观察单位总数)×100%5. 率又称频率指标。它说明某现象发生的频率或强度。 率=(发生某现象的观察单位数可能发生该现象的观察单位总数)×K6. 抽样误差:由于抽样原因引起样本率与总体率的差别7. 直线相关系数 也称Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。以符号r表示样本相关系数,表示总体相关系数二、单项选择1.观察单位为研究中的( a)。A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标2.总体是由( d )组成。A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标3.抽样的目的是( b )。A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( e ) 。A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的( a )。A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.抽样的目的是( b )。A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征7.表示总体均数的符号是( b ) 。A. B. C.X D.S E.M8.下述( c )种资料为计量资料。A.血型 B.性别 C.抗体滴度 D.肝炎发病人数 E.职业9.以下适宜描述计量资料离散趋势的指标有( d )。A.均数、标准差、方差 B.极差、标准差、中位数 C.均数、中位数、变异系数 D.标准差、四分位数间距、变异系数E.几何均数、标准差、变异系数10.描述一组分布不清的偏态分布资料的集中位置用( a )。A.中位数 B.均数 C.极差 D.几何均数 E.标准差11.方差分析的应用条件为( e )。A.随机性 B.正态性 C.方差齐性 D.A+B+C E.以上都不对12.在方差分析中,如果P,则结论为( b )。A.各个总体均数全相等B.至少有两个总体均数不等C.至少有两个样本均数不等D.各个样本均数不全相等E. 各个总体均数不全相等13.某地某年肝炎的发病人数占同年传染病人数的10.1%,该指标为(b )。A.率B.构成比C.发病率D.集中趋势E.时点患病率14.已知男性的钩虫病感染率高于女性。要比较两地居民的钩虫总的感染率,但是两地的性别构成不同,适当的比较方法是( d )。A. 分性别进行比较B. 两个率比较的x2检验C. 不具有可比性,不能比较D. 对性别进行标准化后再比较E. 作两个率差别的假设检验15. x2分布的形状( d )。A.同正态分布B.同t分布C.为对称分布D.与自由度有关E.与样本量n有关16. 当四格表的周边合计不变时,如果某格的实际频数有变化,则其理论频数( c )。A.增大 B.减小 C.不变 D.不确定 E.随该格实际频数的增减而增减17. R×C表x2检验的自由度为( d )。A.R-1 B.C-1C. R×C-1 D.(R-1)(C-1) E.R×C-218.对统计图和统计表标题的要求是( d )。A. 两者标题都在上方 B.两者标题都在下方 C.统计表标题在下方,统计图标题在上方D.统计表标题在上方,统计图标题在下方 E. 可由研究者随意设定位置19. 要反映某一城市连续五年甲肝发病率的变化情况,宜选择的统计图是( b )。A.直条图 B.线图 C.直方图 D.圆图 E.散点图20. 描述某地某年流行性乙脑患者的年龄分布,宜选择的统计图是( a )。A.直方图 B.线图 C.直条图 D.圆图 E.箱式图21.实验研究中设立实验组和对照组的原则是( d )。A. 实验因素和非实验因素在两组中均不同B.实验因素和非实验因素在两组中均相同C.实验因素在两组中齐同,非实验因素在两组中不同D.实验因素在两组中不同,非实验因素在两组中齐同E. 以上都不是三、简答题1.x2检验用于解决哪些问题?比较两独立样本率或多个独立样本率或构成比的假设检验;(一般四格表和行×列表) 配对设计两率比较的假设检验;(配对四格表) 检验两个分类指标是否有相关性; 检验某个样本是否服从某个分布的假设检验。2. 四格表x2检验的应用条件有哪些?(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。 (2)对于两样本率比较的四格表资料,就根据各格的理论值T和总例数n的大小选择不同的2计算公式:当n40且所有的T5时,用2检验的基本公式2= 或四格表资料检验的专用公式2=(ad-bc)2*n/(a+b)(c+d)(a+c)(b+d);当n 40但有1T5时,用四格表资料2检验的校正公式c2=(|A-T|-0.5)/T或改用四格表资料的Fisher确切概率法;当n40或T1时,用四格表资料的Fisher确切概率法。或资料满足两样本率的u检验的条件,也可用u检验。 (3)对于配对设计的四格表资料,若检验两种方法的检测结果无差别时:当(b+c)40时,2=(b-c)2/(b+c);当(b+c)40时,c2=(|b-c|-1)2/(b+c)。3.标准差和标准误在应用上有何区别?4.叙述正态分布的特征。 1正态曲线(normal curve)在横轴上方均数处最高 2正态分布以均数为中心,左右对称。 3正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用表示均数为,方差为的正态分布。用N(0,1)表示标准正态分布。 4正态曲线下面积的分布有一定规律。 实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。5.某市1990年肝炎发病数占总的传染病发病数的18.1%,而2000年为22.6%,能否认为6年来肝炎的防治工作无明显的成效?为什么?不能认为无明显成效。因为所占比例是定量资料,而且是百分比,以这类资料来评价成效是不科学的。7. 医学实验为什么常常要设立对照组,常用的对照形式有哪些(至少写出三个)?对照是实验所控制的手段之一,目的在于消除无关变量对实验结果的影响,增强实验结果的可信度。 临床试验要求设立的对照组与试验组来自同一个受试者群体,两组受试者基本情况相似。对照组的种类有: 1).阳性对照 以标准方法或常规方法作为对照组,以新方法或需要研究的方法作为试验组。这种对照方法的效率较高,在新疗法或新药物的研究时,试验组和对照组的受试者都能得到治疗。 2).阴性对照 对照组使用的方法除了试验组的研究因素外医学教|育网搜集整理,其他部分均与试验组相同。如在研究含氟牙膏的防龋作用时,对照组所用的牙膏除了没有氟化物,其他成分都与试验组相同。 3).安慰剂对照 对照组使用的制剂在形状、颜色、味道方面与试验组使用的干扰药物相似,这种对照称为安慰剂对照。安慰剂对照常用于消除主观因素的干扰,包括来自于研究者和受试者的干扰。 4).空白对照 对照组不使用任何措施。临床试验一般不采用空白对照,因为它违反盲法原则。但在某些情况下,盲法试验无法进行,如手术等,此时使用安慰剂对照没有意义,这时可以使用空白对照。 除以上这些对照方法以外,还有交叉对照、历史对照、潜在对照等方法。8. 平均数主要有哪几种,各自适用范围是什么?1)算数平均数(),在统计中算术平均数常用于表示统计对象的一般水平,它是描述数据集中位置的一个统计量。既可以用它来反映一组数据的一般情况、和平均水平,也可以用它进行不同组数据的比较,以看出组与组之间的差别。 (2)调和平均数(),调和平均数是标志值倒数的算术平均数的倒数。所以又叫倒数平均数,调和平均数也有简单调和平均数和加权调和平均数两种。 (3)几何平均数,几何平均数是n个比率乘积的n次方根。社会经济统计中,几何平均法适用于计算平均比率和平均速度。 (4)中位数(Me)。中位数是将总体各单位的标志值按大小顺序排列,处于数列中点位置的标志值为中位数。中位数将数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。在许多情况下,不易计算平均值时,可用中位数代表总体的一般水平。例如,人口年龄中位数,可表示人口总体年龄的一般水平。(5)众数(Mo)。众数是总体中出现次数最多的标志值。用字母 表示四、计算题1. 用甲药小儿重症上呼吸道感染61例,45例有效;用乙药治疗同样病人55例,48例有效,求两组有效率差值的95%可信区间,并作简单推断。有效率=(61+45)/(61+45+55+48)=51% 率的标准误=209/)51.01(51.0-=3.45%=0.0345 95%可信区间 40%-1.96(3.45%)<<40%+1.96(3.45%),即估计在33.22%46.78%之间 2 已知某地16名21 岁女大学生的平均体重=48.83Kg,标准差S=3.54Kg,求该地21 岁女大学生平均体重的95%医学参考值范围和95%可信区间。本案例自由度V=16-1=15,查表的t0.01/2,15=2.947 48.83-2.947*3.54=38.4Kg 48.83+2.947*3.54=59.56Kg S=)1/(2-n*S=0.365*3.54=1.29 则95%医学参考值范围为:38.4Kg-59.56Kg 女大学生体重95%的可信区间为:3.54+2.065*1.29 即:0.88-6.23某地经大量调查获得健康成人男性血红蛋白标准差为140.2(g/L),现测得25名从事某项特殊作业的成年男性血红蛋白均值=128.6(g/L) 标准差S=8.0(g/L)。问从事该项特殊作业的成年男性血红蛋白含量与一般人有无差别?1)建立检验假设,确定检验水准 H0:=0,即从事某项特殊作业的成年男性血红蛋白含量与一般成年男子相等,差别仅是由抽样误差造成的。 H1:=/0,即从事某项特殊作业的成年男性血红蛋白含量与一般成年男子不同。 =0.05(双侧),即确定小概率事件的标准是P<0.05 (2)计算检验统计量 T=|128.6-140.2|/|8/25|=7.25 V=n-1=25-1=24 (3)查响应界值表,确定P值,下结论 查t界值表中双侧界值t0.05/2.24 t0.05/2.25,得P0.05.按照水准a,拒绝H0,接受H1,差别有统计学意义,可以认为该厂成年男子血红蛋白均值与一般男子总均值不同。即,该厂成年男子血红蛋白均值地域一般成年男子血红蛋白总均值专心-专注-专业