《医学统计学》复习资料.pdf
医学统计学复习资料 试卷第试卷第 1 页,共页,共 30 页页 医学医学统计学统计学复习资料复习资料 (按章节顺序编排题号) 一、一、名词解释名词解释(理解性记忆)(理解性记忆) 1Population:总体,根据研究目的确定的同质研究对象的全体。 1Sample:样本,从总体中抽取的具有代表性的部分个体。 1Probability:概率,随机事件发生可能性大小的数值度量。 1Sampling error:抽样误差,由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 2Medical reference range:医学参考值范围,绝大多数正常人的某指标值的波动范围。 2Central tendency:集中趋势,所有的观测值以某一数值为中心,即频数分布有一个高峰,称为集中趋势,反映资料的平均水平或中间位置。 3Standardized mortality ration, SMR:标准化死亡比,被标化组的实际死亡数与预期死亡数之比。 5Standard error:标准误,样本均数的标准差,是描述均数抽样误差大小的指标。 5参数估计:指用样本指标(统计量)来推断总体指标(参数) 。 5Interval estimation 区间估计 / Confidence interval 可信区间(或称置信区间) :指按预先给定的概率 1 - ,由样本指标确定的包含总体参数的一个范围。 5Hypothesis test:假设检验,先对总体做出某种假定(检验假设) ,然后根据样本信息来推断其是否成立的一类统计方法的总称。 5Level of a test / significant level:检验水准,拒绝 H0时的最大允许误差的概率。 5Type I error:第一类错误,检验假设 H0本来是成立的,经过检验后被拒绝了,即“弃真” ,其发生的概率为 ,为已知。或:拒绝了实际上成立的 H0。 5Type II error:第二类错误,检验假设 H0本来不成立,经过检验后被接受了,即“取伪” ,其发生的概率为 ,属未知数。或:没有拒绝实际上不成立的 H0。 5Power of a test:检验效能,当两总体确有差别,按 水准能发现它们有差别的能力。 10Linear correlation coefficient:直线相关系数,说明具有直线关系的两个变量间相关关系的密切程度与相关方向的统计指标。 10Coefficient of determination:决定系数,表示由 x 与y 的直线关系导致的y的变异SS回在总变异SS总中所占的比重。 10Least square method:最小二乘法,实测点到直线的纵向距离的平方和最小来估计回归系数。 12Confounder:混杂因素,影响实验效应并与处理因素同时存在的非处理因素。 12Random sampling:随机抽样,指保证总体中的每一个个体都有同等的机会被抽出来作为样本。 12Random assignment:随机分组,指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。 12Replication:重复,研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本例数。 12Balance:均衡原则,实验组和对照组或各实验组之间,除了处理因素以外,其他条件应尽可能相同。 12Randomized block design:随机区组设计,是将几个条件基本相同的受试对象划成一个区组,再将区组中的受试对象采用随机的方法,分配到不同的处理组中,以增强各处理组间的均衡性。 医学统计学复习资料 试卷第试卷第 2 页,共页,共 30 页页 二二、是非是非题题 1概率介于 01 之间的事件称为随机事件。 () 1如果对全部研究对象都进行了调查或测定就没有抽样误差。 () 2分布末端无确定数据的资料,宜选用中位数来描述其平均水平。 () 2用 P5制定单侧 95%的参考值时,其参考值范围应是(P5,) 。 () 295%与 99%的参考值范围相比,前者漏诊率大,后者误诊率大。 () 2参考值范围可用来判断某个体值是否正常。 () 5可信区间用来判断某个体值是否正常。 () 3一般把发病率高的疾病称为常见病。 () 3标准化法只适用于内部构成不同影响到总率比较的情况。 () 5对于同一资料,95%医学参考值范围的宽度小于总体均数 95%可信区间的宽度。 () 5xstx,05. 0的意义为 100 个总体均数中,有 95 个落在此范围。 () 5假设检验的目的是排除抽样误差对结果的影响。 () 5两样本均数差别作假设检验,无效假设成立与不成立时所犯 II 类错误的概率相等。 () 5置信区间也可以用来判断某个个体值是否正常。 () 5t 检验中,拒绝 H0时,P 值越小,说明两总体均数差异越大。 () 5作两样本均数差别的比较,当 P0.01 时,统计上认为两总体均数不同,此时推断错误的可能性小于 0.01。 () 5t 检验可用于同一批对象的身高和体重均数差异的比较。 () 5同一资料作单侧和双侧检验,单侧更易得到差别的结论,所以应选用双侧检验。 () 5配对资料也可以用成组 t 检验处理,但这样做降低了统计效率。 () 5 完全随机设计资料不能用配对 t 检验进行统计处理以提高统计效率。() 不相同。 () 6若单因素方差分析结果为 FF0.05,,可认为各组均数不全相同。 () 6进行三个均数差别的方差分析,当 P0.05 时,可认为各样本均数之间总的来说有差别,但不能说明彼此之间都有差别。 () 6随机区组设计的资料可用完全随机方差分析进行统计处理,但这样做就降低了统计效率。 () 6随机区组设计的资料可用完全随机方差分析进行统计处理以提高统计效率。 () 6q 检验(SNK 检验)适用于事先有明确假设的证实性研究。 () 6随机区组方差分析中,只有当区组间差别的 F 检验结果 P0.05 时,处理组间差别的 F 检验才是真正有意义的。 () 6随机区组设计资料不能分析交互作用。 () 6随机区组设计资料还能分析组间的交互作用。 () 7所有可能发生两分类结果的随机变量均服从二项分布。 () 7单位空间内发生任何稀有现象的次数均可视为 Poisson 分布。 () 8三行四列表做 2检验允许有一个 1T5。 () 8对三个地区血型构成(A、B、O、AB 型) ,作抽样调查后比较,若有 3个理论数小于 5 大于 1 且 n40,可用 2检验的校正公式。 () 8对三个地区血型构成的抽样调查资料比较,若有一个理论数小于 5 大于1 且 n40,用校正 2检验,也可用确切概率法。 () 82检验可用于推断两个或两个以上样本率之间有无差别。 () 6完全随机设计方差分析中,若 P0.05,则可认为总体均数两两之间都P0.05,就表明前者两样本均数差别大,后者两样本均数相差小。 ()5两次 t 检验都是对两样本均数的差别作统计检验,一次 P0.01,另一次医学统计学复习资料 试卷第试卷第 3 页,共页,共 30 页页 9 两组资料比较秩和检验, 当采用 z 检验时, 此时检验属于参数检验。 () 9非参数检验又称任意分布检验,其意义是不涉及特定的总体分布,故其适用范围更广。 () 9完全随机设计多个样本秩和检验两两比较时,需要对 进行调整。 () 9能用 t 检验分析的计量资料用秩和检验,会降低统计效率。 () 9无论什么资料,t 检验的检验效率均高于秩和检验。 () 9无论什么资料,秩和检验的检验效率均低于 t 检验。 () 9在配对资料比较的秩和检验中,T 值在界值范围外则 P 值大于相应的概率。 () 9两组资料比较秩和检验 T 值在界值范围内则 P 值大于相应概率。 () 9在两组资料比较的秩和检验中,T 值在界值范围内,则 P 值小于相应的概率。 () 9配对秩和检验中把两组数据混合后统一编秩次。 () 9成组设计两样本比较秩和检验中把两组数据混合后统一编秩次。 () 10rs = 0.35,P0.05,可认为两变量无相关关系。 () 10rs0.65,P0.05,可认为两变量中度相关。 () 10算得 r = 0.85,可认为两变量间相关较密切。 () 10进行 r 的假设检验应首选单侧检验。 () 10等级相关系数的大小不可以反映两个现象间关系的密切程度。 () 10两变量关联性分析,假设检验 P 值越小,说明两变量关联性越强。 () 10双变量正态分布资料,样本回归系数小于零,P0.05,可认为两变量呈负相关。 () 10回归分析中 b0,经检验 P0.01,则可认为能作相关分析的两变量呈负相关。 () 10同一资料,回归系数的符号与相关系数的符号是一致的。 () 10简单线性回归分析的自变量只能是二分类的资料。 () 10简单回归分析的前提条件之一是双变量服从正态分布。 () 11整群抽样研究中,群间差异越大越好。 () 11分层抽样研究中,层间差异越大越好。 () 11抽样研究中,允许误差越大,所需样本量越小。 () 12实验研究中,随机化分组是实现组间均衡的重要手段。 () 12实验研究中,进行随机化分组就能实现组间的均衡。 () 12实验设计的三个基本要素是处理因素,混杂因素和危险因素。 () 12 越小,所需样本例数越多。 () 121 越大,两样本比较研究中所需样本例数越多。 () 12进行样本量估计时,所定检验功效越大,所需样本量越大。 () 12 或 s 越大,所需样本例数越多。 () 12实验设计的特点之一就是研究者人为设置处理因素。 () 12对照组在实验中也被看成是一种处理,而且是实验设计的一个重要内容。 () 医学统计学复习资料 试卷第试卷第 4 页,共页,共 30 页页 三三、单项单项选择选择题题 1. 统计一批肝炎病人的住院天数是_。 a. 计量资料 b. 还不能决定是计量资料还是计数资料 c. 计数资料 d. 既可作计量也可作计数资料 e. 等级资料 1抽样误差的根源在于 ,在抽样研究中是不避免的。 a研究设计不合理 b选择研究对象方法不当 c个体变异 d样本例数过少 e观察或测量方法不一致 2一组观察值,如果每个值都增加或减少一个不为 0 的常数,则_。 a均数改变,几何均数不变 b均数改变,中位数不变 c均数,几何均数和中位数都改变 d均数不变,几何均数和中位数改变 e均数,几何均数和中位数都不变 2两组资料的标准差相等,则_。 a它们的均数也相等 b它们的均数必不等 c它们的均数可能相等也可能不等 d它们的均数互为倒数 e它们的均数呈倍数关系 2测量某地 100 名健康工人的尿 ALA 含量,均数 7.06mg/L,标准差0.95mg/L,现一铅作业工人的尿 ALA 含量为 10.8mg/L,对其做出评价,所用范围是 。 a. 95. 006. 7)99(05. 0t b.095. 096. 18 .10 c.095. 096. 106. 7 d. 95. 096. 106. 7 e.095. 096. 18 .10 2为调查某地成年男子 RBC 数,随机抽取 100 名成年男子,其均数为4.8 1012/L,标准差为 0.42 1012/L。其中有 8 名男子的 RBC 数低于4.0 1012/L。则该地 95%成年男子 RBC 数落在的范围是 。 a. 4.8 1.96 0.42 b. 4.8 1.96 0.42/100 c.4.8 1.645 0.42 d.4.0 1.96 0.42/100 e. 4.81.645 0.42/100 2某病人的某项指标高于高于正常人,但有部分重叠,为控制漏诊率漏诊率应当_。 a提高医学参考值范围上限值 b降低医学参考值范围上限值 c提高医学参考值范围下限值 d降低医学参考值范围下限值 e以上都不对 2 某病人的某项指标高于高于正常人, 但有部分重叠, 为控制误误诊率诊率应当_。 a提高医学参考值范围上限值 b降低医学参考值范围上限值 c提高医学参考值范围下限值 d降低医学参考值范围下限值 e以上都不对 2 某病人的某项指标低低于于正常人, 但有部分重叠, 为控制漏漏诊率诊率应当_。 a提高医学参考值范围上限值 b降低医学参考值范围上限值 c提高医学参考值范围下限值 d降低医学参考值范围下限值 e以上都不对 2 某病人的某项指标低低于于正常人, 但有部分重叠, 为控制误误诊率诊率应当_。 a提高医学参考值范围上限值 b降低医学参考值范围上限值 c提高医学参考值范围下限值 d降低医学参考值范围下限值 e以上都不对 2制定参考值范围时,若要控制漏诊率应当考虑_。 a. 提高单侧参考值上限值 b. 降低单侧参考值上限值 c. 降低单侧参考值下限值 d. 采用双侧参考值范围 e. 扩大双侧参考值范围 2资料呈偏态分布,95%双侧参考值范围为 。 a. sx96. 1 b. sx64. 1 c. P2.5P97.5 d. P5P95 e. 0P90 医学统计学复习资料 试卷第试卷第 5 页,共页,共 30 页页 2资料呈正态分布,则 95%单侧参考值范围上限为_。 aSX960. 1 bP95 cSX645. 1+ dP5 eP2.5P97.5 2资料呈正态分布,则 95%双侧参考值范围为_。 aSX960. 1 bP95 cSX645. 1+ dP5 eP2.5P97.5 3一种新药可以控制某病,延长寿命,但不能治愈其病,如果某地采用该药则该地 。 a该病发病率将增加 b该病发病率将减少 c该病患病率将增加 d该病患病率将减少 e以上都不对 3关于直接标准化法,下面哪个说法是错误的_。 a可用不同年龄组的人口数为标准组 b可用年龄别死亡率为标准组 c可用不同年龄组的人口构成比为标准组 d可直接得到标准化率 e标化率的大小不代表实际水平 3. 标准化死亡比 SMR 是指_。 a被标化组的实际死亡数与预期死亡数之比 b标准化死亡率 c被标化组的预期死亡数与实际死亡数之比 d标化后待比较两组的预期死亡数之比 e标化后待比较两组的实际死亡数之比 5t 检验的适用条件是 。 a计量资料 b资料服从正态分布 c两总体方差相等 d以上都对 e以上都不对 5对服从对数正态分布的资料,要进行两样本的比较, 。 a可直接用 t 检验 b只能用其他检验方法 c可用 t 检验 d将数据取对数后,再做 t 检验 e用 z 检验 5配对计量资料,差值分布不接近正态分布,最宜用_。 a配对 t 检验 bF 检验 c2检验 d符号秩和检验 et检验 5两组完全随机设计的计量资料,分布正态且方差不齐,最佳的统计方法为 。 a. 成组 t 检验 b. t 检验 c. 2检验 d. 配对 t 检验 e. 秩和检验 5两样本均数比较的 t 检验,差异有统计学意义时,t 值越大,则 。 a. 两样本均数差异越大 b.两总体均数差异越大 c. 越有理由认为两总体均数不同 d.越有理由认为两样本均数不同 e. 不能下结论 5两样本均数比较的 t 检验,差异有统计学意义时,P 值越小,则 。 a. 两样本均数差异越大 b.两总体均数差异越大 c. 越有理由认为两总体均数不同 d.越有理由认为两样本均数不同 e. 以上都不对 5在完全随机设计两样本均数比较 t 检验中,其检验假设 H0是 。 a21xx = b21= c21PP = d21= e以上都不对 5对同一样本,分别取以下检验水准,第二类错误最小的是 。 a. 01. 0= b. 05. 0= c. 10. 0= d. 20. 0= e. 30. 0= 医学统计学复习资料 试卷第试卷第 6 页,共页,共 30 页页 5提高均数比较 t 检验的功效最直接的做法是 。 a. 增加样本含量 b. 减小总体方差 c. 扩大总体均数间的差别 d. 减小第一类错误 e. 增大第一类错误 6随机区组设计资料的方差分析将总变异分为 。 a组间变异、组内变异两部分 b处理、区组、误差三部分 c抽样、系统、随机测量三部分 d标准差、标准误两部分 e以上说法都不对 6方差分析中,当 FF0.05(v),P0.05 时,结果_。 a. 可认为各样本均数都不相等 b. 证明各总体均数不等或不全相等 c. 可认为各总体均数都不相等 d. 可认为各总体均数不等或不全相等 e. 证明各总体均数都不全相等 7二项分布在以下条件时是对称的_。 a. 当总体率0.5 时 b. 当总体率0.5 时 c. 当总体率0.5 时 d. 当总体率接近于 0.1 或 0.9 时 e. 为任意值 8作两样本率的 2检验,当差别有统计意义时,2值越大则_。 a. 两样本率差异越大 b. 两总体率差异越大 c. 越有理由说两总体率不同 d. 越有理由说两样本率不同 e. 不能下结论 8在完全随机设计两样本率的假设检验中,其检验假设 H0是 。 a21xx = b21= c21PP = d21= e以上都不对 8四格表中的一个实际数字为 1,_。 a就不能作 2检验 b就必须用校正 2检验 c还不能决定是否可作 2检验 d作 2检验不必校正 e不能确定是否需要校正 8四个样本百分率比较时,有 1 个理论频数小于 5 大于 1 时 。 a必须先做合理的并组 b直接做 2检验 c不能做 2检验 d必须做校正 2检验 e不能确定是否需要校正 8行列表资料当有 1/5 以上格子的理论数 T 小于 5 时,不能采取的方法是 。 a. 仍然做 2检验 b. 合并行 c. 删除行或列 d. 增加样本含量 e. 合并列 8配对计数资料的相关性分析中,b + c40 时, 应采用 。 a精确概率法 b校正 2检验 c不校正 2检验 d增加 n 后再做检验 e尚不能决定采用何法 8配对计数资料的相关性分析中,b+c40 时,应采用_。 a确切概率法 b四格表 2检验的校正公式 c四格表 2检验的专用公式 d增大样本含量再作检验 e.尚不能决定采用何法 8某医生采用甲乙两种方法测定 60 例恶性肿瘤患者体内 ck20 基因表达阳性的情况,甲法测定 42 例阳性,乙法测定有 23 例阳性,两法测定均阳性者 16 例,两法测定均为阴性的例数是 。 a37 b26 c11 d18 e7 8用触诊和 X 摄片对 100 名妇女作乳癌检查,触诊有 40 名阳性,X 摄片有 70 名阴性,两种方法均阳性者 10 名,两种方法检查均为阴性的人数是 。 a. 20 b. 30 c. 50 d. 40 e. 60 医学统计学复习资料 试卷第试卷第 7 页,共页,共 30 页页 8四格表资料能用确切概率法的是 。 a. T5 b. n40 c. T1 或 n40 d. 1T5 e. 以上都可以 8下表资料,若要比较两组之间治愈率是否相同,可用的方法是 。 组 别 治疗例数 治愈例数 试验组 400 40 对照组 4 1 a. 四格表直接计算概率 d. 四格表 2检验 c. 四格表校正 2检验 d. 无法做检验 e. z 检验 9 完全随机设计的多组计量资料 (数据波动较大) 比较时, 一般首选_。 a配对 t 检验 b成组 t 检验 c方差分析 d配对秩和检验 e多个样本比较的秩和检验 9两样本秩和检验中,n1=10,T1=150,n2=12,T2=103,查 T 界值表得T0.05=84146,则 P 值为_。 aP0.05 bP0.05 cP=0.05 dP0.05 eP0.05 9两样本秩和检验中,n112,T1105,n210,T2148,查 T 界值表得 T0.0584146,则 P 值为_。 aP0.05 bP0.05 cP=0.05 dP0.05 eP0.05 9满足 t 检验条件的资料如果采用秩和检验,不拒绝 H0时 。 a. 增加 I 类错误 b. 减少 I 类错误 c. 减少 II 类错误 d. 增加 II 类错误 e. 两类错误都增加 10若 r0.2,P0.05,则_。 a. 证明两变量无相关 b. 可认为两变量有相关关系 c. 可认为两变量无任何关系 d. 尚不能认为两变量有相关关系 e. 可认为两变量关系不密切 10两组资料中,回归系数 b 大的那组资料_。 a. 相关系数 r 也较大 b. 相关系数 r 较小 c. 两变量相关较密切 d. 相关系数可能大也可能小 e. 有相关关系 10某资料算得 b3.25,做 t 检验得 P0.05,说明两变量是_。 a. 正相关 b. 可能是正相关也可能是负相关 c. 无相关 d. 负相关 e. 还不能判断是否能做相关分析 10用最小二乘法确定直线回归方程的原则是各观察点 。 a. 距直线的纵向距离相等 b. 距直线的纵向距离的平方和最小 c. 距直线的垂直距离相等 d. 距直线的垂直距离的平方和最小 e. 距直线的纵向距离的平方和最大 10以下两变量的关系中,可以用 Pearson 线性相关系数描述的是 。 a. 母亲受教育程度和家庭规模 b. 饮水质量与腹泻与否 c. 疾病的严重程度与治愈与否 d. 吸烟与否与肺癌 e. 从饮食摄入铁与血红蛋白水平 10 以下两变量的关系中, 可以用 Spearman 等级相关系数描述的是 。 a. 母亲受教育程度和家庭规模 b. 饮水质量与腹泻与否 c. 疾病的严重程度与治愈与否 d. 吸烟与否与肺癌 e. 从饮食摄入铁与血红蛋白水平 10下列资料中,可以用 Pearson 相关系数描述相关性的是 。 a. 药物剂量和治疗效果 b. 饮水质量与腹泻发生 c. 汽车拥有量与交通事故发生 d. 吸烟与否与肺癌 e. 农民的平均家庭收入与平均医疗保健费用支出 医学统计学复习资料 试卷第试卷第 8 页,共页,共 30 页页 10据下表资料分析年龄与发病率是否有关,可用的统计方法为 。 年龄组(岁) 0 10 20 30 40 50 60 70 发病率(%) 10.0 8.57 8.18 9.00 8.00 7.14 a. 2检验 b. 秩和检验 c. 直线相关分析 d. 等级相关分析 e. t 检验 10一对变量 x1与 y1算得 r1=0.6395,10.01,1rr,另一对变量 x2与 y2算得r2= -0.7218,220.05,20.01,rrr,则 。 a. x1与 y1的关系更密切 b. x2与 y2的关系更密切 c.两对变量相关的密切程度相同 d.还看不出哪一对变量的关系更密切 e.以上都不对 11. 按调查对象涉及的范围,调查方法分为_。 a. 普查、抽样调查、病例对照调查 b. 全面调查、典型调查、队列调查 c. 非全面调查、抽样调查、案例调查 d. 普查、抽样调查、典型调查 e. 普查、抽样调查、队列调查 11以下对概率抽样描述错误的是_。 a概率抽样保证了所抽取样本的代表性 b实际抽样时可选择一种或几种基本的概率抽样方法 c相比之下,分层抽样的抽样误差较小 d概率抽样需要的样本含量较大 e只有有限总体才能进行概率抽样 11其他条件相同的情况下,抽样误差最大的是 。 a. 单纯随机抽样 b. 分层随机抽样 c. 整群抽样 d. 系统抽样 e. 无法确定 四四、应用应用分析分析题题 5某地检查健康男性工人 225 人的血液红细胞,得均数为 470 万/mm3 ,标准差为 30 万/mm3。(写出公式,代入数据解释,不必计算) (1) 推测该地健康工人的血液红细胞数平均含量。 (2) 现有一男性工人的红细胞数为 420 万/mm3 , 问该男性工人的红细胞数是否正常? 答:(1) n=225,为大样本,可用正态近似法估计总体均数的 95%可信区间 xsx96. 1 = 470 1.9622530 该地健康工人红细胞数平均含量(总体均数)的 95%可信区间为 470 1.9622530万/mm3。 (2) 红细胞数资料服从正态分布,可用正态分布法计算。因红细胞数过多或过少均属异常,应计算双侧 95%参考值范围: sx96. 1= 470 1.96 30 若该男性工人的红细胞数包含该参考值范围内,则属于正常;若不包含在该参考值范围内,可认为其红细胞数偏高或偏低。 5随机抽取某地 400 名 3 岁女童,测量并算得其平均头围为 48.5cm,标准差为 2.1cm。 问:问:(1) 推测该地 3 岁女童的平均头围。 (2) 现有一名 3 岁女童的头围为 44.9cm,是否正常? (写出公式,代入数据并解释,不必计算) 答:(1) n=400,为大样本资料,可用正态近似法估计总体均数的 95%可信区间:4001 . 296. 15 .4896. 1=xsx 该地 3 岁女童平均头围的 95%可信区间为4001 . 296. 15 .48(cm) (2) 因头围服从正态分布, 且过大或过小均属异常, 应计算双侧 95%参考值范围:1 . 296. 15 .4896. 1=sx 若该名 3 岁女童的头围包含在该参考值范围内,可认为正常(1 分) ;若未包含在该参考值范围内,可认为其头围偏大或偏小(1 分) 。 医学统计学复习资料 试卷第试卷第 9 页,共页,共 30 页页 5测定某地 400 名正常男性新生儿的血清胆固醇含量,均数为 72.5 毫克/100ML,标准差 22.0 毫克/100ML。 (1) 现一男性新生儿的血清胆固醇含量为60.2毫克/100ML, 请给予评价。(写出公式,代入数据,不必计算结果) (2) 测得该地 360 名女性正常新生儿的血清胆固醇含量均数为 90.2 毫克/100ML,标准差 25.0 毫克/100ML。问该地男女新生儿的血清胆固醇含量是否不同? 答:(1) 血清胆固醇含量资料服从正态分布,可用正态分布法计算。因红细胞数过多或过少均属异常,应计算双侧 95%参考值范围: sx96. 1= 72.5 1.96 22 该地 95%的男性工人红细胞数范围为 470 1.96 30 万/mm3。 若该男性新生儿的血清胆固醇含量包含该参考值范围内,则属于正常;若不包含在该参考值范围内,可认为其红细胞数偏高或偏低。 (2) 该资料为成组设计的计量资料,宜采用成组 t 检验。 1) 建立检验假设,确定检验水准 H0:该地男女新生儿的血清胆固醇含量相同 H1:该地男女新生儿的血清胆固醇含量不同 0.05 2) 计算检验统计量 t 值(略) 3) 确定 P 值,做出统计推断 若 P0.05,不拒绝 H0,差异无统计学意义,尚不能认为该地男女新生儿的血清胆固醇含量不同。 若 P0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为该地男女新生儿的血清胆固醇含量不同。 5 某医师用流脑提纯菌苗免疫 10 名儿童, 免疫前后抗体滴度的倒数见表: 编 号 1 2 3 4 5 6 7 8 9 10 接种前 2 1 4 4 8 8 2 32 16 4 接种后 4 32 64 128 128 256 32 64 128 64 该医师采用两独立样本 t 检验,因方差不齐(F=12.981,P=0.002) ,改用校正 t 检验,得 t=3.515,P=0.006,故认为接种前后抗体滴度不同,接种后滴度升高。该医师的统计方法是否正确?为什么? 答:该医师统计方法错误。 首先,该资料为自身对照的配对资料,用两独立样本 t 检验处理不妥;其次,抗体滴度的倒数为呈倍数增长的资料,通常为对数正态分布,不能直接用 t 检验。 正确做法:先取对数后再进行配对 t 检验。 5某医师就下表资料,对比用胎盘浸液钩端螺旋体菌苗对 238 名农民接种前、后(接种后两月)血清抗体的变化,结果如下: 抗体滴度的倒数 0 20 40 80 160 320 640 1280 S 免疫前人数 211 27 19 24 25 19 3 0 76.1 111.7 免疫后人数 2 16 57 76 75 54 25 23 411.9 470.5 该医师用成组 t 检验,t77,P0.01,可认为接种后血清抗体有增长。请从统计学的角度进行评价。 答:该医师统计方法错误。 首先,该资料为自身对照的配对资料,用两独立样本 t 检验处理不妥,其次,抗体滴度的倒数为呈倍数增长的资料,通常为对数正态分布,不能直接用 t 检验。 正确做法:先取对数后再进行配对 t 检验。 医学统计学复习资料 试卷第试卷第 10 页,共页,共 30 页页 5某年某地区疾病预防控制中心评价该地区学龄前儿童白喉的抗体效价,随机抽取了 32 名幼儿园儿童,测定结果如表。经完全随机设计两样本均数比较的 t 检验,t =1.364,P0.05,差异无统计学意义。 某年某县 32 名学龄前儿童白喉的抗体效价测定结果 组别 白喉抗体效价(倒数) 男生 320 20 320 640 80 320 160 40 320 80 160 40 80 320 20 40 女生 20 20 160 40 40 160 40 20 160 40 160 40 40 40 640 80 问:(1) 该研究属于何种设计方案? (2) 统计方法是否正确?为什么? 5答:(1) 完全随机设计。 (2) 不正确。由于抗体效价值是等比资料,服从对数正态分布,各组的平均效价应用几何均数(G)描述,其假设检验不能直接用完全随机设计两样本均数比较的 t 检验。 (3) 正确做法:应将观察值进行对数变换后再用 t 检验。 5将 18 名某病患者随机分成两组,分别用甲、乙两药治疗,测定治疗前后血色素(%)的变化,测定结果如下表。 甲、乙两药治疗某病患者前后的血色素(%) 甲药 病人号 1 2 3 4 5 6 7 8 9 治疗前 36 45 55 55 65 60 42 45 25 治疗后 45 65 66 85 70 55 70 45 50 乙药 病人号 1 2 3 4 5 6 7 8 9 治疗前 55 50 65 60 70 40 45 35 30 治疗后 80 80 70 60 85 75 60 50 60 问:(1) 该研究包括哪些设计方案? (2) 要比较甲、乙两药的疗效有无差别,应如何统计分析? (3) 简述主要检验步骤(包括判断结果等,不必计算) 。 答:(1) 该研究的设计方案包括配对设计和完全随机设计。 (2) 要比较甲、乙两药的疗效有无差别,应分别计算出两组药物治疗前后的差值(分别反映两种药物的效应) ,形成两个新的样本(属完全随机设计) ,再进行完全随机设计两样本均数比较的 t 检验。 (3) 检验步骤 1) 建立检验假设,确定检验水准 H0:甲、乙两药的疗效相同 H1:甲、乙两药的疗效不同 = 0.05 2) 计算检验统计量 t 值(略) 3) 确定 P 值,做出统计推断 如果 P0.05,不拒绝 H0,差异无统计学意义,尚不能认为甲、乙两药的疗效不同。 如果 P0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为甲、乙两药的疗效不同。 医学统计学复习资料 试卷第试卷第 11 页,共页,共 30 页页 5某研究者利用儿童的心理行为发育量表(SDQ)对学龄前后(间隔一年)不同性别的 108 名儿童的行为进行测定,得出情绪、行为、注意力和社会关系四个维度的评分,结果如表。该医师分别对男女生学龄前后结果进行完全随机设计两样本均数比较的 t 检验,除女性情绪和品行维度无差别外,其他维度评分的差异均有统计学意义(P0.05) ;男女生学龄后结果进行完全随机设计两样本均数比较的 t 检验,差异均无统计学意义(P0.05) 。由此得出结论为上学事件对儿童的行为有影响,而且儿童的行为变化与性别无关。 不同性别儿童学龄前后行为维度评分情况(sx ) 性 别 时间 情绪 品行 注意力 潜在社会关系 男性(n=60) 治疗前 2.21.5 1.91.6 4.71.5 7.11.9 治疗后 1.51.5 1.31.2 3.71.6 6.51.8 女性(n=48) 治疗前 1.91.6 1.51.4 4.61.6 7.61.7 治疗后 1.81.5 1.51.5 4.11.6 6.01.8 问:(1) 该研究包括哪些设计方案? (2) 该医师的统计处理是否正确?为什么? 答:(1) 配对设计和完全随机设计。 (2) 不正确。 首先,男童和女童学龄前后比较属配对设计,应行配对 t 检验分别说明上学事件对儿童的行为是否有影响,而作者误用了完全随机设计两样均数比较的 t 检验。 其次,要比较上学事件对不同性别儿童的行为影响时,应分别计算出两组学龄前后各行为维度的差值,形成两个新的样本(属完全随机设计) ,再进行完全随机设计两样本均数比较的 t 检验。而作者误将两组治疗后结果直接进行了两独立样本 t 检验。 5. 两地分别测定井水中硝酸盐含量(mg/L) ,结果如下。试问两地井水中硝酸盐含量水平有无不同, 可采用什么统计方法?计算参见 SPSS 结果。 甲地:2.90,5.41,5.48,4.60,4.03,5.10,5.92,4.97,4.24,4.36,2.72,2.37, 2.09, 7.10 乙地:5.18,8.79,3.14,6.46,4.01,5.60,4.57,7.71,4.99 Group Statistics 地区 N Mean Std. Deviation Std. Error Mean 硝酸盐含量 甲地 14 4.3779 1.44989 .38750 乙地 9 5.6056 1.78734 .59578 Independent Samples Test Levenes Test for Equality of Variances t-test for Equality of Means 硝酸盐含量 95% Confidence Interval of the Difference F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference Lower Upper Equal variances assumed .341 .566 -1.811 21 .085 -1.22770 .67801 -2.63770 .18230 Equal variances not assumed -1.727 14.593 .105 -1.22770 .71071 -2.74623 .29083 答:该资料为完全随机设计的计量资料,服从正态分布,宜用成组 t 检验。 (1) 建立检验假设,确定检验水准 H0:两地井水中硝酸盐含量水平相同 H1:两地井水中硝酸盐含量水平不同 =0.05 (2) 计算检验统计量 t 值 1) 描述统计量:n1 = 14,1x= 4.3779,S 1 = 1.44989 n2 = 9,2x= 5.6056,S 2 = 1.78734 2) Levenes 方差齐性检验: F = 0.341, P = 0.566, 可认为两总体方差齐,应选用 t 检验结果。 t 检验:t = -1.811, = 21。 (3) 确定 P 值,做出统计推断 P=0.0850.05,不拒绝 H0,差异无统计学意义,尚不能认为两地井水中硝酸盐含量水平不同。 医学统计学复习资料 试卷第试卷第 12 页,共页,共 30 页页 5某医生随机抽取正常人和脑病患者各 11 例,测定尿中类固醇排出量(mg/dl) 结果见表。 问脑病患者与正常人的尿中类固醇排出量是否相同? 正常人和脑病患者尿中类固醇排出量(mg/dl)测定结果 分 组 尿中类固醇排出量(mg/dl) 正 常 人 2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.78 脑病患者 5.28 8.79 3.84 6.46 3.79 6.64 5.89 4.57 7.71 6.02 4.06 Group Statistics 组别 N Mean Std. Deviation Std. Error Mean 尿中类固醇排出量 正常人 11 4.2664 .98515 .29703 脑病患者 11 5.7318 1.62565 .49015 Independent Samples Tes