卫生统计学学习指导与习题集(64页).docx
《卫生统计学学习指导与习题集(64页).docx》由会员分享,可在线阅读,更多相关《卫生统计学学习指导与习题集(64页).docx(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-第 1 页卫生统计学学习指导与习题集-第 2 页卫生统计学学习指导与习题集第一章绪论【教学要求】了解:了解:医学统计学的发展史;统计学与公共卫生的关系。熟悉:熟悉:统计学习的目标与方法掌握:掌握:统计学基本概念:总体与样本、同质与变异、变量的类型、参数与统计量。【重点难点】第一节 医学中统计思维的进化第二节 统计学与公共卫生互动推动一、统计学是公共卫生专业人员的得力工具公共卫生是群体科学,应用统计探索群体规律。统计抽样技术;设计群体调查,掌握人群的卫生状况和需求;统计描述:反映疾病和卫生资源的分布特征;统计推断:偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。二、现代公共卫生领域对统
2、计学的挑战公共卫生不仅应用统计学,而且不断提出新要求和新问题,是现代统计学研究和发展的巨大功力。第三节 统计学的若干概念一、总体与样本总体是根据研究目的确定的同质研究对象的全体,按研究对象来源又有目标总体和研究总体。样本是指从研究总体中抽取的一部分有代表性的个体。抽样研究的目的是用样本推断总体。二、同质与变异同质是指同一总体中个体的性质、影响条件或背景相同或非常相近。变异是指同质的个体之间存在的差异。统计学的任务是在变异的背景上描述同一总体的同质性,揭示不同总体的异质性。三、变量的类型定量变量可分为离散型变量和连续型变量。变量类型可以转化:定量有序分类二值。注意转化方向只能由信息量多向信息量少
3、。四、参数与统计量参数是指反映总体特征的统计指标。五、设计与分析统计设计是医药卫生设计科研不可或缺的部分。统计设计包括抽样方法、统计学原则、统计方法数据如何收集、样本量多大等统计学内容。设计决定了统计分析的方法。统计设计和统计分析是不可分割的两项内容。六、因果与联系探究因果关系首先考虑是否存在联系。但存在联系未必有因果联系,因为存在大量的混杂因素。单靠统计学分析大多只能考虑变量之间的联系,难于证明因果联系。分类变量定性变量定量变量变量有序变量-第 3 页第四节 目标与方法一、基本概念方法与技能正确理解基本概念、掌握常用的设计和经典的分析方法、学会用统计软件完成有关计算。二、教与学的方法应用是根
4、本目的,理解概念与动手实践才是根本。要结合生活经验、医学实际来教与学。借助统计学实验理解统计现象与理论,借助案例讨论从反面吸取教训。【补充习题】一、选择题(一)A1 题每一道题下面有 A、B、C、D、E 五个被选答案,请从中选择一个最佳答案。1.下面的变量中,属于分类变量的是(B)A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于定量变量的是(B)A.性别B.体重C.血型D.职业E.民族3.某人记录了 50 名病人体重的测定结果:小于 50kg 的 13 人,介于 50kg 和 70kg 间的20 人,大于 70kg 的 17 人,此种资料属于(A)A.定量资料B.分类资料
5、C.有序资料D.二分类资料E.名义变量资料4.上述资料可以转换为(C)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料5.若要通过样本作统计推断,样本应是(C)A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量(E)A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标7.因果关系(C)A.就是变量间数量上的联系B.可以用统计方法证明C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出E.可以
6、通过变量间数量上的联系来证明(二)A2 型每一道题以一个小案例出现,其下面都有 A、B、C、D、E 五个备选答案,请从中选择一个最佳答案。1.教材中提及美国人 1954 年实施了旨在评价 Salk 疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。有 180 万儿童参与,约有 1/4 参与者得到了随机化。这 180 万儿童是(C)A.目标总体B.研究总体C.1 份样本D.1 份随机样本E.180 万份样本-第 4 页2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对(C)而言。A.180 万儿童B.每个儿童C.所有使用索菲克疫苗的儿童D.所 有儿童E.180 万儿童中随机化的 1/4二、是
7、非题1.定量变量、分类变量和有序变量可以相互转换。()2.假变量可以参与计算,所以假变量是定量变量。()3.离散变量在数值很大时。单位为“千”或“万”时可以取小数值,此时可接近地视为连续型变量()4.同质的个体间不存在差异。()5.如果个体间有变异,则它们一定不是来自同一总体。()第二章定量资料的统计描述【重点难点】第一节第一节频率分布表与频率分布图频率分布表与频率分布图一、离散型定量变量的频率分布对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直方图表达,以各等宽矩形直条的高度表示各频率的多少。二、连续型定量变量的频率分布对
8、连续型定量变量,变量值的取值是连续的,将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变量的频率分布图可用直方图表达。即纵坐标为频率密度,即频率/组距,直方图的面积之和等于 1.三、频率分布表(图)的用途频率分布表(图)可以揭示资料的分布类型,如对称分布或偏峰分布;也可以描述资料的分布特征,即集中趋势和离散趋势;便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。第二节第二节描述集中趋势的统计指标描述集中趋势的统计指标对于连续型定量变量,平均数是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数有 3 种:算数均数
9、、几何均数和中位数。一、算术均数意义:意义:算术均数简称均数,常用表示总体均数,X?表示样本均数。反映全部数量观察值的平均数量水平。适用条件:适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。计算:计算:1.直接法(基于原始数据)X?=X1+X2+Xnn=X?n其中,n 为样本含量,X1+X2+Xn为观察值。2.频率表法(也叫加权法,基于频率表资料)X?=fx0?f?=fx0?n其中,f为组段的频数,x0为组段的中值,x0=(组段上限+组段下限)/2。-第 5 页二、几何均数意义:意义:几何均数以符号 G 表示,常用来反映一组含多个数量级数据的集中位置。适用条件适用条件:适用于原始观察
10、值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。观察值间常呈倍数关系,或变化范围跨越多个数量级。计算:计算:1.直接法(基于原始数据)G=nX1X2Xn或G=log1logX?n2.频率表法(也称加权法,基于频率表资料)G=log1flogX?n三、中位数意义意义:中位数常用符号M表示,是指将原始观察值从小到大排序后,位次居中的那个数,即理论上有一半的观察值低于中位数,一般都观察值高于中位数。适用条件适用条件:中位数适用于各种分布的资料,特别是偏峰分布资料、分布末端无确定值的资料等。计算:计算:1.直接法(基于原始数据)将 n 例观察值从小到大排列,第 i 个数据用XI表示。
11、n 为奇数时,M=Xn+12n 为偶数时,M=12(Xn2+Xn2+1)2.百分位数法(基于频率表资料)百分位数常用符号Px表示,是排序后的全部实测值的某百等份分割值,即在全部实测值中有 x%个体观察值比它小,有 1-x%个体观察值比它大。中位数就是一个特定的百分位数,即 M=P50。Px=L+iFL+iFL(n*x%-FL)其中 L 为欲求的百分位数所在组段的下限,i 为该组段的组距,FL为截止至 L 的累计频数,FL+i FL为该组段内的频数,n 为总频数。四、众数意义:意义:全部实测值中出现次数最多的数值即为众数。第三节第三节描述离散趋势的统计指标描述离散趋势的统计指标同一总体中不同个体
12、存在的差异称为变异。为比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括极差、四分位数间距、方差、标准差和变异系数。一、极差意义意义:极差,也称全距。样本量接近的同类资料比较,极差越大意味着数据间变异越大。极差只考虑数据的最大值和最小值,所以用极差反映数据的变异程度常常比较粗略和不稳定。计算:计算:R=最大值最小值适用条件:适用条件:资料不限。二、四分位数间距-第 6 页意义意义:四分位数间距表示百分位数P75和百分位数P25之差,理论上P25与P75之间恰好包括总体中间 50%的个体观察值。同类资料比较,Q 越大意味着数据间变
13、异越大。用四分位数间距反映数据的变异程度比极差稳定。计算:计算:Q=P75P25其中,P75和P25的求法参见前述百分位数求法。适用条件适用条件:四分位数间距可用于各种分布资料,特别对偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。三、方差意义:意义:方差考虑了全部观察值的变异程度。总体方差用2表示,定义为观察值离均差平方和的算术均数;样本方差用S2表示,是总体方差的无偏估计。同类资料比较时,方差越大意味着数据间变异度越大。计算:计算:总体方差2=(X)2?N样本方差S2=(XX?)2?n1适用条件:适用条件:见标准差。四、标准差意义意义:方差的算术平方根称为标准差
14、。总体标准差用表示,样本标准差用 S 表示。标准差的量纲与原变量一致,故实际应用中常使用标准差。同类资料比较时,标准差越大意味着观察值间变异度越大。计算:计算:总体标准差=(X)2?N样本标准差 S=(XX?)2?n1其中,n-1 称为自由度。适用条件适用条件:方差和标准差都适用于对称分布的资料,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述的集中趋势和离散趋势。五、变异系数意义:意义:变异系数用 CV 表示,为标准差与算术均数之比,是一个不带量纲的相对数。计算:计算:CV=SX?100%适用条件适用条件:方差和标准差都适用于对称分布的资料,特别对正态分布或近似正态分布资
15、料,常把均数和标准差结合起来,全面描述资料的集中趋势和离散趋势。第四节描述分布形态的统计指标一、偏度系数意义意义:理论上总体偏度系数为 0 时,分布是对称的;取正值时,分布为正偏峰;取负值时分布为负偏峰。计算:计算:SKEW=n(n1)(n2)(XX?S)3?二、峰度系数意义意义:理论上正态分布的总体峰度系数为 0;取负值时,其分布较正态分布的峰平阔取正值时,其分布较正态分布的峰尖峭。计算:计算:KURT=n(n+1)(n1)(n2)(n3)(XX?S)4?3(n1)2(n2)(n3)-第 7 页【补充练习题】选择题(一)A1 型每一道题下面有 A、B、C、D、E 五个备选答案,请从中选择一个
16、最佳答案。1.用频率表计算平均数时各组的组中值应为(E)A本组段变量值的平均数B.本组段变量值的中位数C.本组段的上限值D.本组段的下限值E.(本组段上限值+本组段下限值)/22.离散型定量变量的频率分布图可以用(B)表达。A.直方图B.B.直条图直条图C.百分条图 D.箱式图E.复式条图3.变异系数越大说明(E)。A.标准差越大B.平均数越大C.标准差、平均数都大D.平均数小E.E.以均数为准变异程度大以均数为准变异程度大4.均数和标准差的关系是(D)A.均数越大,标准差越小B.均数越大,标准差越大C.标准差越大,均数对各变量值的代表性越好D.D.标准差越小,均数对各变量值的代表性越好标准差
17、越小,均数对各变量值的代表性越好E.均数和标准差都可以描述资料的离散趋势5.把P25,P50,P75标在一个数轴上,则(E)A.P50一定在P25和P75的中间B.P50一定不在P25和P75的中间C.P50一定靠近P25一些D.P50一定靠近P75一些E.以上都不是(二)A2 型每一道题以一个小案例出现,其下面有 A、B、C、D、E 五个备选答案,请从中选择一个最佳答案。1.已知某疾病患者 10 人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,20,其潜伏期的平均为(B)天。A.9B.9.5C.10D.10.2E.112.已知某地一群 7 岁男童身高均数为 100cm,标
18、准差为 5cm;体重均数为 20kg,标准差为 3kg,则身高和体重的变异程度有(C)A.身高的变异程度大于体重的变异程度B.身高的变异程度等于体重的变异程度C.身高的变异程度小于体重的变异程度D.身高的变异程度与体重的变异程度之比为 5:3E.因单位不同,无法比较3.测定 10 名正常人的脉搏(次/分),结果为 68,79,75,74,80,79,71,75,73,84.则 10名正常人的脉搏标准差为(B)A.4.73B.22.4C.75.8D.75.0E.1.504.测定 5 人的血清滴度为 1:2,1:4,1:16,1:32,则 5 人血清滴度的平均水平为(D)A.1:4B.1:8C.1
19、:11.6D.1:6.96E.1:165.测得 200 名正常成年男子的血清胆固醇值(mmol/L),为进行统计描述,下列说法不正确的是(E)A.可用频率表法计算均数B.可用直接法计算均数-第 8 页C.可用直接法计算标准差D.可用加权法计算标准差E.可用直条图表示频率分布图(三)A3/A4 型以下提供若干案例,每个案例下设若干道题目。请根据题目所提供的信息,在每一道题下面的 A、B、C、D、E 五个备选答案中选择一个最佳答案。(第 12 题共用题干)调查测定某地 107 名正常人尿铅含量(mg/L)如下:尿铅含量 0 4 81216.202428 合计例数14222918156121071描
20、述该资料的集中趋势,宜用(B)。A均数B中位数C几何均数D众数E极差2描述该资料的离散趋势,宜用(C)。A极差B方差C四分位数间距D标准差E变异系数(四)B1 型以下提供若干组题目,每一组题目前列出 A、B、C、D、E 五个备选答案,请从中为每一道题目选择一个最佳答案。某个备选答案可被选择一次、多次或不被选择。(14 题共用备选答案)A.极差B四分位数间距C标准差D变异系数E中位数1比较 7 岁男童与 17 岁青年身高的变异程度,宜用(D)。2描述近似正态分布资料个体观察值的离散趋势,宜用(C)。3描述偏峰分布资料个体观察值的变异程度,宜用(B)。4描述分布末端无确定值资料的离散程度,宜用(B
21、)。(58 题共用备选答案)A中位数B均数C几何均数D极差E众数5反映一组等比资料集中趋势的指标,宜用(C)。6反映一组偏峰分布资料的平均水平,宜用(A)。7样本中出现次数最多的观察值称为(E)。8描述近似正态分布资料的集中位置,宜用(B)。第三章定性资料的统计描述【教学要求】掌握:掌握:常用相对数指标,相对数应用的注意事项;动态数列及其指标;标准化法的基本思想,直接法的计算及间接法中 SMR 的意义,标准化法的注意事项。熟悉:熟悉:医学人口统计和疾病统计中常用指标的意义。【重点难点】第一节三类相对数一、频率与频率分布定性资料经过分类汇总整理的频数表称为频率分布表。定性资料的变量形式有多分类变
22、量和二分类变量,均可以通过频率分布表描述其分布特征。定性资料的分布特征通常可以描述为某一类别的频数在总频数中所占比重。根据研究目的不同定性资料频率分布表的表达形式可以不同,例如可以将某一事物的所有类别的频率列在同一张表中;也可以将某事物的其中一个类别的频率与其他事物相同类别的频率列在同一张表中。-第 9 页二、常用的相对数指标常用相对数有三种,计算公式不同,其意义也不同。表 3-1 列出常用三种相对数的公式和意义。三、应用相对数应注意的事项1理解相对数的含义不可望文生义三种相对数的定义有明确的区别,但在实际应用中,常错误解释相对数的计算结果,尤其,频率型指标和强度型指标常被混淆。对于相对数的统
23、计指标,读者必须认真思考其定义,辨别其性质,切不可望文生义。表 3-1常用相对数的公式和意义相对数指标公式意义频率发生某现象的观察单位数可能发生某现象的观察单位总数 k指某现象发生的频率,或事物内部某个组成部分所占的比重或分布强度某事件发生的观察单位数(可能发生某事件的观察单位数时间)?K指单位时间内某现象发生的频率相对比AB 100%两个有关联的指标 A 与 B 之比2频率型指标的解释要紧扣总体与属性本实习指导的配套教材的第三章中的表 1 至表 3 的数据均属于频率型指标,但由于表达的总体和属性不同,结果的解释亦不同。3计算相对数时分母应有足够数量确保研究结果的稳定性。4正确地合并估计频率(
24、或强度)型指标分别合计各组的分子和分母后再计算合计的指标,不可将分组的频率或强度取平均数作为合并的频率或速率。5相对数间的比较要具备可比性主要应注意观察的对象是否同质,研究的方法(如检测手段、抽样方法)是否相同,观察的时间是否一致等;在被比较的总体之间与研究指标有关的其他因素是否一致或接近。6对相对数的统计推断从样本估计值推断总体的相对数也应当考虑抽样误差,需要进行参数估计和假设检验。第二节医学人口统计常用指标一、医学人口统计资料的来源医学人口统计资料的主要来源为日常工作记录(报告单、卡、册)、统计报表和人口调查三个方面,见表 3-2。表 3-2 医学人口统计资料的来源资料来源意义和内容日常工
25、作记录指人口事件发生后有关部门按常规报告制度所做的原始记录,从公安部门、卫生部门、计划生育部门和疾病控制中心均可得到。特别是对出生,死亡、胎儿死亡等生命事件的法定登记,是研究人口自然变动、推算人口数以及反映人口健康水平的基础资料统计报表是从原始报告单、卡、册上的数据过录整理后的一种汇总表,也可以作为较好的原始记录用于医学人口统计关系较为密切的统计报表有出生统计报表、死因统计报表、妇幼卫生统计报表人口调查根据统计需要和目的,做一些定期或不定期的专项调查。调查的方法通常-第 10 页有普查和抽样调查。其中,人口普查为计算许多人口学指标提供了最基本的人口数资料。抽样调查是对人口问题进行广泛深入的研究
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 学习 指导 习题集 64
限制150内