《卫生统计学复习资料附答案(13页).docx》由会员分享,可在线阅读,更多相关《卫生统计学复习资料附答案(13页).docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-一二三 卫生统计学复习资料附答案-第 12 页四 名词解释1. 样本(sample):是从总体中随机抽取的部分有代表性的观察单位变量值的集合。2. 定量资料:又称计量资料(measurement data),使用定量的方法测定观察单位某项指标数值的大小所得的资料称定量资料。3. 参数:总体的统计指标。4. 型错误:拒绝了实际上是成立的H。5. 抽样误差:由于随机抽样所引起的样本统计量与总体参数之间差异以及各样本统计量之间的差异。6. 标准化法:就是在一个指定的标准构成条件下进行率的对比的方法。7. 相对数(relative number):是两个有联系的指标之比。8. 变异(variatio
2、n):由于生物个体的各种指标所受影响因素是极其复杂的,同质的个体间各种指标存在差异,这种差异称为变异。9. 中位数(median,M):将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数。10. 实验研究:是使设计的实验因素或处理因素在其他干扰因素被严格控制的条件下,观察其他实验结果或实验效应的作用及影响。11. 率:某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某。现象发生的频率或强度。12. 定性资料(qualitative variable):将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。13. 实验设计:是指研究人员对实验
3、因素做合理的,有效的安排,最大限度的减少实验误差,使实验研究达到高效,快速和经济的目的。14. 构成比(proportion):说明某一事物内部各组成部分所占比重或分布。15. 直线相关(linear correlation):当两事物或现象在数量上的协同变化呈直线趋势时则称为直线相关。16. 率的标准化:两组或多组率之间比较,当各组内部的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等明显不同时,则不能直接比较两组或多组的总率,得出结论。17. 直线回归:在描述两变量间的关系式,若散点图呈直线趋势或有直线相关关系,可进行直线相关回归分析。18. 总体(population):是根据所研究目
4、的所确定的同质观察单位某项变量值的集合。19. 盲法设计(blinding):是指使研究人员或病人不知道具体的研究设计方案。20. 同质:是指观察单位间被研究指标的主要影响因素相同或基本相同。21. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围。常用的可信度为95%和99%及其可信区间。22. 假设检验(hypothesis test):是统计学的主要内容,是通过统计检验方法(如t检验、u检验、F检验、检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。23. 随机化原则(randomization):是指总体中的每一个个体都有均等的机会被抽取或被分
5、配到实验组或对照组中去。24. 动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用来说明事物在时间上的变化和发展趋势。25. 随机测量误差(random measurement error):在消除了系统误差的前提下,由于非人为的偶然因素,对同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫做随机测量误差。26. 算数均数(arithmetic mean):描述一组数据在数量上的平均水平。27. 极差(range R):即最大值与最小值之差,用于资料的粗略分析。28. 方差(variance):表示一组数据的
6、离散情况,由离均差的平方和除以样本个数得到。29. 标准差(standard deviation):是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料。30. 变异系数(coefficient of variation, CV):用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。31. 正态分布(normal distribution):若资料x的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常记为N(,)表示均数为,标准差为的正态分布。32. 标准正态分布:均数为0、标准差为1的正态分布。33. 统计推断(statistical inference):通
7、过样本指标来说明总体特征,这种通过样本获取总体信息的过程称为统计推断。34. 抽样误差(sampling error):由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异。35. 标准误:通常将样本统计量的标准差称为标准误。36. 可信区间(confidence interval, CI):按预先给定的概率确定的包含未知总体参数的可能范围。37. 参数估计(estimation of parameter):指用样本统计量估计总体参数,分为点估计和区间估计两种。38. 假设检验中P的含义:指从H。规定的总体随机抽的等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。39. 检验效
8、能:1-称为检验效能,是指当量总体确有差别,按规定的检验水准所能发现该差异的能力。40. 检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准,记为。41. 方差分析(analysis of variance, ANOVA):就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布做出统计推断,判断各因素对观测指标有无影响。42. 随机区组设计(randomize
9、d block design):实现将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机的分配到各处理组,这种设计叫做随机区组设计。43. 非参数统计(noparametric test):针对某资料的总体分布难以用某种函数式来表示,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法。44. 相关系数:又称积差相关系数,以符号表示样本相关系数,表示总体相关系数。是指具
10、有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。45. 人口总数:是指一个国家或地区在某特定时间点上存活人口的总和。46. 新生儿死亡率(neonatal mortality rate,NMR):指某地平均每千名活产数中未满28天地新生儿死亡数。47. 围产儿死亡率:胎儿体重达到1000克以上或孕期满28周至出生后7天以内的时期,在此期间的死亡。48. 婴儿死亡率:指某年平均每千名活产中不满一周岁婴儿的死亡率。49. 死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各种死亡原因导致死亡的严重程度。50. 生存分析(survival analysis):指将终
11、点事件的出现与否和到达终点所经历的时间结合起来分析的一类统计分析方法。51. 删失数据(censored data):在规定观察期内对某些观察对象由于某种原因未能观察到终点事件发生,并不知道确切的生存时间,称为生存时间的删失数据。其原意为:研究结束时重点事件尚未发生失访病人死于其他原因等终止观察。52. 寿命表(life table):通过计算一系列指标来反映各个年龄死亡水平和期望寿命的指标之一,寿命表分为定群寿命表和现实寿命表。53. 可接受性因素:指被调查者对调查表的接受程度。54. 死因构成比(proportion of dying of a specific cause),也称比例死亡
12、比(proportionate mortality rate, PMR):指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的重要性。55. 疾病统计(morbidity statistics):是居民健康统计的重要内容之一,它从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律。为病因学研究、防治疾病和评价防治工作效果提供科学依据。简答1. 频率分布表的用途:描述变量的分布类型揭示变量的分布特征便于发现某些离群值或极端值便于进一步计算统计指标和统计分析2. 定量变量的使用条件:算术平均数适用于对称分布,特别适用于服从于正态分布的变量几何均数适用于可经对数转换为对称分布的变量中位
13、数适用于各种分布的变量,常用于描述偏峰分布,或分布的一端或两端无确定数值的资料。3. 常用的描述定量变量变异程度的统计指标:极差,只利用最大值和最小值的信息,易受样本含量的影响,不稳定四分位数间距,适用于各种分布的变量方差和标准差,适用于对称分布,特别是服从正态分布的变量变异系数,常用于量纲不同或均数相差较大时变量间变异程度的比较。常将算数均数和标准差结合描述服从正态分布的变量常将中位数与上、下四分位数结合描述偏锋分布的变量4. 应用相对数时的注意事项:理解相对数的含义不可望文生义频率性指标的解释要紧扣总体和属性计算相对数时分母应有足够数量正确计算合计频率注意资料的可比性样本相对数的统计推断5
14、. 应用标准化法的注意事项:标准化法的应用范围很广标准化后的标准率标准化法的实质是找一个“标准”,使两组得以在一个共同的“平台”上进行比较两样本标准化率是样本值,存在抽样误差。6简述标准差S和均数的标准误S之间的区别与联系:标准差标准误区别意义:描述一组变量的离散程度并可以作为总体标准差的点估计描述样本均数的离散程度,并且是样本均数的标准差估计值应用:1.标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好2.xZS估计变量值的分布1-范围1标准误越小,说明样本均数和总体均数的平均差异越小,用样本均数估计总体均数的可靠性越大2.用xtS估计总体均数的1-范围与n的关系:n越大,样本标准差
15、S靠近总体标准差的可能性越大,即样本标准差越稳定n越大,标准误越小联系1.都是描述变异度的统计指标2.=n,与成正比,与n成反比3.n一定时,同一组资料,标准差越大,标准误也越大7.置信区间有哪两个要素,在使用时应注意什么:两要素分别为:可信度和精确性在同一样本的情况下,可信度1-越大,置信区间越宽,说明用此区间估计总体均数的可信度越高;精确性反应为置信区间的宽度,表示区间估计的精度,区间越窄,精度越高。8.简述直线回归与直线相关的区别:资料要求:相关,要求X、Y服从双变量正态分布,这种资料在进行回归分析时称为型回归资料;回归,要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变
16、量,称为型回归。应用:说明两变量间相互关系用相关分析,此时两变量的相互关系是平等的;而说明Y的总体均数与X间线性变化的数量关系用回归分析,用以说明Y如何依赖于X而变化。意义:r说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致Y的平均变化量。计算:r与b可以相互换算。取值范围:1r1,b。单位:r没有单位,b有单位。9.简述正态分布、二项分布、poisson分布三者间的区别与联系:二项分布、poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。Poisson分布可以视为n很大而p很小的二项分布
17、。当n很大而n或n(1-)都不是很小的时候。二项分布渐近正态分布,当20的时候poisson分布渐近正态分布。10.统计表与统计图的用途:描述变量分布类型解释变量分布特征便于发现某些离群值或极端值便于进一步计算统计指标和统计分析11.二项分布的使用条件:各次试验相互独立结果为二分类且恒定发生与不发生的概率为常数12.正态分布的分布特征:关于x=u对称.在x=u处取得最大值,且在xu处有拐点.曲线下面积为1.u决定曲线在横轴上的位置,u增大,曲线沿横轴右移;反之左移Q决定曲线的形状,当u。恒定时,q越大,分布越分散,曲线越矮胖,q越小,分布越集中,曲线越瘦高。13.参数检验与非参数检验的优缺点:
18、优点:计算简单便于掌握应用范围广收集资料方便缺点:适用于参数检验的资料用秩和检验,检验效能降低犯第类错误的概率增加14.非参数检验适用的资料类型:分布类型未知分布呈极度偏态方差明显不齐等级资料有极端值资料开口资料15.制表的基本要求:编制频率表是为了揭示数据的分布特征,故分组不易过粗也不易过细,十组左右。为计算方便组段下线一般取较整齐的数值第一组段应包含最小值,最后一个组段应包含最大值16.假设检验的基本步骤:建立检验假设,确定检验水准计算检验统计量确定P值,做出统计推断17.方差分析的基本步骤:完全随机: 建立检验假设,确定检验水准H0:个样本所代表的总体平均水平相同H1:个样本所代表的总体
19、样本平均水平不完全相同 计算检验统计量 确定P值,做出统计推断随机区组: 建立检验假设,确定检验水准对于处理组对于区组 计算检验统计量 确定P值做出统计推断18.常用的实验设计方法:完全随机设计配对计量资料设计随机区组设计交叉设计析因设计正交设计调查设计19.配对秩和检验的步骤:建立假设检验,确定检验水准计算检验统计量T值 求差值 编秩,依差值的绝对值由小到大编秩。差值为零时舍去不计,n相应减小;当差值绝对值相等时,若符号相同,可顺次编秩,也可求平均平均秩次,若符号不同,求平均秩次,并标记原来符号。 分别求正负秩和;正秩和记为T,负秩和记为T确定P值,做出推断,采用查表法20.实验设计基本原则
20、:对照原则:安慰剂对照空白对照实验对照标准对照自身对照随机化原则:完全随机化分层随机化重复随机:整个实验的重复用多个受试对象进行重复,同一受试对象重复观察21.t分布的特征:单峰分布,以0为中心,左右对称越小,t分布越分散,曲线的峰部越矮,尾部越高随着逐渐增大,t分布逐渐接近正态分布,当趋向正无穷时,t分布趋向标准正态分布,故标准正态分布是t分布的特例。22.常用的抽样方法:单纯随机抽样系统随机抽样分层抽样整群抽样非概率抽样23.标准化法的选择方法:选定两组之一将其作为标准两组合并作为标准两组之外选择一个群体,将其作为标准24.线性相关应注意问题:进行相关分析前应先绘制散点图,当散点图有线性趋
21、势时,才进行相关分析线性相关要求两个变量都是随机变量,而且仅适用于二元正态分布资料出现异常值时慎用相关相关关系不一定是因果关系分层资料盲目合并易出现假象。25.方差分析的主要用途和条件及基本步骤:用途:进行两个或两个以上样本均数的比较 可以同时分析一个两个或多个因素对实验结果的作用和影响 分析多个因素的独立作用及多个因素之间的交互作用 进行两个或多个样本的方差齐性检验等条件:要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等基本步骤:计算总变异 计算各部分的变异 计算各部分变异的均方计算统计量F确定P值,推断结论26.为什么不能以构成比代率?请联系实际加以说明:率和构成
22、比说明的问题不同,因而不能代换。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。举例:以男性各年龄组高血压分布为例50-60岁年龄组的高血压病例所占比重大,而60岁以上所占比重小,这是因为60岁以上受检人数少,造成患病数低于50-60岁组,因而构成比相对较低。但不能认为50-60岁组的高血压患病率最为严重。若要比较高血压的患病率,应该计算患病率的指标。27.应用直线回归与相关分析是应注意哪些问题:(1)、作回归分析和相关分析是要有实际意义,不能把两种毫无关联的现象作分析(2)、在进行回归分析和相关分析之前,应绘制散点图。分布有直线趋势时方可进行分析。若呈明显曲线趋势,应
23、做直线化再分析。散点图还可提示资料有无可疑异常点。(3)、直线回归方程的应用范围一般以自变量的取值范围为限。(4)、双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大(5)、相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间却有内在联系28实验设计的基本内容与步骤:(1)、建立研究假设:在选题时应当考虑题目的科学性、新颖性、可行性以及所选课题是否是当前社会需要解决的主要问题。根据研究目的,确定研究的主要问题及相应的辅助问题(2)、明确研究范围:考虑规定适当的纳入标准和排除标准,选择适宜首饰受试对象(3)、确立处理因素:分清处理因素和非处理因素,注意处理因素的标准化(4)、明确观察指标:选用客观性较强,易于量化,灵敏性和特异性均较高的指标(5)、控制误差和偏倚:采取有效措施控制误差和偏倚,充分体现处理措施的效果29.线性相关分析应用中应注意的问题:从散点图能直观的看出两变量间有无线性关系,先绘散点图,再进行相关分析线性相关分析要求两变量都是随机变量,而且仅适用于二元正态分布资料出现异常值时慎用相关相关关系不一定是因果关系分层资料盲目合并易出假象
限制150内