【孙振球第三版】医学统计学温习题.doc
《【孙振球第三版】医学统计学温习题.doc》由会员分享,可在线阅读,更多相关《【孙振球第三版】医学统计学温习题.doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、名词解释:1、总体:根据研究目确实定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。2、有限总体:是指空间、时间范围限制的总体。3、无限总体:是指没有空间、时间限制的总体。4、样本:从总体中随机抽取局部观察单位,其实测值的集合。5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的
2、,表现为互不相容的性或类别。分两种情形:1二分类:两类间相互对立,互不相容。2多分类:各类间互不相容。7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。8、随机误差偶然误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。10、抽样误差:由于个体差异和随机抽样造成的样本统
3、计量和总体参数之间的差异,以及统一总体假设干样本统计量之间的差异。11、I型错误:拒绝了实际上成立的H0,这类“弃真错误称为I型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用表示,可取单尾亦可取双尾。12、II型错误:“接受了实际上不成立的H0,这类“取伪的错误称为II型错误。其概率大小用表示,只取单尾,值的大小一般未知,须在知道两总体差值、及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。14、率:强度相对数,说明某现象发生的频率或强度。15、构成比:结构相对数
4、字,表示事物内部某一局部的个体与该事物各个局部个体数的和之比。用来说明各构成局部在总体所占的比重或分布。16、相比照:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比拟该事物在时间上的变化和开展趋势。常用指标有绝对增长量、开展速度与增长速度、平均开展速度与平均增长速度。19、非参数检验:相对于参数检验而言,不依赖于总体分布类
5、型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1r1。相关系数的检验假设常用t检验。21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。22、随机原那么:是指在实验分组时,每个受试对象均有相同的概率或时机被分陪配到实验组和对照组。23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量
6、值是定性的,表现为互不相容的性或类别。分两种情形:1二分类:两类间相互对立,互不相容。2多分类:各类间互不相容。24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:1二分类:两类间相互对立,互不相容。2多分类:各类间互不相容。25、寿命期望:指同时出生的一代人活满x岁以后尚能生存的年数即岁数。26、检验效能:表达式为1-,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。27、观察单位:亦称个体,是统计研究中的根本单位。它可以是一个人、一只动
7、物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。28、样本含量:样本中包含观察单位数称为该样本的样本含量。29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。30、变量值:对变量的观测值称为变量值或观察值。31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为1随机误差;2非随机误差系统误差非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。33、
8、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以去除,否那么将影响研究结果的准确性。34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复屡次后,出现结果的比例称之为频率。35、概率:概率是描述随机事件发生可能性大小的一个度量。36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。37、正态分布:正态分布又称高斯分布,是一种很重要的
9、连续型分布,应用很广。假设指标X的频率分布曲线对应于数学上的正态分布曲线,那么称该指标服从正态分布。38、偏态分布:指集中位置偏向一侧,频数分布不对称。1正偏态分布:集中位置偏向数值小的一侧。2负偏态分布:集中位置偏向数值大的一侧。39抽样:在医学研究中,为节省人力、物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体中随机抽取局部观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原那么。二、填空题1、医学统计工作的根本步骤:设计、搜集资料、整理资料、分析资料。2、医学统计资料的主要来源的四个方面:统计报表、经常性工作
10、记录、专题调查、统计年鉴和数据库专集。3、正态分布的规律的应用:估计频数分布情况、质量控制、统计处理方法的理论根底、估计医学参考值范围。4、计量资料统计描述的方法:频数分布表、频数分布图、统计指标。5、CV变异系数:常用于度衡量单位不同和均数相悬殊的多组资料变异度的比拟。6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。7、可信区见估计的优劣取决于两要素:1可信度1-准确度,即区间包含总体均数的理论概率大小,可信度愈接近1愈好。2区间宽度精密度,即区间的长度,区间愈窄愈好。8、变量变换的方法有:对数变换、平方跟变换、
11、倒数变换、平方根反正弦变换。9、常用的相对数:率、构成比、相比照。10、动态数列常用指标有:绝对增长量、开展速度与增长速度、平均开展速度、平均增长速度。11、二项式分布的参数是n和。n,n次独立重复实验数目;,每次实验的“阳性概率。12、二项式分布在n很大,而很小,且n=为常数时,二项式分布近似Poisson分布。13、总体均数与总体方差2相等是Poisson分布的重要特征。14、Poisson分布具备可加性。15、当总体率增大时,Poisson分布渐近正态分布。16、四格表中四格子根本数值为两对实测的实际频数和理论频数。17、R*C表的卡方检验,假设表格中有一个方向按多个等级分类时,那么称之
12、为单向有序行列表,当等级数大于3时,如检验各处理组各等级下的构成比有无差异时采用2检验,如检验各处理组各等级下的程度上有无差异时采用非参数检验。18、配比照拟秩和检验,以正秩或负秩的和T为检验统计量,其中T越小那么P的值小于相应的检验水平。19、正态分布的两个参数和2,前者决定分布的位置,后者决定分布的形态形状、变异度。20、四格表2的校正条件为n40而且1T5。21、R*C表资料2检验,如果有T1,应该采取的措施有:1增加样本含量,使理论频数增大;2根据专业知识考虑能否删除理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的行或列合并。3改用双向无序R*C表资料的Fisher确切概率
13、法。22、Poisson分布中,总体的方差与均数的关系是=2,当均数较大时,Poisson分布趋近于正态分布。23、要分析某个资料是否属于二项分布,可用频数分布的拟合优度的2检验。24、r是相关系数,表示具有直线关系的两变量间相关密切程度和相关方向。25、变异系数的应用条件是均数相差较大、观察指标单位不同。26、2表示理论频数与实际频数的符合程度。27、常用相对数的指标有强度相对数字率、结构相对数构成比、相比照比。28、常用的描述构成比的统计图有圆图和百分比条图。29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。30、实验设计的根本原那么随即机原那么、对照原那么、重复原那么
14、。31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。32、写出四种变量变换的方法:倒数变换、平方根变换、平方根反正弦变换、对数变换。33、在F检验中如有各比拟组方差不齐时应用变量变换、近似t检验、Wilcoxon秩和检验的方法。34、四格表资料2适用条件:1n40且T5时用2检验的根本公式,当P时,改用四格资料表的Fisher确实切概率法;2n40且1T5时用,用四格资料表2检验的校正公式,或改用四格资料表的Fisher确实切概率法;3n40,或T1时,改用四格资料表的Fisher确实切概率法。35、当总体率很小时,当n很大时,二项分布可用泊松分布来近似
15、。36、率的标准化的计算方法有直接标准化方法和间接标准化方法。37、2检验的用途:1推断两个总体率或构成比之间有无差异;2多个总体率或构成比之间有无差异;3两分类变量间有无关联性;4多个样本间的多重比拟;5频数分布拟合优度的2检验。38、拟合优度检验常用判定实际分布是否符合正态分布、二项分布、Poisson分布和负二项分布。39、实验设计的三个根本要素为:实验单位、处理因素、实验效应。40、变异系数常用于观察单位指标不同和均数相差较大的多组资料变异度的比拟。41、所有检验统计量是在H0的条件下计算出来的。42、标准化的目的是为了消除构成比不同对合计率的影响,使比拟组间具有可比性。43、统计推断
16、包括:参数估计区间估计、点值估计、假设检验。44、医学参考值的制定方法包括:正态分布法、百分位数法。45、Poisson分布的性质:(1)可加性、(2)总体均数与总体方差2相等、(3)当n很大而很小且n=时二项分布近似Poisson分布、(4)当增大时,Poisson分布渐近正态分布。46、集中趋势的描述指标:算术均数、集几何均数、中位数和百分位数。47、离散趋势的描述指标;极差、四分位数间距、方差与标准差、变异系数。第二章 计量资料的统计描述1、集中趋势、离散趋势的统计描述指标以及区别。答:一、集中趋势的描述指标:统计学用平均数这一指标来描述一组变量值的集中位置或平均水平。1算术均数:简称均
17、数字,可用于反映一组呈对称分布的位置在数量上的平均水平。2几何均数:可用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平,在医学研究中常适用于免疫学的指标。3中位数:是将n个变量值从小到大排列,位置居中间的那个数。分为奇偶两种情况。4百分位数:是一种位置指标,用PX来表示。【孙振球第三版】医学统计学复习题统计复习题5Edited by RYAN DAI一、名词解释:1、总体:根据研究目确实定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。2、有限总体:是指空间、时间范围限制的总体。3、无限总体:是指没有空间、时间限制的总体。4、样本:从总体中随乍寝墒国刚午滞础抢自仆捕肿里丸
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 孙振球第三版 孙振球 第三 医学 统计学 温习
限制150内