医学统计学知识点汇总.docx
《医学统计学知识点汇总.docx》由会员分享,可在线阅读,更多相关《医学统计学知识点汇总.docx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学总结绪论1, 随机现象:在同一条件下进展试验,一次试验结果不能确定,而在确定数量的重复试验之后呈现统计规律的现象。2, 同质:统计学中对探讨指标影响较大的,可以限制的主要因素。3, 变异:同质根底上各视察单位某变量值的差异。 数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。变量 无序分类变量:所分类别或属性之间无依次和程度上的差异 分类变量 :定性变量 有序分类变量:有依次和程度上的差异4, 总体:依据探讨目的确定的同质探讨对象中全部视察单位某变量值的集合。可以分为有限总体和无限总体。5, 样本:是按随机化原那么从同质总体中随
2、机抽取的局部视察单位某变量值的集合。样本代表性的前提:同质总体,足够的视察单位数,随机抽样。统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。6, 概率:描述随机事务发生的可能性大小的一个度量。假设PA=1,那么称A为必定事务;假设PA=0,那么称A为不行能事务;随机事务A的概率为0P1.小概率事务:假设随机事务A的概率P,那么称随机事务A为小概率事务,其统计学意义为:小概率事务在一次随机试验中认为是不行能发生的。统计描述1, 频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之分。后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分
3、布,如偏向数值大的一侧为负偏态分布。2, 常用的集中趋势的描述指标有:均数,几何均数,中位数等。均数:适用于正态或近似正态的分布的数值变量资料。样本均数用表示,总体均数用表示。几何均数:适用于等比级数资料和对数呈正态分布的资料。留意视察值中不能有零,一组视察值中不能同时有正值和负值。中位数:适用于偏态分布资料以及频数分布的一端或两端无精确数据的资料。3, 常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。全距:任何资料,一组中最大值与最小值的差。四分位数间距:适用于偏态分布以及分布的一端或两端无精确数据资料。方差和标准差:正态分布资料。标准差表示视察值的变异度的大小。变异
4、系数:比拟度量单位不同或均数相差悬殊的两组资料的变异度。4, 标准正态分布:对正态分布的X-/进展u的变换,u=X-/,那么正态分布变换为=0,=1的标准正态分布,亦称u分布。u被称为标准正态变量或标准正态离差。两个参数:是位置参数,是形态参数。用N0,1表示标准正态分布。常用估计医学参考值范围的方法有:(1) 正态分布方法:适用于正态或近似正态分布的资料。双侧界值:Xu/2S 单侧上界:X+uS,或单侧下界:X-uS(2) 对数正态分布方法:适用于对数正态分布资料。双侧界值:Lg-1X lgxu/2S lgx 单侧上界:Lg-1X lgx +uS lgx,或单侧下界:Lg-1X lgx -u
5、S lgx3百分位数法:用于偏态分布资料以及资料中一端或两端无精确数值的资料。双侧上界:P和P;单侧上界:P95,或单侧下界:P5参考值范围% 单侧 双侧常用的u值表5, 分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相比照。率:说明某现象发生的频率或强度。病死率不等于死亡率构成比:说明某现象内部组成局部所占的比重或分布,常以百分数表示。相比照:亦称比,是A, B 2个有关指标之比,说明A为B的假设干倍或百分之几。两个指标可以性质一样,也可以性质不同。应用相对数时的考前须知: 1, 计算相对数的分母不宜过小;2, 分析时不能以构成比代替率;3, 对视察单位数不等的几个率,不能干
6、脆相加求其平均率;4, 比拟相对数时应留意其可比性;5, 对样本率或构成比的比拟应遵循随机抽样,并做假设检验。6, 标准化法:标准化的目的在于消退混杂因素对结果的影响,使资料更具有可比性。其根本思想是:将所比拟的两组或多组资料的构成按统一的“标准调整后,计算标化率,使其更具有可比性。标准化率的计算方法:亦称标化率,干脆法用于被标化组的年龄别率,以及标准组的年龄别人口数或年龄别人口构成比时;间接法用于被标化组的年龄别人口数与发病死亡总数,但年龄别率未知,以及标准组年龄别发病死亡率与总发病死亡率时。通常可从以下3种方法选用标准组:以两组资料中任一组的年龄别人口数或构成比作为标准组;以两组资料合并的
7、各年龄组的人口数或构成比作为标准组;以公认的或便于与他人资料比拟的标准作为标准组。7, 统计表:构造:由标题, 标目, 线条和数字构成。编制统计表的要求:标题:概括表的内容,列于表的上方居中,应注明时间和地点;标目:主语和谓语分别列于横, 纵标目,文字简明,层次清楚。横标目列于表的左侧,通常为被探讨的事物,纵标目列于表的上端,为说明横标目的统计指标。线条:通常,除表的顶线, 底线, 纵标目下以及合计上的横线外,其余线条均省去,顶线和底线应略粗些,表的左上角不宜用斜线。数字:用阿拉伯数字表示,同一指标的小数位数要一样并对齐,数字暂缺或多数字者分别用“或“-表示,数字为0者要记作“0,不应空项,为
8、便利核实和分析,应有合计。备注:一般不列入表内,必要时可用“*标出,列于表下。8, 统计图:条图:用于相互比照关系的资料;圆图与百分条图:适用于百分构成比资料,表示事物各组成局部所占的比重或构成;线图:用于连续性资料,用于说明事物在时间上的开展变更,或某现象随另一现象而变动的状况;直方图:表示连续性资料的频数分布;散点图:适用于直线相关分析,说明两个变量间的数量关系和变更趋势。抽样分布与参数估计抽样探讨的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的估计,二是假设检验。1, 抽样误差:由于变异的存在,抽样探讨所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差
9、异称为抽样误差。 常用标准误反映均数抽样误差的大小;用率的标准误p反映率的抽样误差的大小;用Possion计数的标准误反映其抽样误差的大小。2, 中心极限定理和正态分布推理:从正态分布N,2总体中以固定n随机抽取样本,样本均数的分布仍听从正态分布,即使是从偏态分布总体中随机抽样,只要n足够大,的分布也近似正态分布。样本均数的均数仍为,样本均数的标准差为。样本均数的抽样误差简称标准误是反映均数抽样误差大小的指标。 = 用样本均数S作为的估计值,那么=3, t分布:将看成变量值,那么可将正态变量进展u变换u=-/后,也可将N,变换成标准正态分布N0,1。常用s作为的估计值,统计量为t,此分布为t分
10、布。统计量 t= t曲线的形态变更与自由度v的大小有关。v越小,t值越分散,曲线越低平,v慢慢增大时,那么t分布慢慢靠近正态分布,当v=无穷大时,t分布即为u分布。4, 总体均数的估计有两种方法:一种是点估计,即用统计量估计总体均数;二是区间估计,亦称可信区间。1未知且n小:-t/2,v sx+t/2,v sx2未知,但n足够大,t分布靠近u分布:-u/2sx+u/2sx3:-u/2x+u/2x标准差和标准误的比拟 标准差 标准误S= =表示视察值的变异程度大小 估计均数的抽样误差大小计算变异系数CV=100% 估计总体均数可信区间 -t/2,v sx+t/2,v sx确定医学参考值的范围 进
11、展假设检验计算标准误数值变量资料的假设检验1, 假设检验的原理:假设在一次抽样探讨中得出了u1.96,那么P0.05,此为小概率事务,依据“小概率事务在一次随机试验中认为是不行能发生的的定理,可认为此样本不是来自该总体。2, 步骤:建立假设和确定检验水准;假设有两种,一种是检验假设,常称无效假设或零假设,记为H0,假设样本所代表的总体参数与总体参数相等;另一种是备择假设,记为H1,是与H0相联系且对立的假设;检验水准,亦称显著性水准,是推断拒绝或不拒绝H0,也是允许犯型错误的概率,通常用0.05。选定检验方法和计算统计量确定P值,做出推断结论。P值是指从H0所规定的总体中随机抽样时,获得等于及
12、大于现有样本统计量的概率。3, t检验:适用于:样本均数与总体均数比拟未知且n50或n30;成组设计的两小样本均数的比拟n1,n2均小于30或50;配对设计的两样本均数比拟。应用条件:当样本含量较小n50或n30时,要求样原来自正态分布总体;用于成组设计的两样本均数比拟时,要求两样原来自总体方差相等的总体。4, 单样本t检验:用于样本均数与总体均数的比拟,探讨目的是推断样本所代表的总体均数与总体均数0有无差异。统计量t= v=n-15, 配对t检验:用于配对设计资料的两均数的比拟。其探讨目的是推断某种处理有无作用,或两种处理的效果有无差异。配对设计类型有3种:先将受试对象按配比条件配对,然后用
13、随机分组方法将各对中的2个受试对象分别支配到不同的处理组;同一对象分别承受2种不同处理;同一对象处理前后。t= 是差值的样本均数v=n-16, 两样本t检验:用于完全随机设计的两样本均数的比拟,两个样原来自两个总体,其探讨目的是推断两样本所分别代表的总体均数是否相等。t= v=n1+n2-27, 单样本u检验:用于样本均数与总体均数比拟,其探讨目的同t检验。探讨目的是推断样本所代表的总体均数与总体均数0有无差异。其统计量 u=8, 两样本的u检验:用于完全随机设计的两样本均数的比拟,两个样原来自两个总体,其探讨目的是推断两样本所分别代表的总体均数是否相等。其统计量为:u=9, 正态性检验和方差
14、齐性检验:资料在做假设检验之前首先应当检验资料是否来自正态总体,并且它们的方差是否齐。10, 两类错误:型错误:拒绝了事实上成立的H0,即样原来自=0的总体,由于抽样的偶然性,按0,承受H1。这类在假设检验中拒绝了原本正确的H0的错误称为型错误。,理论上犯型错误的概率为,值得大小视探讨目的而定。通常设=0.05。型错误:不拒绝了事实上不成立的H0, 即样原来自0的总体,由于抽样的偶然性,按0,这类在假设检验中不拒绝原本不正确的H0的错误称为型错误。犯型错误的概率为,它只有与特定的H1结合起来才有意义。同时削减和的方法是增加样本含量。1-称为检验效能或把握度,即两总体确有差异时,按水准能识别该差
15、异的实力。如1-=0.95表示:假设两总体确有差异,理论上平均100次抽样中,有95次能得出两总体有差异的结论。11, 假设检验时应留意的事项:要有严密的抽样探讨设计-假设检验的前提正确选用检验方法:完全随机的设计的两数值变量资料比拟时,假设n小且方差齐,那么选用两样本t检验;假设方差不齐,那么选用t检验或成组设计的两样本比拟的秩和检验;假设n1,n2均大于50,那么选用两样本u检验。正确理解“显著性的含义 对差异有无统计学意义的推断不能确定化。方差分析1, 根本思想:按探讨目的和设计类型,将总变异的离均差平方和SS和自由度v分别分解成假设干局部,并求得各相应局部的变异。其中的组内变异或误差主
16、要反映个体差异或抽样误差,其它局部的变异与之比拟得出统计量F值,由F值的大小确定P值,并作出推断,从而了解该因素对观测指标有无影响。组内变异主要由个体差异所致,组间变异可能由两种缘由所致:一是抽样误差,二是由于承受的处理不同。2, 总离均差平方和SS和自由度vSS总=v总=n-13, 组间离均差平方和SS组间,自由度v组间和均方MS组间SS组间= v组间=k-1 MS组间=4, 组内离均差平方和SS组内,自由度v组内和均方MS组内SS组内=SS总-SS组间 v组内=n-k MS组内=SS组内/v组内多样本均数比拟的方差分析的应用条件:各样本是相互独立的随机样本;各样原来自正态分布总体;各总体方
17、差相等,即方差齐。5, 完全随机设计资料的方差分析:亦称单因素的方差分析,可用于完全随机设计的多个样本均数比拟的资料,探讨目的是推断各个样本所代表的总体均数是否相等。单因素方差分析的计算公式变异来源 SS v MS F 总变异 n-1组间变异 EMBED Equation.3 k-1 组内变异 SS总-SS组间 n-k SS组内/v组内*C为校正系数 C=6, 配伍组设计资料的方差分析:亦称两因素的方差分析,用于配伍组设计的多个样本均数比拟的资料,其探讨目的是推断各样本所代表的总体均数是否相等,但考虑了个体差异对试验效应的影响。两因素方差分析的计算公式变异来源 SS v MS F总变异 n-1
18、处理组 k-1 SS处理/v处理 MS处理/MS误差配伍组 b-1 SS配伍/v配伍 MS配伍/MS误差误差 SS总-SS处理-SS配伍 k-1b-1 SS误差/v误差*C为校正系数 C= b为配伍组数分类资料的假设检验1, 二项分布:应用条件:各视察单位只能具有两种相互对立的结果发生某结果的概率为,其对立结果的概率为1-n次试验是在一样的条件下进展的。性质:=n =假设均数和标准差用率表示,那么 p= p=未知时,用样本率P作为的估计值,那么 Sp=总体率的估计:正态近似法:当样本含量n足够大,且样本率p或1-p均不太小,如np与n1-p均大于5时样本率p的抽样误差分布近似正态分布,可信区间
19、为:p-u/2Sp,p+u/2Sp2, Poisson分布:对于二项分类变量,假设某结果发生的概率很小,如0.05时,单位时间, 人群, 空间内“阳性发生次数xx=0,1,2,的概率可用Poisson分布概率函数来描述:P(X)= 递推公式:P0= Px=应用条件:外,其余同二项分布。分布的性质:1, Poisson分布式一种单参数的离散型分布,其参数为,表示单位时间, 人群, 空间内某事务平均发生的次数。2, Poisson分布的方差与均数相等。3, Poisson分布可以看成是二项分布的极限形式。4, Poisson分布的极限形式也是二项分布,一般当n20时,可按正态分布处理,当0.01时
20、,二项分布可以当作Poisson分布来处理。5, Poisson分布具有可加性。总体均数的估计:正态近似法, 3, 听从二项分布资料的假设检验:1样本率和总体率的估计:干脆计算法:最多有k例阳性的概率:P(xk)= 最少有k例阳性的概率:Pxk=1-正态近似法:当不太靠近0或1,且样本含量n足够大;或n5且n1-5时,二项分布接近正态分布。u=2两样本率的比拟:目的是推断两个样本各自代表的两总体率是否相等,当两个样本率均满足正态近似条件时,可用u检验。其公式为:u= 为合并阳性率,=x1+x2/(n1+n2) x1,x2为两个样本的阳性例数。4, 听从Poisson分布的假设检验:对于Pois
21、son分布的假设检验,对于总体均数可以用乘法将小单位化大,也可以用除法将大单位化小,对于样本均数,只能用除法将大单位化小,而不能用乘法将小单位化大。1样本均数与总体均数的比拟:适用于020,且样本阳性数X较小作单侧检验时。干脆计算法:最多有k例阳性的概率:P(xk)= 最少有k例阳性的概率:Pxk=1-正态近似法:当20时,Poisson分布靠近正态分布。u=2两样本阳性数的比拟:目的是推断两样本各自代表的两总体平均数是否相等。当两样本阳性数X1,X2均大于20时,可用u检验。其计算用两种状况:两样本视察单位时间, 面积, 容积等一样时:u=两样本视察单位时间, 面积, 容积等不同时:u=5,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 知识点 汇总
限制150内