2022年医学统计学知识点汇总.docx
《2022年医学统计学知识点汇总.docx》由会员分享,可在线阅读,更多相关《2022年医学统计学知识点汇总.docx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 医学统计学总结绪论 1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在肯定数量的重复试验之 后出现统计规律的现象;2、同质:统计学中对讨论指标影响较大的,可以掌握的主要因素;3、变异:同质基础上各观看单位某变量值的差异;数值变量:变量值是定量的, 由此而构成的资料称为数值变量资料或计量资料,其数 值是连续性的,称之为连续型变量;变量分类变量:定性变量无序分类变量:所分类别或属性之间无次序和程度上的差异有序分类变量:有次序和程度上的差异 4、总体:依据讨论目的确定的同质讨论对象中全部观看单位某变量值的集合;可以分为有限 总体和无限总体
2、;5、样本:是按随机化原就从同质总体中随机抽取的部分观看单位某变量值的集合;样本代表 性的前提:同质总体,足够的观看单位数,随机抽样;统计学中,描述 样本特点的指标称为统计量,描述总体 特点的指标称为参数;6、概率:描述随机大事发生的可能性大小的一个度量;如 P(A)=1,就称 A为必定大事;如P(A)=0,就称 A 为不行能大事;随机大事A 的概率为 0P1. 小概率大事:如随机大事 A 的概率 P ,就称随机大事 A为小概率大事,其统计学意义为:小概率大事在一次随机试验中认为是不行能发生的;统计描述1、频数分布有两个重要的特点: 集中趋势和离散程度; 频数分布有对称分布和偏态分布之分;后者
3、是指频数分布不对称, 集中趋势偏向一侧, 如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布;2、常用的集中趋势的描述指标有:均数,几何均数,中位数等;均数 : 适用于正态或近似正态的分布的数值变量资料;样本均数用 x 表示,总体均数用 表示;几何均数:适用 于等比级数 资料和对数呈正态分布的资料;观看值中不能同时有正值和负值;留意观看值中不能有零, 一组中位数:适用于偏态分布资料以及频数分布的一端或两端无准确数据的资料;3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数;全距:任何资料,一组中最大值与最小值的差;四分位数间距:适用于偏态分布以及分布的一端或
4、两端无准确数据资料;方差和标准差:正态分布资料;标准差表示观看值的变异度的大小;变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度;4、标准正态分布:对正态分布的(X- )/ 进行 u 的变换, u=(X- )/ , 就正态分布变换为 =0, =1 的标准正态分布,亦称 u 分布; u 被称为标准正态变量或标准正态离差;两个参数: 是位置参数, 是外形参数; 用 N(0,1 )表示标准正态分布;名师归纳总结 - - - - - - -第 1 页,共 17 页精选学习资料 - - - - - - - - - 常用估量医学参考值范畴的方法有:(1) 正态分布方法:适用于正态或近似正态分布的
5、资料;双侧界值: X u /2S 单侧上界: X+u S,或单侧下界: X-u S (2) 对数正态分布方法:适用于对数正态分布资料;双侧界值: Lg-1(X lgx u /2S lgx )单侧上界: Lg-1(X lgx +u S lgx),或单侧下界: Lg-1(X lgx -u S lgx )(3)百分位数法:用于偏态分布资料以及资料中一端或两端无准确数值的资料;双侧上界: P2.5 和 P97.5;单侧上界: P95,或单侧下界: P5常用的 u 值表参考值范畴( %)单侧双侧80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.
6、576 5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比;率:说明某现象发生的频率或强度; (病死率不等于死亡率)构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示;相对比:亦称比,是A、B 2 个有关指标之比,说明A 为 B 的如干倍或百分之几;两个指标可以性质相同,也可以性质不同;应用相对数时的留意事项: 1、运算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观看单位数不等的几个率,不能直接相加求其平均率;4、比较相对数时应留意其可比性;5、对样本率(或构成比)的比较应遵循随机抽样,并做假设检验;6、标准化法:标准化的目的在于排除混杂因素对结
7、果的影响,使资料更具有可比性;其基本思想是:将所比较的两组或多组资料的构成按统一的“ 标准” 调整后,运算标化率,使其更具有可比性;标准化率的运算方法: 亦称标化率, 直接法用于已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时; 间接法用于已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时;通常可从以下 3 种方法选用标准组:以两组资料中任一组的年龄别人口数或构成比作为标准组;以两组资料合并的各年龄组的人口数或构成比作为标准组;料比较的标准作为标准组;7、统计表:结构:由标题、标目、线条和数字构成;编制统
8、计表的要求:以公认的或便于与他人资标题:概括表的内容,列于表的上方居中,应注明时间和地点;标目:主语和谓语分别列于横、纵标目,文字简明,层次清晰;横标目列于表的左侧,通常 为被讨论的事物,纵标目列于表的上端,为说明横标目的统计指标;线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和 底线应略粗些,表的左上角不宜用斜线;数字:用阿拉伯数字表示, 同一指标的小数位数要一样并对齐,数字暂缺或很多字者分别用名师归纳总结 “ ” 或“- ” 表示,数字为 0 者要记作“0” ,不应空项,为便利核实和分析,应有合计;第 2 页,共 17 页- - - - - - -精选学习资
9、料 - - - - - - - - - 备注:一般不列入表内,必要时可用“8、统计图:条图:用于相互对比关系的资料;* ” 标出,列于表下;圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;线图:用于连续性资料, 用于说明事物在时间上的进展变化,情形;直方图:表示连续性资料的频数分布;或某现象随另一现象而变动的散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势;抽样分布与参数估量抽样讨论的目的是用样本信息来推断总体特点,估量,二是假设检验;即统计推断, 包括两个内容: 一是总体参数的1、抽样误差:由于变异的存在,抽样讨论所造成的样本统计量与总体参数之间的差异
10、或各样本统计量之间的差异称为抽样误差;常用标准误 x反映均数抽样误差的大小;用率的标准误 p 反映率的抽样误差的大小;用Possion 计数的标准误 反映其抽样误差的大小;2、中心极限定理和正态分布推理:从正态分布 N( , 2)总体中以固定 n 随机抽取样本,样本均数 x 的分布仍听从正态分布,即使是从偏态分布总体中随机抽样,只要 n 足够大, x 的分布也近似正态分布;样本均数的均数仍为 ,样本均数的标准差为 x;样本均数的抽样误差 x(简称标准误)是反映均数抽样误差大小的指标;x= 用样本均数 S 作为 的估量值,就 xs = Sn n3、t 分布:将 x 看成变量值,那么可将正态变量进
11、行u 变换(u= x - / )后,也可将 N( ,2x)变换成标准正态分布 N(0,1);常用 s 作为 的估量值,统计量为 t ,此分布为 t 分布;统计量 t= x t 曲线的外形变化与自由度 v 的大小有关; v 越小, t 值越分散,曲线越低xs平, v 逐步增大时,就 t 分布逐步靠近正态分布,当 v=无穷大时, t 分布即为 u 分布;4、总体均数的估量有两种方法:一种是点估量,即用统计量 x 估量总体均数;二是区间估计,亦称可信区间;(1) 未知且 n 小: x -t /2 ,v s x x +t /2 ,v s x (2) 未知,但 n 足够大, t 分布靠近 u 分布: x
12、 -u /2sx x +u /2sx 名师归纳总结 (3) 已知: x -u /2x x +u /2x 第 3 页,共 17 页- - - - - - -精选学习资料 - - - - - - - - - 标准差和标准误的比较S=标准差s = x标准误xx2sn1n表示观看值的变异程度大小估量均数的抽样误差大小运算变异系数 CV= sx100% 估量总体均数可信区间确定医学参考值的范畴x -t /2 ,v s x x +t /2 ,v s x 进行假设检验运算标准误数值变量资料的假设检验1、假设检验的原理:假设在一次抽样讨论中得出了u1.96 ,就 P0.05 ,此为小概率大事,依据“ 小概率大
13、事在一次随机试验中认为是不行能发生的”的定理, 可认为此样本不是来自该总体;2、步骤:建立假设和确定检验水准;假设有两种,一种是检验假设,常称 无效假设或零假设,记为 H0,假设样本所代表的总体参数与已知总体参数相等;另一种是 备择假设 ,记为 H1,是与 H0 相联系且对立的假设;检验水准,亦称显著性水准,是判定拒绝或不拒绝 H0,也是 允许犯型错误的概率 ,通常用 0.05 ;选定检验方法和运算统计量确定P 值,做出推断结论; P值是指从 H0 所规定的总体中随机抽样时,获得等于及大于现有样本统计量的概率;3、t 检验:适用于:样本均数与总体均数比较( 未知且 n50 或 n30);成组设
14、计的两小样本均数的比较( n1,n2 均小于 30 或 50);配对设计的两样本均数比较;应用条件:当样本含量较小(n50 或 n30)时,要求样原来自正态分布总体;用于成组设计的两样本均数比较时,要求两样原来自总体方差相等的总体;4、单样本 t 检验:用于样本均数与已知总体均数的比较,讨论目的是推断样本所代表的总体均数 与已知总体均数 0有无差别;统计量t= x/0 v=n-1 sn5、配对 t 检验:用于配对设计资料的两均数的 比较;其讨论目的是推断某种处理有无作用,或两种处理的成效有无差别;2配对设计类型有3 种:先将受试对象按配比条件配对,然后用随机分组方法将各对中的个受试对象分别安排
15、到不同的处理组;同一对象分别接受2 种不同处理; 同一对象处理前后; t=s ddn( d 是差值的样本均数) v=n-1 /6、两样本 t 检验:用于 完全随机设计的两样本均数的 目的是推断两样本所分别代表的总体均数是否相等;比较,两个样原来自两个总体,其讨论名师归纳总结 - - - - - - -第 4 页,共 17 页精选学习资料 - - - - - - - - - t=x 1x2=x 1x21=2 s 1n 1n11 nx1x 2111 v=n1+n2-2 S x 1x22 s c12 s 2n2n 1n 222n 1n27、单样本 u 检验:用于样本均数与已知总体均数比较,其讨论目的
16、同 t 检验;讨论目的是推断样本所代表的总体均数 与已知总体均数 0有无差别;其统计量 u= x 0s / n8、两样本的 u 检验:用于完全随机设计的两样本均数的比较,两个样原来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等;其统计量为:u=x 1x 1x2=2 s 1x 1x2/n2sx 2/n 1s2 29、正态性检验和方差齐性检验: 资料在做假设检验之前第一应当检验资料是否来自正态总体,并且它们的方差是否齐;10、两类错误:型错误: 拒绝了实际上成立的 H0, 即样原来自 = 0 的总体, 由于抽样的偶然性, 按 =0.05检验水准拒绝了 H0, 接受 H1;这类在假设
17、检验中拒绝了原本正确的 H0 的错误称为型错误; ,理论上犯型错误的概率为 , 值得大小视讨论目的而定;通常设 =0.05;型错误:不拒绝了实际上不成立的 H0, 即样原来自 0的总体,由于抽样的偶然性,按 =0.05 检验水准不拒绝 H0,这类在假设检验中不拒绝原本不正确的 H0的错误称为型错误;犯型错误的概率为 ,它只有与特定的 H1结合起来才有意义;同时削减 和 的方法是 增加样本含量 ;1- 称为检验效能或把握度 ,即两总体确有差别时,按 水准能识别该差别的才能; 如 1- =0.95 表示:如两总体确有差别, 理论上平均 100 次抽样中,有 95 次能得出两总体有差别的结论;11、
18、假设检验时应留意的事项 : 要有严密的抽样讨论设计- 假设检验的前提正确选用检验方法: 完全随机的设计的两数值变量资料比较时,如 n 小且方差齐, 就选用两样本 t 检验;如方差不齐,就选用 t 检验或成组设计的两样本比较的秩和检验;如 n1,n2 均大于 50,就选用两样本 u 检验;正确懂得“ 显著性” 的含义对差别有无统计学意义的判定 不能肯定化 ;方差分析1、基本思想:按讨论目的和设计类型,将总变异的离均差平方和SS和自由度 v 分别分解成如干部分,并求得各相应部分的变异;其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量F 值,由 F 值的大小确定P 值
19、,并作出推断,从而明白该因素对观测指标有无影响;组内变异主要由个体差异所致,组间变异可能由两种缘由所致:一是抽样误差,二是由于接受的处理不同;名师归纳总结 2、总离均差平方和2SS和自由度 v /n第 5 页,共 17 页SS总=knix ijx =x2x 2i1j1- - - - - - -精选学习资料 - - - - - - - - - v总=n-1 3、组间离均差平方和SS组间,自由度 v 组间和均方 MS组间SS组间=ikn ixij2x2 v组间=k-1 MS组间=SS 组间各样原来自正态j11n inv组间4、组内离均差平方和SS组内,自由度 v 组内和均方 MS组内SS组内=SS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 医学 统计学 知识点 汇总
限制150内