《2022年医学统计学重点3.docx》由会员分享,可在线阅读,更多相关《2022年医学统计学重点3.docx(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 医学统计学医学统计学重点第一章 绪论1. 基本概念:总体: 依据讨论目的确定的性质相同或相近的讨论对象的某个变量值的全体;样本: 从总体中随机抽取部分个体的某个变量值的集合;总体参数: 刻画总体特点的指标,简称参数;是固定不变的常数,一般未知;统计量: 刻画样本特点的指标,由样本观看值运算得到,不包含任何未知参数;抽样误差: 由随机抽样造成的样本统计量与相应的总体参数之间的差异;频率:如大事 A 在 n 次独立重复试验中发生了 验中显现的频率或相对频率;概率: 频率所稳固的常数称为概率;m次,就称 m为频数; 称 m/n 为大事 A 在 n 次
2、试统计描述: 选用合适统计指标 样本统计量 、统计图、统计表对数据的数量特点及其分布规律 进行刻画和描述;统计推断: 包括参数估量和假设检验;用样本统计指标 统计量 来推断总体相应指标 参数 ,称为参数估量;用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验;2. 样本特点: 足够的样本含量、牢靠性、代表性;3. 资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料;是对观看对象测量指标的数值大小所 得的资料,观看指标是定量的,表现为数值大小;每个个体都能观看到一个观看指标的 数值,有度量衡单位;(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)计数
3、资料:是将观看单位按某种属性或类别分组,清点各组观看单位的个数 频数 ,由 各分组标志及其频数构成;包括二分类资料和多分类资料;二分类:将观看对象按两种对立的属性分类,两类间相互对立,互不相容;多分类:将观看对象按多种互斥的属性分类 等级资料:将观看单位按某种属性的不同程度、档次或等级次序分组,清点各组观看单 位的个数所得的资料;4. 统计工作基本步骤:统计设计、资料收集、资料整理、统计分析;1名师归纳总结 - - - - - - -第 1 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学其次章 试验讨论的三要素1. 试验设计三要素: 被试因素、受试对象、试验效应2
4、. 误差分类: 随机误差(抽样误差、随机测量误差)、系统误差、过失误差;3. 试验设计的三个基本原就:4. 试验设计方法对比原就、随机化分组原就、重复原就;交互作用有析因设计正交试验设计匀称试验设计交叉设计两组 :异体配对设计同体配对设计无随机同期对比试验设计(单因素两水平)扩展拉丁方设计多组:单因素多水平配伍组设计(两因素多水平)(三因素多水平)配伍组设计: 也称随机区组设计, 将条件相近的受试对象配伍, 每个配伍组中的对象随机安排 到各处理组中;析因设计: 考察两个或两个以上的处理因素,将各个因素的水平进行全面组合 , 每个组合下至 少有两个以上的观看对象重复测量;一般来讲,应尽可能支配等
5、重复试验,以简化运算,2-3 个水平数;优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用;拉丁方设计: 用于三因素等水平无交互;第三章 定量资料的统计描述、参考值范畴1. 频数表编制过程(明白)(1)找出样本数据的最大值和最小值,运算极差 R;(2)分组:确定分组的组距 d 和组数 k ;一般 n100,10-15 组(3)求频率密度:统计频数,算出频率、频率密度和累积频率;(4)画出直方图;2. 频数表和直方图的作用: 用于观看个数较多资料的统计描述,可以直观提示资料的分布特点和分布类型;2名师归纳总结 - - - - - - -第 2 页,共 22 页精选学习资料 -
6、- - - - - - - - 医学统计学3. 集中趋势、离散趋势的指标及适用范畴(1)集中趋势: x ,G,M,Px,M0算术均数:适用于对称分布;不适用于偏态分布和资料中显现极值的资料;几何均数:适用于呈倍数关系的资料或对数正态分布的资料,特殊是正偏态分布;不适用与观看值中有0 或正负数值同时显现的资料;中位数:适用于大样本偏态分布或分布情形不明的资料或资料中有不确定数值的资料;百分位数的作用:多个百分位数结合使用,全面描述数据分布的特点 ; 用于确定医学参考值范畴(偏态或分布不明的资料);众数:适用于大样本,较粗糙;(2)离散趋势:极差:优点:简洁明白、简洁使用;缺点:只反映最大值和最小
7、值间的差异,不能反映其他观看值的变异程度;样本容量越大,极差可能越大;极差的抽样误差大,不稳固;四分位数间距: 适用于确定医学参考值范畴, 与中位数一起描述偏态分布资料变异程度;缺点:类似于极差,利用度低;方差与标准差:与均数一起描述对称分布, 特殊是正态分布的分布特点;变异系数:适用于:适用于比较度量衡单位不同资料的变异度;比较均数相差悬殊的资料的变异度;衡量试验精密度和稳固性的常用指标;(3)频数分布特点高峰在中间,左右大致对称,称为对称分布;平均数 =中位数 =众数高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态);平均数 中位数 众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左
8、偏态);平均数 中位数 众数对称分布 正(右 偏态分布 负(左 偏态分布3名师归纳总结 - - - - - - -第 3 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学4. 正态分布图形的特点及意义(1)特点: f (x)关于 x= 对称 x= 时取得最大值 在 x= 处为拐点,且以 x 轴为水平渐近线 f (x)大于 0 P(x=a)=0 如 f x 在点 x 处连续,就 F ( x)=f x(2)意义:fx=1,f ( x)在负无穷到正无穷的积分值为1,即曲线下方面积为1;5. 和2的意义 :位置参数, 当 固定时, 增大,曲线沿横轴向右移动; 减小,曲线沿横
9、轴向左移动; 2:外形参数,当 固定时, 越大,曲线越矮胖; 越小,曲线越高瘦;6. 标准化变换 z=x x N( ,2) z N(0,1) =PZ zx-b= Pa Z b F(x=x = z 即 PXx=x P axb =Fb -Fa= b- a Pa7. 标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标;下角标一样,双侧界值: P |z|z =1- P 2zz = 2 2单侧界值:上限:下限:x 轴上方中间面积一样; P (zz )= P(zz1- )=1- P (zz )=1- P(zz 1- )=4名师归纳总结 - - - - - - -第 4 页,共 22 页精选学习资料
10、- - - - - - - - - 医学统计学8. 正常值范畴及意义概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研究指标有影响的疾病和有关因素的大多数“ 正常人”的相应数值进行比较, 以就诊者的测定值是否超出了大多数 “ 正常人”考,又称医学参考值范畴;意义: 95%的参考值范畴含义是指:样本中有相应指标的波动范畴, 作为临床诊断的重要参95%的个体测定值在所求范畴之内;以 95%的置信区间来说,意义是:该区间以 95%的概率包含了待估量的参数,这种估量的可信度是 95%,会冒 5%的风险;公式: 双侧 95%的界限值: x 1.96s 单侧 95%的上限值:
11、 x +1.645s 单侧 95%的上限值:x-1.645s 第四章 总体均数的估量、假设检验1. 标准误(1)概念:每次样本运算出的x 不同,这些 x的标准差称为均数的标准误;(2)意义:是衡量样本统计量抽样误差大小的统计指标;(3)与标准差的区分:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描述统计量的变异;(4)均数标准误的公式: Sx=s n2. 置信区间(1)定义:设 为总体的未知参数, 如由样本确定的两个统计量 1(x1、x2、 、xn 和 2x 1、 x 2、 、xn ,且 1 2,对于预先给定的值 0 1,如满意 P 150) z 分布单侧:xzs即xzxsn(4
12、)两要素:精确度:由 1- 打算, 1- 越大,精确度越高;精确度:由区间长度打算; 99%置信区间精确度高于95%置信区间; 95%置信区间精确度更高;3. 抽样分布(1)t 分布定义:来自正态总体的一组样本,x 和 s 分别是样本的均数和标准差;就t=xns/ t分布,自由度 df=n-1 ,极限分布是标准正态分布;图形分布特点:以 0 为中心,左右对称的单峰分布;自由度越大,越高瘦6名师归纳总结 - - - - - - -第 6 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学界值:双侧: P|t|t =1- P 2tt = 2 2单侧:上限:下限: P(tt
13、 )=1- P(tt )= P(tt 1- )=1-(2) 2分布 定义:如从均数为 ,标准差 的正态总体中,每次抽取样本含量为 n 的样本,运算 样本标准差 s,就 2=(n-1 )s 2/ 2听从自由度 df=n-1 的 2 分布;图形分布特点:曲线偏向左边 自由度越小曲线越偏 界值:双侧: Px2x 2 = P2 2 =1- P2 2 x 22 x12 =1-2 Px2x 2 x 2x(x2x 1- )=1- 2 P(x 2x2 )=1- P(x2F = 2 P 2FF 12 =1-2FF =1-2 P 2FF )= P(FF1- )=1- P(FF )=1- P(F ,就接受 H 0,
14、拒绝 H1 ; 如 P 时,接受 H0,可能犯类错误( );此时,虽然 未知,但 P 值越大,犯 类错误的概率越小,结论越牢靠;削减(增加) I 型错误,将会增加(削减)II型错误增大 n,可以同时降低两类错误;第五章 方差分析1. 方差分析基本思想目的:依据各个总体的样本观测值, 检验各个总体均值间和两两总体均值间是否存在显著性差异;基本思想:依据离差来源的不同,将总离差平方和分解为两部分:由试验的随机因素(误差)引起的组内离差,由因素的作用(即处理水平不同)引起的组间离差;总离差平方和 = 组内离差平方和 + 组间离差平方和( SST = SSE + SS A)2. 方差分析单因素方差分析
15、、配伍组设计方差分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析 交叉设计方差分析、组内分组设计方差分析9名师归纳总结 - - - - - - -第 9 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学第六章 双变量相关与回来1. 散点图特点正相关完全正相关负相关完全负相关不相关2. 相关系数意义及分类(1)意义:相关系数 r 的大小反映随机变量 如 r=0 ,就 X 与 Y 不相关;X 和 Y 之间线性关系的亲密程度:如 |r|=1,就 X 与 Y 完全相关;相关系数 r 的符号反映随机变量X 和 Y 之间线性关系的相关方向:如 0r1 ,就 X 与 Y
16、 正相关;如 -1r0 ,就 X 与 Y 负相关;(2)分类:积差相关系数:双变量为听从正态分布的计量资料等级相关系数:等级或相对数资料;不听从正态分布;总体分布类型未知;(3)适用范畴:两个变量必需是随机变量,即变量的取值在试验前或测定前是无法预先知道的;10名师归纳总结 - - - - - - -第 10 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学3. 线性相关分析和回来分析的联系与区分(1)联系:r=blxx/lxylxx、l xy分别是 x、y 的标准差方向一样, r 与 b 方向一样r 与 b 的假设检验等价,即同一样本存在:t r =t b 回来强
17、度与相关强度: R 2=SS回/SS 总=r(2)区分:资料相关: x,y 必需是随机变量2 (仅限型回来)回来: x 是确定变量称型回来, y 必需是随机变量 x 是随机变量称型回来计量单位: r 不受单位影响, b 受单位影响意义:相关说明相关关系,相关关系描述变量间关系的亲密程度与方向;回来说明依存关系,回来方程描述变量间的数量依存关系;取值范畴: |r| 1,b R 4. 最小二乘法把观测点 xi , yi 标在直角坐标系下作成散点图,就必存在着一条直线,使每个点 xi , yi 距这条直线在纵方向上的距离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法;5. 打算系数的意义
18、R 2=SS回/SS 总=(SS总-SS 剩)/SS 总=(1-SS 剩)/SS 总 0 R 2 1,R 2 越接近于 1,表示回来平方和在总平方和中所占的比重越大,回来成效越好;11名师归纳总结 - - - - - - -第 11 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学第七章 两分类资料的统计描述与推断1. 相对数指标两个有联系的指标之比;常用的有率和比 构成比、相对比 ;(1)率:频率,说明某现象发生的频率和强度;总体率: ,样本率: p ;率某现象实际发生的例数数K可能发生该现象的总例(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布;构成
19、比某一组成部分的观看单位数100%A是 B的如干倍或百分之几;同一事物各组成部分观察单位总数(3)相对比:两个有关指标A、B 之比,说明两者的对比水平,对比的数值可以是肯定数、相对数或平均数;第八章 R C表资料的分析1. 列联表分类及统计方法(1)双向无序:多个样本率或构成比比较2检验(2)单向有序:分组变量有序 2检验 同双向无序 结果变量有序秩和检验或 Ridit 分析(3)双向有序:属性相同 McNemar、Kappa检验属性不同秩相关分析、线性趋势检验、秩和检验或Ridit分析2. 列联表留意事项(1)R C表中不宜有 20%以上的格子的 T5,不能有 T , 接受 H0,听从正态;
20、 sig , 接受 H1,不听从正态;2. 方差齐性检验(1)目的:利用样本信息推断总体方差是否相等(2)前提:正态分布(3)过程:建立假设:假设 H0:2 1=2 2即方差齐; H1:2 12 2;运算统计量:F2 s 12 s 2/2=2 s 1 df 2 s 21=n1-1 df2=n2-1 1/22P值: F ,接受 H0 FF df1,df 2)就 P , 接受 H0,满意方差齐性; sig , 接受 H1,不满意方差齐性;3. 单样本 t 检验(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异;(2)前提:单组设计 计量资料(非分类)资料听从正态分布(3)过程:建立假设:
21、假设 H0: =0 ;H1: 0;运算统计量: zxn或 t= xn/s/P值: z ,接受 H0 zz df1, 就 P , 接受 H0,差异无统计学意义; sig , 接受 H1,差异有统计学意义;14名师归纳总结 - - - - - - -第 14 页,共 22 页精选学习资料 - - - - - - - - - 医学统计学4. 配对 t 检验(1)目的:推断两组样本代表的总体均数的差值是否为零;(2)前提:配对设计计量资料(非分类)差值听从正态分布(3)过程:建立假设:假设 H0:d=0 ;H1:d 0; df 1,就 P ,拒绝 H0 运算统计量: t=dn df=n-1 sd /P
22、值: t ,接受 H0 ,ttt ,接受 H0 ,t t 2 df 1,就 P , 接受 H0,差异无统计学意义; sig2, 12); 运算统计量: t 或 t 方差不齐) df=n 1+n2-2 P值: t ,接受 H0 ,tt df 1,df 2),就 P ,拒绝 H0 t ,接受 H0 ,t t 2 df 1,df 2),就 P , 接受 H0,差异无统计学意义; sig ,接受 H0 ,P , 接受 H0,差异无统计学意义; sigFk-1,N-k, 组内SSEN-kMS E=SSE/N-k P 总和SSTN-1(5)留意:组内变异:随机误差 组间变异:随机误差 +处理因素 如 H0
23、成立:组内变异组间变异 如 H1成立:组内变异 ,接受 H0 ,P , 接受 H0,差异无统计学意义; sig ,接受 H0 ,P , 接受 H0,差异无统计学意义; sigr 时, P ,拒绝 H0 ,认为有直线相关关系;当|r| ,接受 H0 ,认为没有直线相关关系;依据 r ,df=n-2 检验 是否为 0 假设 H0:总体相关系数 =0,即无关系; H1:总体相关系数 0,即有关系; 结合专业学问评判相关分析是否有价值 P 值: P ,接受 H0 ,P ,拒绝 H0 ,P , 接受 H0,无直线相关关系; sig , 接受 H1,有直线相关关系;10. 线性回来分析(1)目的:就是查找出具有相关关系变量之间的函数关系,并进行统计推断;(2)前提: y 必需是随机变量(3)过程 : 运算反映两个变量依靠关系的直线回来方程,即运算方程的截距a,斜率 b;y.abx意义: x 每增加 1,y 增加 a+bx nb .i1x ix y i2y a.ybxnx ix i1依据截距 a,斜率 b,检验样本所抽自的总体截距 做法 1:直接查相关系数的临界值表 是否为 0,总体斜率 是否为 0;
限制150内