2022年医学统计学知识点.docx
《2022年医学统计学知识点.docx》由会员分享,可在线阅读,更多相关《2022年医学统计学知识点.docx(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 第一章 绪论1、统计学 ,是关于数据收集、整理、分析、表达和说明的普遍原理和方法;2、讨论对象 :具有不确定性结果的事物;3、统计学作用 :能够透过偶然现象来探测其规律性,使讨论结论具有科学性;4、统计分析要点 :正确选用统计分析方法,结合专业学问作出科学的结论;5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断;6、医学统计学中的基本概念 1 同质与变异 同质,指依据讨论目的所确定的观看单位其性质应大致相同;变异,指总体内的个体间存在的、确定的差异;统计学通过对变异的讨论来探究事物;2 变量与数据类型 变量 ,是反映试验或观看对象
2、生理、生化、解剖等特点的指标;变量的观测值,称为 数据 分为三种类型:定量数据 ,也称 计量资料 ,指对每个观看单位某个变量用 测量 或其他定量 方法精确获得的定量结果;(如身高、体重、血压、温度等)定 性 数据 ,也称 计数资料 ,指将观看单位按某种属性分组 计数 的定性观看结果;包括二分类、无序多分类;(进一步分为二分类和多分类,如性别分为男和女,血型分为 A、B、O、A B 等),指将观看单位按某种属性的不同程度或次序分成 有序数据 ,也称 半定量数据或等级资料 等级 后分组计数的观看结果,具有半定量性质;统计方法的选用与数据类型有亲密的关系;(3)总体与样本总体,指依据讨论目的确定的全
3、部 值;同质 观看单位的全体,包括全部定义范畴内的个体变量样本,是从讨论总体中随机抽取部分有代表性的观看单位,对变量进行观测得到的数据;抽样,是从讨论总体中随机抽取部分有代表性的观看单位;参数,指描述 总体特点 的指标;统计量,指描述 样本特点 的指标;(4)误差 误差,指观测值与真实值、统计量与参数之间的差别;可分为三种:系统误差,也称统计偏倚,是某种必定因素所致,不是偶然机遇造成的,误 差的大小通常恒定,具有明确的方向性;随机测量误差,是偶然机遇所致, 误差没有固定的大小和方向;抽样误差,是抽样引起的统计量与参数间的差异;抽样误差主要来源于个体的变异;统计学主要讨论抽样误差;(5)概率 概
4、率,是描述某大事发生可能性大小的量度;必定大事,大事确定发生,概率 PU1;随机大事,大事可能发生,可能不发生,概率介于 0PA 1 不行能大事,大事确定不发生,概率 P 0;小概率大事,大事发生的可能性很小,概率PA 0.05、或 PA 0.01;名师归纳总结 - - - - - - -第 1 页,共 18 页精选学习资料 - - - - - - - - - 医学科研中,PA0.05作为事物差别有统计意义,PA 0.01 作为事物差别有高度统计意义;其次章 定量数据的统计描述 定量数据的统计描述方法:频数表、直方图、统计指标;(1)频数分布 频数分布的目的:明白数据的分布范畴、集中位置以及分
5、布外形等特点,以便依据资料分 布情形挑选合适的统计方法;频数分布的用途:作为陈述资料的形式;便于观看数据的分布类型;便于发觉数据中特大或特小的可疑值;当样本量大时,可用各组段的频率作为概率的估量值;运算全距( range,R): 是一组数据的最大值与最小值之差;RMax-Min 确定组数与组距样本量在 100 例左右,组数挑选815 之间,一般取10 组左右;组距 全距 /组数 确定组限 第一组段必需包括最小值,最终一组段必需包括最大值;最终一组段包括最大值,且一般情形下应包含该组段上限,其余各组段区间左闭右开;运算各组段频数(frequency): 即运算各组段内观看值的个数;运算各组段频率
6、(percent): 即运算各组段频数与总观看值个数之比,用百分数表示;运算累计频数(cumulative frequency)和累计频率(cumulative percent):累计频数 是由上至下将频数累加;(2)直方图累计频率 是由上至下将频率累加;直方图, 是以垂直条段代表频数分布的一种图形;(3)频数分布表的用途1、作为称述资料的形式,可以代替原始资料,便于进一步分析;2、便于观看数据的分布类型;资料分布类型分为:对称分布和偏态分布;在统计分析经常需要依据资料的分布形式挑选相应的统计分析方法,因此对数据分布形式 的判定特别重要;3、便于发觉资料中某些远离群体的特大或特小值;4、当样本
7、含量比较大时,可用各组段的频率作为概率的估量值;集中趋势的统计指标 平均数, 是描述一组观看值集中位置或平均水平的统计指标,常作为一组数据的代表值用 于分析和进行组间的比较;常用的有算术均数、几何均数、中位数、百分位数等;算术均数, 等于一个变量全部观看值的和除以观看值个数;总体均数用希腊字母 表示,样本均数用符号 拔 表示;算术均数 适用于 对称分布的资料,如分布匀称的小样本数据或近似正态分布的大样本数据;算术均数易受极端值的影响,并且受极大值的影响大于受微小值的影响;几何均数几何均数( geometric mean,G), 等于一个变量全部n 个观看值的乘积的n 次方根;几何均数适用于取对
8、数后近似呈对称分布的资料,特殊是右偏态分布数据;医学讨论中常名师归纳总结 - - - - - - -第 2 页,共 18 页精选学习资料 - - - - - - - - - 用于比例数据;【注】运算几何均数的观看值不能小于或等于 0,由于无法求对数;中位数 中位数( median,M), 是在按大小次序排列的变量的全部观看值中,位于正中间的一个 或两个数值;当数据呈偏态分布、或频数分布两端无确定数值,均宜采纳中位数描述集中趋势;中位数的确定取决于它在数据序列中的位置,因此对极端值不敏锐;百分位数 百分位数( percentile), 是一个位置指标,它将一组变量值排列后划分为如干相等部分的分割
9、点数值;用Px 表示, X 用百分数表示;X %,其右侧( 表示在依据升序排列的数据中,其左侧( Px )的观看值个数在整个样本中所占百分比为Px )的观看值个数在整个样本中所占百分比为100X % ;百分位数不论资料分布类型均可运算,在实际工作中常用于确定医学参考值范畴;在假设 检验中用作拒绝或不拒绝检验假设的界值;百分位数并非由全部观看值综合运算得来,因此,它不如均数和标准差精确;然而中间部 分的百分位数因不受资料中个别极端数据的影响,具有较好的稳固性;小 结指 标意 义适用场合均 数个体的平均值对称分布,特殊是正态分布资料;几何均数平均倍数取对数后对称分布;中位数位次居中的观看值非对称分
10、布;半定量资料;末端无准确数值;分布不明;变异程度的统计指标 变异指标,又称离散指标,用以描述一组计量资料各观看值之间参差不齐的程度;变异指标越大,观看值之间差异愈大,说明变异程度越大;反之亦然;常用的有极差、四分位数间距、方差、标准差和变异系数;极 差 极差( range,R),等于一个变量全部观看值中最大值与最小值之间的差值;R Max Min 缺点:没有利用观看值的全部信息,不能反映其它数据的离散度;各样本含量大小悬殊时,不宜比较其极差;极差的抽样误差也较大,所以不够稳固;极差仅适用于对未知分布的小样本资料作粗略的分析;四分位数间距四分位数, 是统计学对特殊的三个百分位数P25% 、 P
11、50% 和 P75%的统称四分位数间距(quartile range ,Q), 等于第三四分位数与第一四分位数之间的差值;Q P75% P25% 名师归纳总结 - - - - - - -第 3 页,共 18 页精选学习资料 - - - - - - - - - 缺点:没有利用观看值的全部信息,不能反映其它数据的离散度;四分位数间距仅用来描述大样本偏态资料的变异情形;方 差 方差( variance), 是描述一个变量的全部观看值与总体均数的平均离散程度的指标;总体方差用 2表示,样本方差用S2 表示;标准差标准差( standard deviation,S ),是描述一个变量的全部观看值与均数的
12、平均离散程度的指标;总体标准差用 表示,样本标准差用S 表示;标准差 方差或标准差属同类变异指标,它们多用来描述匀称分布或近似正态分布的资料,大、小 样本均可,其中以标准差的应用最广,通常与均数结合使用;比如在很多医学讨论报告中 常用 X 拔S 的形式表达资料;变异系数变异系数( coefficient of variation,CV ),是一个度量相对离散程度的指标;CV 是无量纲的指标,可以用来比较几个量纲不同的指标变量之间的离散程度的差异,或 比较量纲相同但均数相差悬殊的变量之间的离散程度的差异;小 结指 标意 义适用场合极 差观看值的取值范畴不拘分布形式,概略分析;四分位数居中半数观看
13、值的极差非对称分布;半定量资料;间距观看值距离均数的平均程度末端无准确数值;分布不明;标准差对称分布,特殊是正态分布资料;(方差)变异系数变异程度大小的对比不同量纲的变量间比较;量纲相同但数量级相差悬殊的变 量间比较;第三章 正态分布与医学参考值范畴 正态分布, 是一种连续型随机变量常见而重要的分布;正态曲线 ,是一条高峰位于中心,两侧逐步下降并完全对称,曲线两端永久不与横轴相交 的钟型曲线;假如随机变量X 的分布听从概率密度函数和概率分布函数称连续型随机变量X 听从正态分布,记为 XN , 2 为圆周率,e 为自然对数的底值, 为总体标准差, 为总体均数;正态分布的特点名师归纳总结 - -
14、- - - - -第 4 页,共 18 页精选学习资料 - - - - - - - - - 1、正态分布是单峰分布,以 X = 为中心,左右完全对称,正态曲线以 X 轴为渐近线,两端与 X 轴不相交;2、正态曲线在 X = 处有最大值,其值为f =1/ 2 ;X 越远离 ,fX 值越小,在 X= 处有拐点,出现钟形;3、正态分布完全由参数 和 打算; 是位置参数,打算正态曲线在 X 轴上的位置;在 肯定时, 增大,曲线沿横轴向右移动; 较小,曲线沿横轴向左移动; 是外形参数,打算正态曲线的分布外形; 越大,曲线的外形越“ 矮胖 ” ,表示数据分布越分散; 越小,曲线的外形越“瘦高 ”,表示数据
15、分布越集中;正态曲线下面积分布规律1、听从正态分布的随机变量在某一区间上的曲线下面积与其在同一区间上取值的概率相等;2、曲线下的总面积为1或100%,以为中心左右两侧面积各占50%,越靠近 处曲线下面积越大,两边逐步削减;3、全部的正态曲线,在 左右的任意个标准差范畴内面积相同;一些特殊情形,在 范畴内的面积约为 68.27%,在 1.96 范畴内的面积约为 95.00%,在 2.58 范畴内的面积约为 99.00%;标准正态分布对任意一个听从 N , 2 分布的随机变量 X ,经 Z=X- / 变换都可以转为 =0、 =1的标准正态分布,也称随机变量的标准化变换;标准正态分布的应用实际应用中
16、,经 z 变换可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分布曲线下相应面积的问题;正态分布的应用1、制定医学参考值范畴2、质量掌握3、正态分布是很多统计方法的理论基础医学参考值范畴医学参考值范畴,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范畴;医学参考值范畴,习惯上是包含 95%的参照总体的范畴;制订的留意事项a、抽取足够例数的同质“ 正常人 ” 样本“正常人 ”的定义,样本量(n120),随机化;b、确定具有实际意义的统一测量标准指标的测量方法等要有规定,掌握测量误差;c、依据指标的性质确定是否要分组依据实际情形、专业学问;d、依据指标含义打算单、双侧
17、范畴单侧下限,过低反常;单侧上限,过高反常;双侧,过高、过低均反常;e、挑选适当的百分范畴绝大多数人,一般 80%、90%、95%、99%;削减误诊,取较大范畴;削减漏诊,取较小范畴;f、估量参考值范畴名师归纳总结 - - - - - - -第 5 页,共 18 页精选学习资料 - - - - - - - - - 依据资料分布类型:正态分布法、百分位数法;第四章 定性数据的统计描述 相对数 ,是两个有关的确定数之比,也可以是两个统计指标之比;运算相对数的意义 主要是把基数化作相等,便于相互比较;相对数 主要用于 定性资料的统计描述;常用的指标有频率、构成比、相对比;频 率 频率 (rate),
18、表示在肯定范畴内某现象的发生数与可能发生的总数之比,说明某现象显现 的频率或概率;总体率 用 来表示, 样本率 用 P 来表示;需要留意的是,率在更多情形下是一个具有时间概念的指标,即用于说明在一段时间内某 现象发生的强度或频率;构成比 构成比, 表示某事物内部各组成部分在整体中所占的比重;构成比之和应为 100,某一构成部分的增减会影响其他构成部分相应的削减或增加;而 某一部分率的变化并不影响其他部分率的变化,且其平均率不能简洁地将各率相加后平均 求得;相对比 相对比 ,是 A、B 两个有关联指标之比,用以描述两者的对比水平;相对危急度( relative risk ,RR), 用于流行病学
19、中队列讨论资料;比数比( odds ratio,OR ),用于流行病学中病例对比讨论资料;小 结指 标运算公式适用场合频率n/N估量总体中某一结局发生的概率或可能性构成比n1/N,n2/N, ,nk/N估量总体中全部可能结局所占的比例或比重相对比A/B估量两个指标的相对大小构成比表示某事物内部各部分所占的比例或比重,频率是说明某现象发生的频率或概率;构成比的分子中的个体肯定是分母中的一部分,而相对比就不肯定;构成比是同一类事物 的数值之比,相对比可以是任意两个数值之比;相对数的使用留意 a、区分构成比和频率频率,强度相对数;构成比,结构相对数;b、使用相对数时分母不宜过小“ 3例中死亡例 ”
20、;如分母太小,用确定数表示,如 c、留意相对数的可比性讨论对象要同质,方法要相同,观看时期要一样等;d、考虑存在抽样误差对总体进行推断应作统计学检验;率的标准化 标准化率, 是为了在比较两个不同人群的患病率、发病率、死亡率等资料时,排除内部构 成(如年龄、性别、工龄、病程长短等)不同而不能直接比较所产生的影响;标准化率仅用于相互比较,不代表实际水平;当标准构成不同时,标准化率一般也不相同名师归纳总结 - - - - - - -第 6 页,共 18 页精选学习资料 - - - - - - - - - ;标准构成的选取从外部取一个公认的标准构成比,如全国范畴或全省范畴的数据、国际间比较时取世界 通
21、用标准;将几个组的观看例数合并,运算出合并的构成比,以其作为标准构成比;取某一个组的构成比为标准构成比;医学中常用相对数指标 表示某年某地每千人中的死亡人数;反映当地居民总体死亡水平 死亡率,又称粗死亡率,;对不同地区的死亡率进行比较时,应留意不同地区人口年龄或性别构成的影响;如年龄或 性别构成存在差异,需先将死亡率标化后再进行比较;年龄别死亡率,表示某年某地某年龄组每千人口中的死亡数;10 万人中因某种疾病死亡的人数;反映各类病伤死亡对居 死因别死亡率,表示某年某地每 民生命的危害程度;死亡 因构成,也称相对死亡比,比;反映各种死因的相对重要性;表示全部死亡人数中,死于某死因者占总死亡数的百
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 医学 统计学 知识点
限制150内