循证医学实践中常用统计学方法.ppt
《循证医学实践中常用统计学方法.ppt》由会员分享,可在线阅读,更多相关《循证医学实践中常用统计学方法.ppt(101页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 循证医学实践中常用统计方法(Statistical methods commonly used in the practice of evidence-based medicine)循证医学循证医学 Evidence-Based Medicine作者单位作者单位 中南大学中南大学 长沙医学院长沙医学院作者姓名作者姓名 王乐三王乐三 欧阳江欧阳江目 录第一节第一节 概概 述述1第第二二节 常用常用统计方法方法23第第三三节 统计方法常方法常见错误及辨析及辨析教学要求:教学要求:1.1.掌握医学统计的基本概念;掌握医学统计的基本概念;2.2.熟悉医学统计学的基本内容;熟悉医学统计学的基本内
2、容;3.3.了解多变量资料统计分析方法及选择思路。了解多变量资料统计分析方法及选择思路。【案案 例例】某作者比某作者比较腹腔腹腔镜胰十二指胰十二指肠切除切除术与与传统开腹手开腹手术行胰十二指行胰十二指肠切除切除术的近期的近期临床床疗效和安全性,效和安全性,结局局指指标有:手有:手术时间;术中出血量;是否再次手中出血量;是否再次手术;住住院院时间;是否是否围手手术期死亡;期死亡;是否有胰漏是否有胰漏发生、切生、切口感染、延口感染、延迟性胃排空等。有关的性胃排空等。有关的结局指局指标涉及的涉及的统计资料料类型有哪些?有关的参数估型有哪些?有关的参数估计和假和假设检验方法有哪方法有哪些?些?5第一节
3、第一节 概概 述述1234医学统计学定义医学统计学定义基本概念基本概念统计资料常见类型统计资料常见类型小结思考小结思考6l若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。Florence Nightingale 1820一1910What is Statistics?什么是统计学?什么是统计学?7天气预报天气预报无处不在的统计学无处不在的统计学8人类学人类学文学文学经济学经济学史学史学地理学地理学物理学物理学社会学社会学农学农学生物学生物学医学医学药学药学中医学中医学气象学气象学法学法学医学统计学医学统计学MedicalStatistics卫生统计学卫生统计学Health
4、Statistics生物统计学生物统计学Biostatistics科研中的统计学vWebsters International Dictionary:A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”vJohn M.Last,A Dictionary of Epidemiology:The science and art of dealing with variation in data through collection,cla
5、ssification,and analysis in such a way as to obtain reliable results”10医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。医学统计学医学统计学(Medical Statistics)(Medical Statistics)医学统计学的定义医学统计学的定义11医学研究的基本内容1.1.医学科研的统计设计医学科研的统计设计2.2.资料分析资料分析假设假设搜集、整理、分析数据搜集、整理、分析数据v调查设计v实验设计l统计描述:统计指标l统计推断:参数估计、假设检验医
6、学统计学的应用医学统计学的应用12n 以正确的方式收集资料n 描述资料的统计特征n 统计推断及得出正确结论13一、一些重要概念一、一些重要概念v同质和异质同质和异质v变异变异v总体和个体总体和个体v参数和统计量参数和统计量v随机随机v概率和频率概率和频率v小概率事件和小概率原理小概率事件和小概率原理v抽样误差抽样误差14基本概念之一:同质和异质基本概念之一:同质和异质l同质(homogeneity):性质相同l异质(heterogeneity):性质不同同质和异质是相对的概念同质和异质是相对的概念不同质的个体不能笼统地混在一起分析不同质的个体不能笼统地混在一起分析个体的同质性是构成研究总体的必
7、备条件个体的同质性是构成研究总体的必备条件研究内容研究内容(指标指标/变量变量)不同,对同质性的要求不同不同,对同质性的要求不同15在研究事物的形状时同质和异质示例同质和异质示例在研究事物的颜色时16基本概念之二:变异基本概念之二:变异 v同质事物之间的差别称为同质事物之间的差别称为变异变异(Variation)v变异的两个方面:变异的两个方面:不同观察单位(个体)间的差别不同观察单位(个体)间的差别同一个体在不同阶段的差别(重复测量)同一个体在不同阶段的差别(重复测量)17变异示例变异示例发热者体温波动正常人体温波动18基本概念之二:变异基本概念之二:变异v同质个体间的差异。同质个体间的差异
8、。v结果是随机的,不可预测的。结果是随机的,不可预测的。v一种或多种不可控因素一种或多种不可控因素(已知的或未知的已知的或未知的)作用下的综合表现。作用下的综合表现。v个体变异是普遍存在的。个体变异是普遍存在的。v个体变异是有规律的。个体变异是有规律的。v没有个体变异,就没有统计学!没有个体变异,就没有统计学!19基本概念之三:总体、个体和样本基本概念之三:总体、个体和样本 v总总体体(population):按按研研究究目目的的所所确确定定的的同同质质研研究究对对象象某某项项观观察察指指标标的的全全体体,即即全体观察单位。全体观察单位。有限总体有限总体(finite)无限总体无限总体(inf
9、inite)v个个体体(individual):是是构构成成总总体体的的最最基基本本观察单位;观察单位;v样样本本(randomsample):从从研研究究总总体体中中随随机抽取具有代表性的部分观察单位。机抽取具有代表性的部分观察单位。代表性,包含了总体的特性代表性,包含了总体的特性为什么要抽样?为什么要抽样?20基本概念之四:参数和统计量基本概念之四:参数和统计量 l总体参数总体参数(parameter):刻画总体特征的指标;刻画总体特征的指标;一般用希腊字母表示,如:一般用希腊字母表示,如:、pl统计量统计量(statistic):样本统计指标样本统计指标一般用拉丁字母表示,如:一般用拉丁
10、字母表示,如:、s、pl在在总总体体被被确确定定之之后后,总总体体参参数数就就是是一一个个常常数数,是是不不会会变变化化的的,不不管管你你是是否否确确切切知知其其大大小小;而而统计量是几乎总是随着样本而变的。统计量是几乎总是随着样本而变的。21基本概念之五:随机基本概念之五:随机v随机随机(random):):是指机会均等,无主观影响,目是指机会均等,无主观影响,目的是保证样本对总体的代表性、可靠性。的是保证样本对总体的代表性、可靠性。机会均等,无主观影响机会均等,无主观影响抽样随机抽样随机(randomsampling)有相同的机会被抽到有相同的机会被抽到分组随机分组随机(randomall
11、ocation)有相同的机会被分到不同的组中有相同的机会被分到不同的组中顺序随机顺序随机(randomorder)有相同的机会先后接受处理有相同的机会先后接受处理22基本概念之六:频率和概率基本概念之六:频率和概率v频率频率Relativefrequency:在在n次随机试验中,次随机试验中,事件事件A发生了发生了m次,则比值次,则比值称为事件称为事件A在这在这n次试验中出现的次试验中出现的频率频率23基本概念之六:频率和概率基本概念之六:频率和概率抛硬币试验在概率的统计学定义上的诠释抛硬币试验在概率的统计学定义上的诠释试验者试验者投掷次数投掷次数出现出现“正面正面”次数次数频率频率XXX20
12、120.6000Buffon404020480.5069DeMorgan409220480.5005Fisher1000049790.4979K.Pearson1200060190.5016K.Pearson24000120120.500524基本概念之六:频率和概率基本概念之六:频率和概率v概率的统计学定义:概率的统计学定义:数理统计学中的大数定理表明:当观察次数数理统计学中的大数定理表明:当观察次数n越来越大,越来越大,频率频率f 的随机波动幅度越来越小,并最终趋向于一个常数的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件:随机事件A发生的发生的概率概率(Probability)。
13、v概率概率描述事件发生可能性大小的一个度量描述事件发生可能性大小的一个度量。是一种参数。是一种参数。常用常用P来表示;来表示;0P 125基本概念之七:小概率事件v小概率事件小概率事件(rareevent)当某事件发生的概率很小当某事件发生的概率很小(可能性很小可能性很小),统计学上称该事件为小概率,统计学上称该事件为小概率事件。事件。医学上:小于或等于医学上:小于或等于0.050.05v小概率原理小概率原理小小概概率率事事件件并并不不表表示示不不可可能能发发生生,但但在在某某一一次次试试验验中中,可可认认为为是是不不会会发生的。发生的。26v误差误差(error)指实际观察值与观察真值之差、
14、样本指标指实际观察值与观察真值之差、样本指标与总体指标之差。与总体指标之差。基本概念之八:抽样误差基本概念之八:抽样误差 误差分类产生原因对观察值的影响处理方法系统误差仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等。使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。通过实验设计的完善和技术措施的改进来消除或减少。随机误差排除系统误差后,其他多种不确定因素。使观察值不按方向性、系统性而随机的变化,误差变量一般服从正态分布。可通过统计处理估计随机误差。27二、统计资料常见类型 在在医医学学研研究究中中,根根据据研研究究目目的的的的要要求求对对一一些些观观察察项项
15、目目或或研研究究指指标标在在一一些些研研究究对对象象中中进进行行观观察察(或或测测量量),由由于于这这些些指指标标存存在在着着变变异异,故故把把这这些些观观察察项项目目或或研研究究指指标标称称为为随随机机变变量量,简简称称变变量量(variable),而而观观察察结结果果对对应应的的取取值值称为称为变量值或观察值变量值或观察值。28v按照取值的特性:数值变量 Numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的分类变量 Categorical Variable:取值是是分散、定性的,表现为互不相容的类别和属性无序
16、分类 Unordered Categorical定性变量:无顺序,无间隔,仅有分类二项分类多项分类有序分类 Ordered Categorical 等级变量:仅有顺序,无单位;取值间的差异是不可度量的29资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人
17、5.2430v不同分类的互相转化不同分类的互相转化 定量资料(数值变量)定量资料(数值变量)定性资料(无序分类变定性资料(无序分类变量)量)定量资料(数值变量)定量资料(数值变量)等级资料(有序分类变等级资料(有序分类变量)量)等级资料(有序分类变量)等级资料(有序分类变量)定性资料(无序分定性资料(无序分类变量)类变量)信息量只有减少,不可增加信息量只有减少,不可增加31基本概念汇总基本概念汇总总体个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险32总结总结l基本概念:基本概念:统计学,统计学研究的步骤统计学,统计学研究的步骤统计资料的分类统计资料的分类同质
18、、变异同质、变异总体、个体、样本总体参数、样本统计量、样本含量总体、个体、样本总体参数、样本统计量、样本含量随机随机概率、小概率事件、小概率原理概率、小概率事件、小概率原理抽样误差抽样误差变量的分类变量的分类33第二节第二节 常用统计方法常用统计方法1234分类变量资料常用统计方法分类变量资料常用统计方法数值变量资料常用统计方法数值变量资料常用统计方法常用统计方法的选择常用统计方法的选择思考题思考题34l描描述述性性统统计计分分析析:以以统统计计表表、统统计计图图统统计计指指标标(如如均均数数、标标准准差差等等)对对资资料料的的数数量量特特征征及及其其分分布布规规律律进行测定和描述。进行测定和
19、描述。l推推断断性性统统计计分分析析:如如何何由由样样本本信信息息推推断断总总体体特特征征的的问题。问题。参数估计:区间估计(参数估计:区间估计(95%CI)假设检验:假设检验:t,F,z检验等检验等基本统计分析方法基本统计分析方法35一、分类变量资料常用统计方法一、分类变量资料常用统计方法1.1.分类变量资料的统计描述分类变量资料的统计描述数据形式数据形式绝对数绝对数相对数相对数比、比例、率比、比例、率36比比(ratio)(ratio)两者的相对水平两者的相对水平分子分子不必包含不必包含在分母里在分母里可以比较不同属性的事件或状态可以比较不同属性的事件或状态=5/2 =2.5/137构成比
20、构成比(proportion)(proportion)某一事物内部各组成部分所占的比重某一事物内部各组成部分所占的比重分子分子必须包含必须包含在分母里在分母里比较的必须是同一属性的事件或状态比较的必须是同一属性的事件或状态波动范围只能是波动范围只能是0 01 12-=0.5=50%4率率(rate)(rate)38描述特定时间里某事件发生的速度描述特定时间里某事件发生的速度分子:分子:特定时间里观察的特定时间里观察的新发事件数新发事件数分母:分母:事件发生的人群基数事件发生的人群基数 (危险人口)危险人口)2-=0.02/year 100Observed in 199839n防止概念混淆防止概
21、念混淆n计算相对数时分母应有足够数量计算相对数时分母应有足够数量 n正确地合并估计频率正确地合并估计频率(或强度或强度)型指标型指标 n相相对对数数间间的的比比较较要要具具备备可可比比性性:观观察察的的对对象象是是否否同同质质,研研究究的的方方法法(如如检检测测手手段段、抽抽样样方方法法)是是否否相相同同,观观察察的的时时间间是是否否一一致致等等;被被比比较较的的总总体体是否具有可比性是否具有可比性 n对相对数的统计推断对相对数的统计推断 应用相对数应注意的事项应用相对数应注意的事项402.2.分类变量资料的统计推断分类变量资料的统计推断参数估计:参数估计:点估计点估计 区间估计区间估计假设检
22、验:假设检验:检验、检验、u u检验检验 非参数检验非参数检验 无序分类资料统计方法无序分类资料统计方法41比较目的比较目的 应用条件应用条件统计方法统计方法样本与总体检验样本与总体检验np5,n(1-P)5二项分布二项分布u检验检验n很小很小二项分布直接法二项分布直接法两样本比较检验两样本比较检验np5,n(1-P)5二项分布二项分布u检验检验n40,T5四格表四格表 检验检验n40,1T40配对配对检验检验b+c1,1T5的格的格子数超过子数超过1/5列联表列联表检验检验T1四格表确切概率法四格表确切概率法等级资料统计方法等级资料统计方法42比较目的比较目的 统计方法统计方法配对等级资料配
23、对等级资料Wilcoxon单样本秩和检验单样本秩和检验两独立样本等级资料两独立样本等级资料Wilcoxon两样本秩和检验两样本秩和检验多组独立样本等级资料多组独立样本等级资料Kruskal-Wallis秩和检验秩和检验单变量计数资料的统计方法选择思路单变量计数资料的统计方法选择思路4344二、数值变量资料常用统计方法二、数值变量资料常用统计方法1.1.数值变量资料的统计描述数值变量资料的统计描述集中趋势和离散趋势124132140148156164010203040人数身高(cm)45n 集中趋势的描述集中趋势的描述 即即大大多多数数数数值值落落在在什什么么位位置置上上。(针针对对一一个个变量
24、的若干个数值)变量的若干个数值)1.1.算术均数(均数)算术均数(均数)2.2.几何均数几何均数3.3.中位数中位数46算术均数(均数)算术均数(均数)l意义:一组性质相同的观察值在数量上的平均水平。意义:一组性质相同的观察值在数量上的平均水平。l表示表示 (总体)(总体)X X(样本)样本)l特征:特征:(X(X-X)=0X)=0l应用:正态分布或近似正态分布应用:正态分布或近似正态分布l注意:合理分组,才能求均数,否则没有意义。注意:合理分组,才能求均数,否则没有意义。47几何均数几何均数l意意义义:N N个个数数值值的的乘乘积积开开N N次次方方即即为为这这N N个个数数的的几几何何均数
25、。均数。l表示:表示:G Gl应应用用:原原始始数数据据分分布布不不对对称称,经经对对数数转转换换后后呈呈对对称称分分布布的的资资料料。数数值值范范围围跨跨越越多多个个数数量量级级。例例如如抗抗体体滴度。滴度。48中位数、百分位数中位数、百分位数l意意义义:将将一一组组观观察察值值从从小小到到大大排排序序后后,居居于于中中间间位位置的那个值或两个中间值的平均值。(身高排队)置的那个值或两个中间值的平均值。(身高排队)l表示:表示:M M、PXPXl百百分分位位数数:将将N N个个观观察察值值从从小小到到大大依依次次排排列列,再再分分成成100100等等份份,对对应应于于X%X%位位的的数数值值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 实践 常用 统计学 方法
限制150内