统计学方法的分类和选择.ppt
1,2,在阅读生物医学杂志论文时,不难发现如下的现象:只要结果是定量资料,人们普遍运用“t 检验”、“单因素方差分析”或“秩和检验”来处理。 事实上,在人们用前述方法处理的定量资料中,有相当多的定量资料同时受到多个因素(通常包括实验因素和重要的非实验因素)的影响,即定量资料来自某种特定的多因素实验设计类型。这种用单因素设计定量资料的统计分析方法处理原本属于多因素实验设计的定量资料,其结论的可信度大为降低,有时,甚至会不可避免地得出错误的结论。 同理,结果为定性资料时,很多人不管结果变量的具体情况,也不管原因变量有多少个,甚至不管统计分析的目的是什么,一律盲目套用2 检验。在采用其他统计分析方法时,也存在盲目套用的问题。正因如此,使得我国乃至全世界生物医学杂志论文的质量令人担忧(错误率平均约为80%),大大降低了科研工作的科学性和严谨性。,3,4,5,配对设计,6,7,8,9,10,11,12,13,数值变量,正态性检验,正态,数据转换,非正态,参数检验,非参数检验,14,分类变量,单因素分析,多因素分析,15,数据的转换,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,实例及解析,41,如何正确区分资料类型,42,一项研究在完成了设立对照、随机分组和样本大小估计等实验设计工作后,接下来就是收集资料。在医学论文中一些统计描述和统计分析方法的误用中,不能够正确区分统计资料类型是一个重要原因。,43,计量资料最为多见。统计上将计量资料又划分为正态分布资料、偏态分布资料等类型。对于偏态分布资料,统计指标不宜用平均数、标准差,而应用中位数、几何均数、四分位间距离等。 统计资料类型的判断失误是医学论文中统计误用的根源之一。常见的问题有:不能正确区分资料类型;计数资料比、率不分;计量资料不管是否正态分布,一律计算均数、标准差;等级资料当做分类资料,配对资料和成组资料混淆等。,统计资料类型,44,表4-1是统计数据库所要求的数据记录格式。各种试验和调查的原始记录,无论数据是否录入计算机,都应该按表4-1的格式整理。整理后的数据包括4种类型的变量:标识变量,如动物编号、姓名等;干预变量,即试验性研究的处理因素,或观察性研究的危险因素;协变量,即需要进行控制和均衡性检查的因素;反应变量,反映干预后的生物效应,大多数研究同时记录多个反应变量。表4-1中,患者编号是标识变量;治疗分组是干预变量;年龄、性别、职业是协变量;收缩压、舒张压、心电图、疗效是反应变量。,45,通常所说的资料三种类型,即计数资料、计量资料、等级资料,是针对协变量和反应变量而言,尤其是指反应变量的类型。计数资料是定性观察结果,如表4-1中的性别、职业、心电图检查结果,统计指标是各个属性或类别的计数、率、结构百分比等;计量资料是定量观察结果,通常有度量单位,如表4-1中的年龄、收缩压、舒张压,统计指标常用例数、平均数、标准差等;等级资料介于定性观察和定量观察之间,观察结果有等级或程度上的差别,但不能用数量表示,如表4-1中的疗效评价。,46,如何对数据资料进行一般性统计分析,47,48,成组,49,50,51,52,53,54,55,4-1,56,57,4-2,58,5,59,60,6,61,62,谢 谢!,