医学科研和论文撰写中常用的数据处理和统计分析方法(PPT-44).ppt
《医学科研和论文撰写中常用的数据处理和统计分析方法(PPT-44).ppt》由会员分享,可在线阅读,更多相关《医学科研和论文撰写中常用的数据处理和统计分析方法(PPT-44).ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学科研和论文撰写中常用的医学科研和论文撰写中常用的数据处理和统计分析方法数据处理和统计分析方法重庆市卫生信息中心孙安龙2012.10.24目录前言医学统计方法的基本概念常用医学统计方法的适用条件医用期刊对医学统计学的要求医学统计在期刊中的正确表达医学科研论文中的常见的统计学问题医学科研论文中的常见的统计学问题医学科研论文中的常见的统计学问题医学科研论文中的常见的统计学问题数据的正确书写前言卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法,而统计方法的正确与否直接影响到论文的质量。我们在编审稿件过程中,经常遇到统计学方法使用不当等问题。几个基本概念变量变量:数值变
2、量(定量变量)、分类变量(定性变量):无序分类、有序分类(等级/半定量)概率概率:随机事件、概率、频率与概率的关系(样本含量大到总体时,频率就等于概率)总体与样本样本:总体、样本、参数数学上的分类数学上的分类q连续型资料连续型资料连续型资料连续型资料(continuous data)(continuous data):计量资料计量资料计量资料计量资料 实数范围内任意取值实数范围内任意取值实数范围内任意取值实数范围内任意取值q离散型资料离散型资料离散型资料离散型资料(discrete data)(discrete data)实数范围内只取整数值实数范围内只取整数值实数范围内只取整数值实数范围内只
3、取整数值 计数资料计数资料 离散型计量资料离散型计量资料如:脉搏次数如:脉搏次数/分;人数分;人数/家庭;白细胞计数家庭;白细胞计数/L连续型变量:连续型变量:即连续变化的变量,其取值是数轴上某一区间内的一切数值,即连续变化的变量,其取值是数轴上某一区间内的一切数值,理论上它们是无限可分的。如身高、体重。理论上它们是无限可分的。如身高、体重。离散型变量:离散型变量:其取值是其取值是0,1,2等不连续的量,是数轴上有限或无限的可等不连续的量,是数轴上有限或无限的可数的值,两个数之间没有小数。如年新生儿数、月手术病人数、人的牙齿数的值,两个数之间没有小数。如年新生儿数、月手术病人数、人的牙齿数等。
4、数等。变变量量转转化化只只能能由由高高级级向向低低级级转转化化,即即从从计计量量资资料料至至等等级级资资料料至至计计数数资资料料,但但不不能做相反方向的转化。能做相反方向的转化。提示:在研究设计中,对于能测量的指标,尽可能设计为定量指标,尽可能减少信息量的损失,并为分析过程中资料转化带来方便。定性指标可转化为定量指标,但较粗糙。概率概率:随机事件发生可能性大小的度量。随机事件发生可能性大小的度量。当n逐渐增大时,频率f/n始终在一个常数左右作微小摆动,称该常数为随机事件A的概率,记为:P(A)只要观察单位数足够多,可将频率作为概率的估计值。0P1,P=1必然事件,P=0不可能事件。小概率事件:
5、小概率事件:P0.05,表示在一次实验或观察中该事件发生的可能性很小。小概率原理:小概率原理:小概率事件在一次实验或抽样中不可能发生,如果发生就怀疑检验假设的正确性。抽样方法简单随机抽样:从总体抽取样品时,使每个个体被抽到的机简单随机抽样:从总体抽取样品时,使每个个体被抽到的机会均等,以使所抽取的样本数据能够很好地代表总体的抽样会均等,以使所抽取的样本数据能够很好地代表总体的抽样方法。(简单方法。(简单/单纯):抽签法、随机数表法单纯):抽签法、随机数表法系统随机抽样(间隔):将总体按某一标志(如时间)排序,系统随机抽样(间隔):将总体按某一标志(如时间)排序,然后按一定间隔抽取样本单位。然后
6、按一定间隔抽取样本单位。分层随机抽样:将总体按产品的某些特征划分为若干层(即分层随机抽样:将总体按产品的某些特征划分为若干层(即小批),各层内分别用简单随机抽样法抽取一定数量的个体小批),各层内分别用简单随机抽样法抽取一定数量的个体组成一个样本的方法。分层按比例随机抽样。组成一个样本的方法。分层按比例随机抽样。整群抽样法:先将总体按某个标志分成若干群,然后随机地整群抽样法:先将总体按某个标志分成若干群,然后随机地抽取若干群,并由抽中的群中所有个体组成样本。抽取若干群,并由抽中的群中所有个体组成样本。几种常见的分布分类变量的分布类型分类变量的分布类型 二项分布:观察单位具有互相对立的一种结果,观
7、察二项分布:观察单位具有互相对立的一种结果,观察单位的观察结果相互独立(如:治愈单位的观察结果相互独立(如:治愈/未治愈、传染未治愈、传染/未传染)未传染)PoissonPoisson分布:二项分布的极限分布和特例,某事件发分布:二项分布的极限分布和特例,某事件发生率非常小时(小概率事件),则事件发生数生率非常小时(小概率事件),则事件发生数X X所服从所服从的概率分布的概率分布 超几何分布:超几何分布:数值变量的分布类型数值变量的分布类型 正态分布正态分布 WeibullWeibull分布分布t检验、检验、u检验检验 数值变量资料假设检验的最基本最简单的方法:数值变量资料假设检验的最基本最简
8、单的方法:t t检验、检验、检验、检验、u u检验;检验;检验;检验;仅适仅适仅适仅适用于两个样本均数的比较用于两个样本均数的比较用于两个样本均数的比较用于两个样本均数的比较 t t检验的应用条件:样本含量较小(检验的应用条件:样本含量较小(检验的应用条件:样本含量较小(检验的应用条件:样本含量较小(n30n30n30)或样本含量虽小但总体)或样本含量虽小但总体)或样本含量虽小但总体)或样本含量虽小但总体标准差已知时样本均数与已知总体均数的比较及成组设计两大样本均标准差已知时样本均数与已知总体均数的比较及成组设计两大样本均标准差已知时样本均数与已知总体均数的比较及成组设计两大样本均标准差已知时
9、样本均数与已知总体均数的比较及成组设计两大样本均数的比较数的比较数的比较数的比较 应用应用应用应用 样本均数与已知总体均数样本均数与已知总体均数样本均数与已知总体均数样本均数与已知总体均数 配对设计资料配对设计资料配对设计资料配对设计资料 成组设计资料两均数间成组设计资料两均数间成组设计资料两均数间成组设计资料两均数间方差分析 方差分析的应用条件(多个样本均数的比较)方差分析的应用条件(多个样本均数的比较)各样本须是相互独立的随机样本各样本须是相互独立的随机样本 各样本均来自正态总体各样本均来自正态总体 相互比较的各样本所来自的总体其方差相等,即方差齐相互比较的各样本所来自的总体其方差相等,即
10、方差齐 方差分析应用方差分析应用 两个或多个样本均数间的比较两个或多个样本均数间的比较 分析两个或多个因素间的交互作用分析两个或多个因素间的交互作用 回归方程的假设检验回归方程的假设检验 方差齐性检验方差齐性检验 完全随机设计资料:处理间变异完全随机设计资料:处理间变异+组内变异(误差)组内变异(误差)配伍组设计资料:处理间变异配伍组设计资料:处理间变异+配伍组间变异配伍组间变异+内变异(误差)内变异(误差)多个样本均数间的两两比较:多个样本均数间的两两比较:q q检验(检验(SNKSNK法)法)多个实验组与一个对照组均数间的比较:多个实验组与一个对照组均数间的比较:qq检验(检验(Dunne
11、ttDunnett t t检验)检验)卡方检验卡方检验分类变量资料中的应用分类变量资料中的应用 推断两个及两个以上总体率或构成比之间有无差别推断两个及两个以上总体率或构成比之间有无差别 两种属性、两种特征或两变量间相关关系是否存在两种属性、两种特征或两变量间相关关系是否存在 频数分布的拟合优度检验频数分布的拟合优度检验四格表资料的卡方检验(四格表资料的卡方检验(n1+n240,n1+n240,各格各格T5T5)RXCRXC列联表的卡方检验(多个率及多组构成比)列联表的卡方检验(多个率及多组构成比)配对资料的卡方检验配对资料的卡方检验组内分组资料的卡方检验(逐级分组组内分组资料的卡方检验(逐级分
12、组/K/K层组内分层组内分组设计资料)组设计资料)FisherFisher精确概率检验法:一格精确概率检验法:一格T1,n40T1,n77例才有统计学意义,例才有统计学意义,一般要一般要3030例(例(30100100例;作为分类变量,样本数例;作为分类变量,样本数量要大些,至少量要大些,至少3030例,一般例,一般100100例;常见病、多发病最好为几百例。这例;常见病、多发病最好为几百例。这是经验要求,具体样本含量可根据公式进行推算。是经验要求,具体样本含量可根据公式进行推算。四格表的卡方检验要求样本量大于四格表的卡方检验要求样本量大于4040,方格中理论数大于,方格中理论数大于5(n40
13、5(n40,t5)t5),若不符合则用校正卡方检验或精确概率法。行,若不符合则用校正卡方检验或精确概率法。行x x列表的卡方检验要求理列表的卡方检验要求理论数均大于论数均大于1 1且小于且小于5 5者不超过表中数的者不超过表中数的1 15 5,若不符合则改用其它方法,若不符合则改用其它方法(合理合并合理合并)。正常值范围的确定:观察数量应尽可能多于正常值范围的确定:观察数量应尽可能多于100100例;需分组者,各组人数例;需分组者,各组人数也是如此也是如此(标本来源困难时酌情减少标本来源困难时酌情减少)。若为偏态分布,应以百分位数计算,。若为偏态分布,应以百分位数计算,则例数应则例数应 120
14、120例。例。混杂因素任何一种现象的发生都不是单纯的,要受多种因素的影响。当任何一种现象的发生都不是单纯的,要受多种因素的影响。当分析比较不同人群某现象的发生或存在状况时,要考虑除研究分析比较不同人群某现象的发生或存在状况时,要考虑除研究因素以外比较组之间其它条件是否相同,内部构成是否一致,因素以外比较组之间其它条件是否相同,内部构成是否一致,其它因素对研究现象的影响如何。其它因素对研究现象的影响如何。混杂因素应在研究之前通过研究对象选择、设立对照、随机、混杂因素应在研究之前通过研究对象选择、设立对照、随机、匹配、双盲法等控制,但如果事先没有良好设计,则通过统计匹配、双盲法等控制,但如果事先没
15、有良好设计,则通过统计方法可以控制。若资料内部构成不同,存在混杂因素,简便方方法可以控制。若资料内部构成不同,存在混杂因素,简便方法是分组比较或标化处理。若样本量不允许分组,则对计数资法是分组比较或标化处理。若样本量不允许分组,则对计数资料可用组内分组的卡方检验、卡方值分割法、加权卡方检验法料可用组内分组的卡方检验、卡方值分割法、加权卡方检验法等,计量资料的比较可用协方差分析。等,计量资料的比较可用协方差分析。统计学的解释资料的统计处理并非是研究工作的最终目的,而是通过统资料的统计处理并非是研究工作的最终目的,而是通过统计学分析为研究结论提供依据或线索,因此对统计资料做计学分析为研究结论提供依
16、据或线索,因此对统计资料做统计分析后,要正确把握统计学术语,对结论做科学的分统计分析后,要正确把握统计学术语,对结论做科学的分析和解释。拒绝检验假设,习惯上称有显著性,不应误解析和解释。拒绝检验假设,习惯上称有显著性,不应误解为差别很大或在医学上有很显著的价值,统计学亦不能回为差别很大或在医学上有很显著的价值,统计学亦不能回答比较样本的总体一定相等或一定不相等,因为统计推断答比较样本的总体一定相等或一定不相等,因为统计推断是以一定的概率界值为依据,说明来自同一总体可能性的是以一定的概率界值为依据,说明来自同一总体可能性的大小。应用统计学分析的目的是通过研究样本推断总体,大小。应用统计学分析的目
17、的是通过研究样本推断总体,如果研究结论不能适当外延,则该项研究毫无意义。如果研究结论不能适当外延,则该项研究毫无意义。中国医药卫生期刊编排规范中国医药卫生期刊编排规范GB/T7713GB/T771319871987科学技术报告、学位论文和学术论文的科学技术报告、学位论文和学术论文的编写格式编写格式 前言、方法、结果、讨论前言、方法、结果、讨论四部分四部分 方法方法 描述研究对象(人或实验动物,包括对照组)的选择及其基本描述研究对象(人或实验动物,包括对照组)的选择及其基本情况,以及研究所采用的方法。临床试验研究还应说明试验程序是否情况,以及研究所采用的方法。临床试验研究还应说明试验程序是否经所
18、在单位或地区伦理学相关机构的批准,研究对象是否知情同意并经所在单位或地区伦理学相关机构的批准,研究对象是否知情同意并签署了知情同意书。签署了知情同意书。描述统计学方法及其选择依据,并说明所使用的统计学软件。描述统计学方法及其选择依据,并说明所使用的统计学软件。结果结果 结果的叙述应实事求是,简洁明了,数据准确,层次清楚,逻结果的叙述应实事求是,简洁明了,数据准确,层次清楚,逻辑严谨,不应与讨论内容相混淆。应着重总结重要的研究结果。以数辑严谨,不应与讨论内容相混淆。应着重总结重要的研究结果。以数据反映结果时,不能只描述导数(例如百分数),应同时给出据以计据反映结果时,不能只描述导数(例如百分数)
19、,应同时给出据以计算导数的绝对数。算导数的绝对数。一般应对所得数据进行统计学处理,并给出具体的一般应对所得数据进行统计学处理,并给出具体的一般应对所得数据进行统计学处理,并给出具体的一般应对所得数据进行统计学处理,并给出具体的统计值。统计值。统计值。统计值。例如:例如:F F=3.868=3.868,P=P=0.0260.026。中国医药卫生期刊编排规范中国医药卫生期刊编排规范 17.417.4表表表表 17.4.117.4.1表应具有自明性。表应具有自明性。表的内容不应与正文文字及插图内容重复表的内容不应与正文文字及插图内容重复表的内容不应与正文文字及插图内容重复表的内容不应与正文文字及插图
20、内容重复。17.4.217.4.2表应按表应按统计学的制表原则设计统计学的制表原则设计统计学的制表原则设计统计学的制表原则设计,力求结构简洁。横、纵标目间应有逻辑上的,力求结构简洁。横、纵标目间应有逻辑上的主谓语关系主谓语关系主谓语关系主谓语关系,主语一般主语一般置表的左侧,谓语一般置表的右侧置表的左侧,谓语一般置表的右侧。一般采用三横线表一般采用三横线表一般采用三横线表一般采用三横线表。17.4.317.4.3表应有序号和简明的表题,居中或齐左排印在表的上方,同一种期刊体例应一致。表序一律使用阿表应有序号和简明的表题,居中或齐左排印在表的上方,同一种期刊体例应一致。表序一律使用阿拉伯数字依序
21、编排。只有拉伯数字依序编排。只有1 1幅表时应标注幅表时应标注“表表1”1”。表号与表题之间至少应留。表号与表题之间至少应留1 1个同类字符的空隙。个同类字符的空隙。17.4.417.4.4表中一般不设表中一般不设“备注备注”栏,若有需说明的事项,可在表内有关内容的右上角标出注释符号,在表格栏,若有需说明的事项,可在表内有关内容的右上角标出注释符号,在表格底线的下方以相同的注释符号引出简练的文字注释。底线的下方以相同的注释符号引出简练的文字注释。17.4.517.4.5表中各栏应标明标目词,参数栏的标目词一般为量或测试项目及其单位符号。若表中所有参数的单表中各栏应标明标目词,参数栏的标目词一般
22、为量或测试项目及其单位符号。若表中所有参数的单位相同,单位可标注在表的右上方,或表题之后(加括号)。各栏参数的单位不同,则应将单位符号加括号位相同,单位可标注在表的右上方,或表题之后(加括号)。各栏参数的单位不同,则应将单位符号加括号标注在各栏标目词后或下方,或在标目词与单位符号之间以逗号标注在各栏标目词后或下方,或在标目词与单位符号之间以逗号“,”隔开。隔开。17.4.617.4.6表中同一栏的数字必须按位次上下对齐。表中不用表中同一栏的数字必须按位次上下对齐。表中不用“同上同上”、“同左同左”、“”和类似词,一律填和类似词,一律填入具体数字(包括入具体数字(包括“0”0”)或文字。若使用符
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 科研 论文 撰写 常用 数据处理 统计分析 方法 PPT 44
限制150内