医学医学统计学的基本概念.pptx
1医学统计学的概念、内容和步骤医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第1页/共37页2一、一、医学医学统计学统计学的概念及用途的概念及用途1 1 1 1.概念:概念:概念:概念:医学统计学医学统计学是运用概率论和数理是运用概率论和数理是运用概率论和数理是运用概率论和数理统计的原理和方法,研究医学数据资料统计的原理和方法,研究医学数据资料统计的原理和方法,研究医学数据资料统计的原理和方法,研究医学数据资料的收集、整理、分析和推断的一门应用的收集、整理、分析和推断的一门应用的收集、整理、分析和推断的一门应用的收集、整理、分析和推断的一门应用学科。学科。学科。学科。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第2页/共37页32.2.用途:用途:医学统计学是进行医学科研、促进专业发展所必需的主要手段。l阅读医学书刊;l登记工作、填写各种报表;l科研工作、撰写科研论文;l制订计划、检查工作、总结经验第3页/共37页4 二、医学统计的基本内容二、医学统计的基本内容 科研设计科研设计 两部分两部分统计描述统计描述数据处理数据处理统计推断统计推断 医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第4页/共37页5STATISTICS社会社会管理管理工程工程.理论理论计量计量统计学描述统计学 推断统计学参数估计 假设检验理论统计学 应用统计学 统计学的分科医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 医学医学第5页/共37页6二、医学统计分析的基本内容二、医学统计分析的基本内容数值变量数值变量:集中,离散集中,离散统计描述统计描述 分类变量分类变量:相对数相对数参数估计参数估计:点、区间估计点、区间估计 统计推断统计推断假设检验假设检验:t-T,:t-T,-Test-Test等等医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第6页/共37页7STATISTICS统计推断:统计推断:中国人口状况?中国人口状况?总量?结构?总量?结构?普查?抽样?参数估计 假设检验抽样推断总体样本医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第7页/共37页8STATISTICS统计学探索客观现象数量规律过程统计学探索客观现象数量规律过程反映客观的反映客观的数据(自然、数据(自然、社会)社会)推断统计推断统计(对总体数量规律性进行估计、检验)描述统计描述统计(收集、整理、(收集、整理、分析数据分析数据)样本样本数数据据总体总体数数据据概率论概率论总体内在总体内在数量规律性数量规律性医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第8页/共37页91.总体和样本总体(Population):根据研究目的而确定的同质观察单位(研究对象,Observationunit)某项指标测定值的集合。三、统计学的几个基本概念有限总体有限总体总体无限总体无限总体第9页/共37页样样 本本(Sample)(Sample):从总体中从总体中随机抽取随机抽取随机抽取随机抽取部分观察单位某部分观察单位某变量值变量值(Valueofvariance)(Valueofvariance)的集合。的集合。为使样本对总体具有代表性,要求:为使样本对总体具有代表性,要求:抽样必须遵循随机的原则抽样必须遵循随机的原则保证足够的样本含量保证足够的样本含量医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第10页/共37页112.参数和统计量参参 数数(Parameter)(Parameter):描述总体的统计指标:、等。统计量统计量(Statistic)(Statistic):描述样本的统计或分析指标。如、s、p;u值、t值等。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第11页/共37页12医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 STATISTICS工程工程.理论理论计量计量总体样本参数统计量s s 平均数 标准差 率p第12页/共37页133.3.变量与变量值变量与变量值(1)(1)变变 量量 (Variable)(Variable):被观察单位被观察单位(Observationunit)(Observationunit)的的某项某项特征特征(或指标或指标););(2)(2)变量值变量值(ValueofvarianceValueofvariance):):观察指标的测观察指标的测定结果称定结果称变量值变量值。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第13页/共37页14数值变量数值变量(Numericalvariable)(Numericalvariable)变变 量量分类变量分类变量(Categoricalvariable)(Categoricalvariable)医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 变量的分类:变量的分类:(定量变量)(定性变量)二项分类二项分类分类变量分类变量无序分类无序分类多项分类多项分类有序分类:有序分类:有程度差有程度差别且排列有序别且排列有序第14页/共37页15l 离散型变量(discrete variable),相当于计数资料;l连续性变量(continuous variable),相当于计量资料;l有序变量(ordinal variable),相当于等级资料。也可分为:医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第15页/共37页16变量也称变量也称随机随机变量变量(random variable)(random variable)变量统计上习惯用大写拉丁字母表示,如X、Y、Z、。变量值习惯用小写拉丁字母表示,如性别x11(男)、x2 1(男)、x3 0(女)、。编号编号(ID)性别性别(X)体重体重 (kg)(Y)疗效疗效(Z)张张11660李李21781王王30572医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第16页/共37页174.同质与变异(1)同质(homogeneity):指事物的性质、影响条件或背景相同或非常相近。(2)变异(Variation):同质个体间测定结果的差异。统计学研究的对象同时所具有的两个特征。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第17页/共37页18 同质与变异的例子同质与变异的例子u例1 调查2003年武汉市7岁男童的身高和体重同质:2003年、武汉市、7岁男童变异:身高和体重各不相同u例2 研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第18页/共37页5.误差误差(error)误差:误差:实际实际观察值观察值与客观与客观真实值真实值之差。之差。(1)系统误差)系统误差(2)随机误差)随机误差医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第19页/共37页(1 1)系统误差)系统误差(systematic error)在实际观测过程中,由受试对象、研究者、仪器在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。定倾向性或规律性的误差。特点:特点:观察值有观察值有系统性系统性、方向性方向性、周期性周期性的偏离的偏离真值。真值。可以通过严格的可以通过严格的实验设计实验设计和和技术措施技术措施消除消除。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第20页/共37页(2)随机误差随机误差(random errorrandom error)排除上述误差后尚存的误差,受多种无法控排除上述误差后尚存的误差,受多种无法控制的因素的影响。制的因素的影响。特点:特点:大小方向不一的随机变化。大小方向不一的随机变化。随机测量误差随机测量误差(random measurement error)由于偶然的因素所引起的测定误差。它没有固定的倾向,是不可避免的,但可提高操作者熟提高操作者熟练程度练程度、增加重复测定增加重复测定使其减少。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第21页/共37页22随机抽样误差(random Samplingerror)因总体中因总体中各个体之间的差异各个体之间的差异,由抽样所造,由抽样所造成的样本统计量与总体参数之差(以及样本统成的样本统计量与总体参数之差(以及样本统计量之差),为计量之差),为。抽样误差抽样误差是不可避免,是不可避免,但有规律、但有规律、可估计。可估计。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第22页/共37页236.概率概率(Probability)是描述随机事件发生可能性大小的数值,用是描述随机事件发生可能性大小的数值,用P表示;表示;必然事件的概率为必然事件的概率为1(100%)、不可能发生事件的概率为不可能发生事件的概率为0;随机事件的概率在随机事件的概率在01之间:之间:0P1;在随机试验中,可能出现也可能不出现,而在大量在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件。重复试验中具有某种规律性的事件叫做随机事件。P 0.05,P 0.01,属小概率事件属小概率事件即认为该事件不可能发生即认为该事件不可能发生医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第23页/共37页24计量资料(数值变量)用定量的方法测定同质观察单位某项指标测定值的集合,亦称。是定量的指标,一般有单位。是定量的指标,一般有单位。四、统计资料的类型医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第24页/共37页25对这类资料v 通常计算统计指标是:平均数 (反映集中趋势)变异指标(反映离散趋势)v 资料统计学处理作:u/u/t t检验(两个均数)F F检验(两个以上均数)秩和检验(两个及以上均数)参数检验法非参数检验法第25页/共37页26计数资料(二项分类二项分类、多项无序分类变量多项无序分类变量)按性质和类别进行分组所得的资料。其变量值是定性的。医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 通常计算的统计指标是:相对数(如百分比或率等)统计学资料处理作:u u检验(两个率)2 2检验(两组及以上比或率;两事物间相关分析)第26页/共37页27 等级资料 (有序分类变量有序分类变量)按某项指标的不同程度(或等级)进行分组的资料。各组之间有量或程度的差别,亦为半定量的资料。分析等级资料常用的统计指标用:相对数;常用的统计方法有:秩和检验、参照单位分析 非非参参数数检检验验第27页/共37页根据分析研究目的、分析需要将资料可互相转换。根据分析研究目的、分析需要将资料可互相转换。例:一组20 40岁成年人的血压 以12kPa12kPa为界分为正常与异常两组,统计每组例数 8低血压 8 8 正常血压 1212 轻度高血压 1515 中度高血压 1717 重度高血压计量资料计量资料等等级级资资料料计数资料计数资料第28页/共37页29STATISTICS计量计量统计数据的类型按计量层次按收集方法按时间状况分类数据顺序数据数值型数据观测数据实验数据时间序列数据截面数据医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第29页/共37页住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月20256532025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variablesQuantitative data Quantitative data 计量资料计量资料Qualitative data Qualitative data 计数资料计数资料Units;elements第30页/共37页实例数据1第31页/共37页实例数据2第32页/共37页33五、统计工作的基本步骤设计(Design):关键的一步调查设计医学科研设计临床实验设计现场医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第33页/共37页34搜集资料(Datacollection)统计报表(经常性)统计资料来源医疗卫生工作记录(经常性)专题调查或实验(一时性)医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第34页/共37页35整理资料(Datasorting)整理工作核对检查原始数据分组汇总资料完整性检查:缺项,漏项准确性检查:逻辑性错误区间错误计算错误医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 第35页/共37页36分析资料(Dataanalysis)统计描述统计指标统计图表统计分析参数估计统计推断假设检验医学院医学院 预防医学教研室预防医学教研室14-414-4月月-23-23 结合文字第36页/共37页37谢谢您的观看!第37页/共37页