《第一章 绪论.pptx》由会员分享,可在线阅读,更多相关《第一章 绪论.pptx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、,作者:李康,单位:哈尔滨医科大学,第一章,绪论,第一节医学统计学的作用,第二节医学统计学的基本内容,第三节医学统计学中的基本概念,第四节概率的基本运算法则,重点难点,统计数据的三种基本类型:定量数据、定性数据和有序数据。基本概念:同质与变异、总体与样本、系统误差和随机误差。,医学统计学研究的对象、内容和作用。统计描述和统计推断的核心问题。,概率的涵义和定义。概率运算的乘法法则、加法法则、条件概率和Bayes公式。,医学统计学的作用,第一节,医学统计学(第7版),1.医学统计学的定义医学统计学(medicalstatistics):临床医学、基础医学、公共卫生学和医疗卫生服务研究中的一门基础学
2、科,是关于收集数据、分析数据和由数据得出结论的一组概念、原则和方法。统计学的重要作用在于能够透过偶然现象来探测其规律性,使研究结论具有科学性。2.医学统计学的作用案例1:1962年美国医学会杂志(JAMA)曾发表了一篇关于胃溃疡治疗新技术的报告,该报告根据动物实验和24名患者的临床试验结果得出结论,即将冷冻液导入胃中使胃冷却可以缓解溃疡症状,之后这一研究成果在临床中被广泛应用。后证实这种方法无效甚至有害。,案例2:20世纪80年代早期,两项观察性研究结果提示孕妇在怀孕期间补充维生素可以降低新生儿神经管缺陷(NTD)的风险,但一直无法证实。该项研究使用统计学方法确定了服用叶酸组与对照组的差别不是
3、简单偶然出现的,而是归因于叶酸的作用。,胃溃疡治疗新技术的研究结论为什么会出现错误?为了证明服用叶酸的作用,应如何进行分组?如何准确地估计两组出现神经管缺陷的发病率?如何比较两组NTD的发病率是否有差别?上述问题的解决,都需要运用统计学设计原则和统计学分析方法,问题:,医学统计学(第7版),医学统计学的基本内容,第二节,医学统计学(第7版),统计设计主要包括实验分组或抽样方法、样本含量估计、数据管理与质量控制、拟使用的统计分析方法等。统计设计能够提高研究效率,并使结果更加准确和可靠。数据整理与核查主要是指对数据进行分组、对数据质量进行检查,考虑数据分布及变量转换,检查异常值及数据是否符合特定的
4、统计分析方法要求等。统计描述描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。统计描述结果的表达方式主要是统计指标、统计表和统计图。统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。参数估计的重要性在于可以给出区间估计;假设检验的重点则是比较参数的大小。,基本内容,医学统计学中的基本概念,第三节,同质(homogeneity):指观察单位或研究个体间具有相同或相近的性质,通常要求主要研究指标的影响因素相同或基本相同。观察单位(observedunit):研究对象的基本单元,可以是一个人、一个地点、一只动物、一份生物样品等。变异(variation
5、):指同一测量在总体中不同观察单位或个体之间的差别。,同质与变异,变量与数据类型,变量(variable):反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据(data)。,高血压患者舒张压一天内的平均变化,医学统计学(第7版),定量数据(quantitativedata):也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。定性数据(qualitativedata):也称计数资料。变量的观测值是定性的,表现为互不相容的类别或属性。例如,血型分为A、B、O、AB等。有序数据(ordinal
6、data):也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别,如尿糖的化验结果分为、+、+、+。,统计分析方法的选用与数据类型有密切的关系。根据分析的需要,不同类型的变量或数据之间可以进行转换。,医学统计学(第7版),总体(population):根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。描述总体特征的指标称为参数(parameter)。样本(sample):从研究总体中抽取部分有代表性的观察单位,对变量进行观测构成一个样本。描述样本特征的指标称为统计量(statistic)。,总体和样本,误差,系统误差(systema
7、ticerror):误差大小通常恒定或按照一定规律变化,具有明确的方向性。随机测量误差(randommeasurementerror):由各种偶然因素造成误差,误差没有固定的大小和方向,但具有一定的统计规律。抽样误差(samplingerror):由于抽样而引起的样本统计量与总体参数间的差异。,医学统计学(第7版),概率(probability):描述随机事件发生可能性大小的定量度量。事件A发生的概率可以写成,其取值为,表示该事件不可能发生,表示该事件必然发生。概率有古典概率、统计概率和经验概率之分。医学研究中经常使用的是统计概率,定义为其中N和分别表示观察的总例数和发生事件A的例数;称为频率
8、。概率分布(probabilitydistribution):随机变量所有可能的取值与各取值下所发生的概率之间的对应关系,用以全面地表述随机变量取值的概率。,概率,医学统计学(第7版),概率的基本运算法则,第四节,1.概率的乘法法则如果有两个事件A和B相互独立,即事件A的出现并不影响事件B出现的机会,则两者同时出现的概率等于各自出现的概率乘积:例如,某地40岁以上人群中2型糖尿病患病(A)的概率为22.5%,患有甲状腺结节(B)的概率为20.2%,则患有2型糖尿病同时患有甲状腺结节疾病的概率为,即约等于4.5%。,医学统计学(第7版),2.概率的加法法则如果有事件A和B相互独立而且互不相容,则
9、出现任一事件的概率如果事件的出现相互独立但可能互相包容,则上述公式需要改为其中P(AB)表示A和B两事件同时出现的概率。例如,某地40岁以上人群中2型糖尿病患病(A)的概率为22.5%,患有甲状腺结节(B)的概率为20.2%,则出现任一种疾病的概率为即约等于38.2%。,医学统计学(第7版),3.条件概率如果事件A和B之间不独立,即事件B与事件A存在某种关联,则在A发生的条件下B的概率称为条件概率,记为;反之,在B发生的条件下A发生的概率记为。两者的联合概率:例如,某地40岁以上人群中2型糖尿病(A)患病的概率为12.5%,患有高血压(B)的概率为20.2%,患有糖尿病的患者中有65.2%的患
10、者合并患有高血压,则同时患有糖尿病和高血压的概率为同时可以得出在高血压的患者中患有糖尿病的概率P(A|B)=0.08150.202=0.4035,医学统计学(第7版),4.Bayes公式由条件概率公式可以得到著名的Bayes公式:其中为的对立事件,称为先验概率,为后验概率。例如,根据以往的数据,某地肝癌发病率为0.4%,已知肝癌病人用维生素K缺乏诱导蛋白(PIVKA-)和甲胎蛋白(AFP)联合检验呈阳性的概率为85%,健康人用该法检验呈阴性的概率为90%。若以A表示检验呈阳性,B表示患有肝癌,则在检测结果呈阳性的人中,真患有肝癌的可能性为,从这一计算结果可以看出什么?,医学统计学(第7版),概
11、率的运算法则可以用于计算不同事件组合在不同条件下的发生概率,以上内容主要介绍的是两个事件的情形,当有多个事件时,相应的计算公式可以类推。统计推断结论都是基于一定概率得出的,概率的计算则是依据样本统计量的概率分布得到相应的概率值P。习惯上将的事件称为小概率事件,表示在一次试验中发生的可能性很小。如果小概率事件在现实中出现,就要追究其原因。,注意,医学统计学(第7版),1.医学统计学是关于收集数据、分析数据和由数据得出结论的一组概念、原则和方法。其重要作用在于能够透过偶然现象来探测其规律性,使研究结论具有科学性。2.医学统计学的基本内容包括统计设计、数据整理与核查、统计描述和统计推断。这四项基本内容相互联系。3.由实验或观察得到的数据可分为定量数据、定性数据和有序数据。统计分析方法的选用与数据类型有密切的关系。根据分析的需要,不同类型的变量或数据之间可以进行转换。,4.误差是指观测值与真实值、样本统计量与总体参数之间的差别。根据误差的性质和来源主要可以分为系统误差、随机测量误差和抽样误差几种类型。5.变异和概率是统计学中两个最基本的概念。变异可以来自生物个体、测量等多个方面,由于有变异,则结果不定,对此可以使用概率进行描述。概率运算有乘法法则、加法法则、条件概率和Bayes公式。,
限制150内