医学统计课程理论复习.pptx
《医学统计课程理论复习.pptx》由会员分享,可在线阅读,更多相关《医学统计课程理论复习.pptx(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 一 基本概念 统计学是研究怎样去有效地收集,整理和分析带有随机性的数据,以对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议的科学。(P1,L1)医学统计学的主要内容有统计研究设计,统计描述,统计推断,因素间的关系、分类和检测等研究。(P1,L10)第1页/共61页 统计研究设计主要有两类:调查研究设计和实验研究设计。(P1,L14)调查研究又称观察性研究,只能就研究对象作被动观察,而不能对观察对象添加干预。实验研究是将实验对象随机分配到两种或多种处理组,观察比较不同处理的结果,它能人为设置处理因素或水平,受试对象接受何种处理因素或水平是由随机分配而定的。第2页/共61页
2、 统计描述指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述,不涉及由样本推断总体问题。(P1,-L1)统计推断指用样本推断总体。(P2,L3)一个统计问题所研究的对象的全体称为总体。按随机的方式从总体中抽取若干个体构成一个样本。第3页/共61页 用于描述总体分布的数字特征的量称为参数,例如总体均数、总体标准差、总体率、总体回归系数、总体相关系数等都是总体的参数,总体参数一般是未知的。(P2,L7)不包含总体中任何未知参数的样本指标和样本数据的函数称为统计量,例如样本均数、样本标准差S、样本率P、样本回归系数b、样本相关系数r等都是统计量。第4页/共61页 统计推断
3、可以分为二个部分:参数估计和假设检验。(P2,L12)参数估计就是根据总体中所抽得的样本,由样本统计量估计总体分布中的未知参数。可分为点估计和区间估计。选择一个适当的样本统计量作为总体参数的估计值称为点估计。第5页/共61页 根据一定的正确度和精确度要求确定一个概率水平,由样本统计量计算出一个适当的区间作为未知总体参数真值所在的范围,称为区间估计。称此概率水平为可信度或置信度,也可称为可信水平,或置信水平。所估计的区间称为可信区间或置信区间,区间的端点称为可信限。(P2,L16)可信区间的大小与样本含量及可信度的大小有关,一般地说,随着可信度的加大,可信区间也加大,随着样本含量的加大,可信区间
4、缩小。(P2,-L7)第6页/共61页 假设检验又称显著性检验,先对总体的参数或分布作出某种假设,假设有两种(1)检验假设用H0表示,(2)对立假设或备择假设用H1表示,H0与H1是相互联系、相互对立的假设。然后选择适当的样本统计量,进行统计推断,究竟是拒绝H0,还是不拒绝H0。其基本步骤为:(1)建立H0,H1。(2)选择合适的统计检验方法,计算统计量。(3)根据检验统计量的分布,计算概率P值,或者根据其临界值表,决定P的大小。(P2,L4)第7页/共61页 P值是H0成立的情况下,由于抽样误差得到的样本之差异大于等于计算出的统计量的概率。如果P0.05,结论为差异无统计学意义;如果P0.0
5、5,结论为差异在=0.05水平上有统计学意义。如果P0.01,结论为差异在=0.01水平上有统计学意义。第8页/共61页 单侧检验和双侧检验与假设检验的目的有关。当H0:1=2,H1:12时,就是双侧检验;当H0:1=2,H1:12或H1:12时,就是单侧检验。(P4,L19)其主要区别在备择假设H1上面。如果H1:12时就用到二侧(即12,或21);如果12就只用到一侧。如t值表中由于 t分布左右对称,双侧的概率P就是单侧概率P之二倍,单侧概率P较小,故易于产生拒绝H0之统计推断。因而单侧检验如果误认为是双侧的,就不易拒绝H0;而双侧检验如误用单侧就较易拒绝H0了。第9页/共61页 必须根据
6、实际问题本身决定使用单侧还是双侧,决不能因为单侧易于拒绝H0就盲目选用。通常进行的都为双侧检验;进行单侧检验时必须特别说明,要有充分的理由,并且在实验设计阶段就要预先规定好。(P4,-L5)第10页/共61页 由假设检验作出统计推断时,不论是拒绝H0,还是不拒绝H0,都有可能发生误差(或称错误),根据所犯误差的性质,可以区分为第一类误差(用表示)和第二类误差(用表示)。(P4,-L1)当拒绝了实际上成立的H0时,称为犯第一类误差,不拒绝实际上不成立的H0时,称为犯第二类误差。第11页/共61页 用假设检验作统计推断时,第一类误差常是已知的,常常未知,1-又称为检验的效能,即当H0实际上不成立时
7、假设检验拒绝H0的概率。当1-很大时,表明该统计检验效能很高。实际应用中需根据专业知识、检验的目的和犯二类误差的代价大小决定,之取值。例如用某方法进行疾病普查时,为确保少漏掉病人,故应很小。在资料一经确定后,缩小的代价必将扩大,反之亦然,要同时降低,值的唯一办法是加大样本。(P4,L9)第12页/共61页 资料一般可分成三大类,即计量资料、计数资料和等级资料。(P3,L22)(1)计量资料又称测量资料,它是测量每个观察单位某项指标值的大小所得的资料。(2)计数资料,将观察单位按某种属性或类别分组计数,得到各类别观察单位计数的资料,称为计数资料。(3)等级资料又称为半定量资料,它是将观察单位按某
8、种属性的不同程度分组计算所得出的各个不同程度的观察单位计数的资料。第13页/共61页 不同的资料类型,其统计指标、统计检验的方法是不相同的。(P4,L1)计量资料的统计指标为均数,标准差等,统计检验方法为t检验,方差分析等;当不符合条件时用为非参数统计分析法。计数资料的统计指标为率,构成比等,统计检验方法为2检验;等级资料的统计指标也为率,构成比等,统计检验方法为非参数统计分析法。第14页/共61页 二.计量资料的统计指标 正态分布资料的平均水平和离散程度常用均数和标准差表示。非正态分布资料的平均水平和离散程度常用中位数和四分位数间距表示。(P43,L2)几何均数适用于成倍数关系的资料,如抗体
9、滴度、效价等,也用于对数正态分布的资料如某些传染病的潜伏期等。(P39,L19)第15页/共61页 百分位数主要用于描述一组资料在各个百分位置上的水平,用一组百分位数如P5,P25,P50,P75,P95,可以描述总体或样本的分布特征,如集中位置、变异度等。百分位数还可用以确定医学正常值范围。(P41,L4)变异系数无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。(P42,L16)统计量的标准误描述样本统计量抽样误差,标准误小,表示抽样误差小,统计量较稳定,与参数较接近。(P49,L6)第16页/共61页三.t.t检验要检
10、验总体均数是否为某值:用样本均数与总体均数比较的t检验。配对资料的两组比较,或处理前后的比较:用配对t检验。按完全随机化设计的两个样本均数的比较:用团体t检验。第17页/共61页t t检验条件 样本均数与总体均数比较的t检验要求样本来自正态分布的总体。配对t检验要求差值d来自正态分布的总体。团体t检验要求两个样本都来自正态分布并具有相同的方差。如不符合要求可作变量置换或用非参数统计分析方法。小样本团体t检验如方差不齐时可用t检验。第18页/共61页 四.方差分析 方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。要求各样本都来自正态总体,且有一个相同的方差2,仅仅均数可以不相
11、同;还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。(P60,L4)第19页/共61页 方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分为相应的各个部分,各部分的离均差平方和除以相应自由度得出各个均方,然后列出方差分析表算出F值,作出统计推断。分解越细致,各部分含义就越明确。效率也越高。(P60,L9)第20页/共61页 若发现方差不齐性时,先从实验本身检查,能否找到可能的解释,如果找不到适当的理由,可考虑作变量置换。(P61,-L9)对于服从对数正态
12、分布的资料可用对数变换,即将主要变量取对数值后再作方差分析;对于服从泊松分布的资料可用平方根变换;对于表达成百分数的资料可用平方根反正弦变换。如果变量置换也无法克服方差不齐性,或者变量置换方法在实验中无法得到合理的解释时,可使用非参数统计分析方法。第21页/共61页 单因素方差分析用于按完全随机化设计资料的样本均数的比较。随机单位组设计方差分析用于比较某因素各水平的样本均数,同时控制另一个分类因素的作用。拉丁方设计方差分析用于比较某因素各水平的样本均数,同时控制另二个分类因素的作用。析因设计方差分析是一种多因素的设计;能检验每个因素各水平均数间的差异,也能检验因素间的交互影响。第22页/共61
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计 课程 理论 复习
限制150内