《常见的几种统计方法课件.ppt》由会员分享,可在线阅读,更多相关《常见的几种统计方法课件.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于常见的几种统计方法第1页,此课件共61页哦前言前言l 学习统计学方法,主要目的在于建立统计学习统计学方法,主要目的在于建立统计学观念,提高医学统计学思维,学会运用统计学观念,提高医学统计学思维,学会运用统计学理论和方法充分挖掘资料中蕴含的信息,恰学理论和方法充分挖掘资料中蕴含的信息,恰如其分地进行理性概括,并据此写出严谨的研如其分地进行理性概括,并据此写出严谨的研究报告和学术论文。究报告和学术论文。第2页,此课件共61页哦呋喃硝胺呋喃硝胺 100人人西米替丁西米替丁 100人人疗效疗效85人人疗效疗效90人人 例如:某医生比较两种疗法对活动期十二指肠例如:某医生比较两种疗法对活动期十二指肠
2、球部溃疡的疗效。球部溃疡的疗效。据此能否立即下据此能否立即下结论,结论,呋喃硝呋喃硝胺的疗效高于胺的疗效高于西米替丁?西米替丁?第3页,此课件共61页哦显效显效 有效有效 无效无效 合计合计单纯西药单纯西药 9 25 6 40冠心灵冠心灵 19 18 5 42冠心灵与单纯西药冠心灵与单纯西药 疗效对比疗效对比 问题:某医师用问题:某医师用“冠心灵冠心灵”治疗治疗冠心病,其疗效是否优于单纯西药?冠心病,其疗效是否优于单纯西药?第4页,此课件共61页哦授课提纲授课提纲l医学统计学概述医学统计学概述l统计工作的基本步骤统计工作的基本步骤l统计资料的类型统计资料的类型l医学统计中的基本概念医学统计中的
3、基本概念l常用的几种统计方法常用的几种统计方法第5页,此课件共61页哦一、医学统计学概述一、医学统计学概述 定义定义 是是用用统统计计学学原原理理和和方方法法研研究究生生物物医医学学问问题题的的一一门门学学科科。医医学学统统计计方方法法在在医学研究中的运用主要有三个方面:医学研究中的运用主要有三个方面:第6页,此课件共61页哦一、医学统计学概述一、医学统计学概述以正确的方式收集数据,如实验设计、调查设计等。以正确的方式收集数据,如实验设计、调查设计等。描描述述数数据据的的统统计计特特征征,如如数数据据化化简简、统统计计指指标标的的选选择择与计算、统计结果的表达等。与计算、统计结果的表达等。统统
4、计计分分析析及及得得出出正正确确结结论论,如如根根据据概概率率分分布布,对对实实验验和和观观察察结结果果存存在在的的差差异异和和关关联联作作出出统统计计推推断断。第7页,此课件共61页哦工作生活中常见的统计学问题工作生活中常见的统计学问题l如何判断药物的疗效?如何判断药物的疗效?(假设检验假设检验)l明天是否下雨?体育彩票能否中奖?明天是否下雨?体育彩票能否中奖?(概概率论率论)l子女为什么象父母,其强度有多大?子女为什么象父母,其强度有多大?(相关与回归相关与回归)l美国的民意测验是如何进行的?美国的民意测验是如何进行的?(设计设计,抽样抽样)l中国的市场调查的可信性有多大?中国的市场调查的
5、可信性有多大?(现现场调查场调查)统计学是对令人困惑费解的数字问题统计学是对令人困惑费解的数字问题 做做出设想的艺术。出设想的艺术。第8页,此课件共61页哦 医学论文中的统计学问题医学论文中的统计学问题60年代到年代到80年代,国外医学杂志调查结果:年代,国外医学杂志调查结果:有统计错误的论文有统计错误的论文20%72%。1996年对年对4586篇论文统计(中华医学会系篇论文统计(中华医学会系列杂志占列杂志占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。第9页,此课件共61页哦 60年代到年代到80年代,国外医学杂志调查表明:年代,国外医学杂志调查表明:20%72%的论文有统
6、计错误。的论文有统计错误。1984年年对对中中华华医医学学杂杂志志、中中华华内内科科杂杂志志、中中华华外外科科杂杂志志、中中华妇产科杂志华妇产科杂志、中华儿科杂志中华儿科杂志595篇论文的调查结果为:篇论文的调查结果为:相对数误用占相对数误用占 11.2%,抽样方法误用占抽样方法误用占15.9%,统计图表误用占统计图表误用占11.7%1996年年对对4586篇篇论论文文统统计计(中中华华医医学学会会系系列列杂杂志志占占6.9%),数数据据分分析析方方法法误用达误用达55.7%。2001年年中华预防医学杂志中华预防医学杂志:中华医学会系列杂志误用约:中华医学会系列杂志误用约54%(1995)。)
7、。1996年,有机构对申报科技成果的年,有机构对申报科技成果的4586篇科研论文分析,统计方法使篇科研论文分析,统计方法使用率为用率为76%。医学论文中统计运用错误,除了影响论文的科学性,还可能导医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。致严重的伦理学问题。第10页,此课件共61页哦 伪造统计数据违反科学道德伪造统计数据违反科学道德1976年年New Science 杂志关于科研舞弊行为杂志关于科研舞弊行为的调查的调查(1)74%的调查表反映有不正当修改数据的情的调查表反映有不正当修改数据的情况况(2)17%拼凑实验结果拼凑实验结果(3)7%凭空捏造数据凭空捏造
8、数据(4)2%故意曲解结果故意曲解结果第11页,此课件共61页哦二、统计工作的基本步骤二、统计工作的基本步骤l设计设计l收集资料收集资料l整理资料整理资料l分析资料分析资料第12页,此课件共61页哦1.1.专业设计:选题、建立假说、确定专业设计:选题、建立假说、确定 研究对象和技研究对象和技术方法等术方法等个性个性2.2.统计设计:围绕专业设计确定统计统计设计:围绕专业设计确定统计 设类型、样本设类型、样本大小、分组方法、统计分析指标及统计分析方法。大小、分组方法、统计分析指标及统计分析方法。(一)设计(一)设计 第13页,此课件共61页哦(二)收集资料(二)收集资料(一)资料来源(一)资料来
9、源l第一手资料第一手资料 经经常常性性:统统计计报报表表(死死亡亡登登记记、疫疫情情 报告等),工作记录(病历、化验);报告等),工作记录(病历、化验);一一时时性性:专专题题调调查查、实实验验或或临临床床试试验。验。l第二手资料:已公布的资料,如全国、第二手资料:已公布的资料,如全国、全省卫生统计资料。全省卫生统计资料。第14页,此课件共61页哦(二)收集资料(二)收集资料l(二)资料要求(二)资料要求1 1完整:观察单位及观察项目完整。完整:观察单位及观察项目完整。观察单位:最基本的获取数据的单元。可以是一个观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批
10、样品,一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。采样点。2 2准确:即真实、可靠。真实是统计学的灵魂。准确:即真实、可靠。真实是统计学的灵魂。3 3及时:即时限性。如人口普查规定调查开始日期和及时:即时限性。如人口普查规定调查开始日期和截止日期。截止日期。第15页,此课件共61页哦(三)整理资料 整整理理资资料料即即原原始始数数据据的的条条理理化化、系系统统化化的的过过程程。所所采采取取的的手手段段合合理化分组,目的理化分组,目的实现专业目标。实现专业目标。l质质分分组组:按按事事物物的的属属性性或或性性质质分分组组分类变量;分类变量;l量分组:按数据的大小量分组:按数据的大
11、小数值变量。数值变量。第16页,此课件共61页哦(四)分析资料(四)分析资料 1.1.统统计计描描述述:用用统统计计指指标标、统统计计图图表表对对资资料料的的数数量量特特征征及及分分布布规规律律进进行行测测定和描述。定和描述。2.2.统统计计推推断断:用用样样本本信信息息推推断断总总体体特特征:征:参数估计。参数估计。假设检验。假设检验。第17页,此课件共61页哦 三、统计资料的类型三、统计资料的类型 有三种类型的资料有三种类型的资料:计量资料计量资料,计数资料计数资料,等级资料等级资料 基本概念:变量及变量值,研究者对每个基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,
12、这观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。性质可将资料分为定量资料和定性资料。第18页,此课件共61页哦1.计量资料计量资料定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。特点:有度量衡单位 多为连续性资料 (通过测量得到)如患者的身高(如患者的身高(cm)、体重()、体重(kg)、)、血压(血压(mmHg)、脉搏(次)、脉搏(次/分)、分)、红细胞计数(红细胞计数(10/L)第
13、19页,此课件共61页哦l定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。l特点:没有度量衡单位 多为间断性资料(通过枚举或记数得来)如肤色(黑、白)、血型(如肤色(黑、白)、血型(ABO)、职业)、职业(工农兵)、性别(男女)(工农兵)、性别(男女)2.计数资料计数资料第20页,此课件共61页哦 定义:定义:介于计量资料和计数资料之间的一种资料,通过介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。半定量方法测量得到。特点:特点:每一个观察单位没有确切值每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。各组之间有性质上的差别或程度上的不同
14、。癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。药物疗效:治愈、好转、无效、死亡。尿蛋白:尿蛋白:,+,+及以上及以上3.等级资料等级资料第21页,此课件共61页哦对观察对象按对观察对象按属性属性或类型或类型分组计数所分组计数所得的资料。每个对得的资料。每个对象之间没有量的差象之间没有量的差异,只有质的不同。异,只有质的不同。资料的类型资料的类型 计量资料计量资料(数值变量或(数值变量或 定量资料)定量资料)计数资料计数资料(无(无序分类变量序分类变量 或定性资料)或定性资料)等级资料等级资料(有序分类变量有序分类变量 或半定量资料)或半定量资料)对每一观察对象
15、对每一观察对象用用定量定量的方法,的方法,测定某项指标所测定某项指标所得的资料。一般得的资料。一般有度量衡单位,有度量衡单位,每个对象之间有每个对象之间有量的区别。量的区别。对观察对象按属对观察对象按属性或类型性或类型程度的程度的不同不同分组计数,分组计数,但各属性或类型但各属性或类型之间又有程度的之间又有程度的差别。差别。第22页,此课件共61页哦 (1)不不同同类类型型的的资资料料采采用用的的统统计计分分析析方方法不同;法不同;(2)三类资料类型可以相互转化。)三类资料类型可以相互转化。注意:第23页,此课件共61页哦例:某地调查高血压的患病情况。例:某地调查高血压的患病情况。每人的血压:
16、以每人的血压:以mmHgmmHg计计计量资料计量资料以舒张压以舒张压90mmHg90mmHg为高血压,结果在为高血压,结果在10001000人中人中有有1010名高血压患者,名高血压患者,990990名非高血压患者,整理名非高血压患者,整理后的资料后的资料 计数计数资料资料按低血压、正常、高血压分组按低血压、正常、高血压分组所得资料。所得资料。等级资料等级资料第24页,此课件共61页哦四、统计学中的基本概念四、统计学中的基本概念l(一)总体与样本(一)总体与样本l1、总体、总体(population)l 根据研究目的所确定的同质的所有观根据研究目的所确定的同质的所有观察单位某项变量值的集合。察
17、单位某项变量值的集合。有关总体的三个要点:有关总体的三个要点:研究目的、同质的、全体研究目的、同质的、全体第25页,此课件共61页哦观察对象:观察对象:该地该地2002年全部正常成人年全部正常成人同质:同质:同一地区、同一年份、同为正常成人同一地区、同一年份、同为正常成人全体:全体:该地该地20022002年全部正常成人白细胞数年全部正常成人白细胞数目的:目的:了解某地了解某地2002年正常成人白细胞数年正常成人白细胞数观察单位:观察单位:每个人每个人 观察值:观察值:测得的白细胞数测得的白细胞数例如:例如:了解某地了解某地2002年正常成人白细胞数年正常成人白细胞数第26页,此课件共61页哦
18、四、统计学中的基本概念四、统计学中的基本概念l(二)变异:同质基础上个体值之间的差异,称为变异。l 同质:指观察单位或观察指标受共同因素制约的部分。l例如,同种族、同年龄、同性别的健康人,在相同的条件下测其脉搏、呼吸、体温等生理指标可以有很大差异。第27页,此课件共61页哦四、统计学中的基本概念四、统计学中的基本概念(三)参数和统计量(三)参数和统计量 1.参数参数:总体指标。2.统计量统计量:样本指标。(四)抽样误差(四)抽样误差 1.定义:定义:在统计学上把由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异统称为抽样误差。第28页,此课件共61页哦四、统计学中的基本概
19、念四、统计学中的基本概念(五)概率(五)概率概率概率:是描述随机事件发生是描述随机事件发生的可能性大小的数值。的可能性大小的数值。(1)必然事件必然事件:P(A)=1(2)不可能事件不可能事件:P(A)=0(3)随机事件随机事件(偶然事件偶然事件):0 P(A)1(4)小概率事件小概率事件:P0.05 或或 P0.01第29页,此课件共61页哦t t检验不是处理计数资料的万能方法检验不是处理计数资料的万能方法第30页,此课件共61页哦l l双向无序,两个分类变量皆为无序分类变量,一般用双向无序,两个分类变量皆为无序分类变量,一般用双向无序,两个分类变量皆为无序分类变量,一般用双向无序,两个分类
20、变量皆为无序分类变量,一般用卡方检验卡方检验卡方检验卡方检验。l l单向有序资料,单向有序资料,单向有序资料,单向有序资料,采用秩和检验采用秩和检验采用秩和检验采用秩和检验。l l双向有序且属性相同,研究目的通常是分析两种检测方法的双向有序且属性相同,研究目的通常是分析两种检测方法的双向有序且属性相同,研究目的通常是分析两种检测方法的双向有序且属性相同,研究目的通常是分析两种检测方法的一致性,此时应用一致性,此时应用一致性,此时应用一致性,此时应用一致性检验一致性检验一致性检验一致性检验。l l双向有序属性不同,根据具体情况可选择双向有序属性不同,根据具体情况可选择双向有序属性不同,根据具体情
21、况可选择双向有序属性不同,根据具体情况可选择秩和检验秩和检验秩和检验秩和检验,等级等级等级等级相关分析相关分析相关分析相关分析或者或者或者或者线性趋势检验线性趋势检验线性趋势检验线性趋势检验。卡方检验不是处理计数资料的万能方法卡方检验不是处理计数资料的万能方法第31页,此课件共61页哦卡方检验卡方检验第32页,此课件共61页哦秩和检验或秩和检验或RiditRidit分析分析第33页,此课件共61页哦原则原则:选择最恰当的统计指标准确描述资料的特征。:选择最恰当的统计指标准确描述资料的特征。非正态分布非正态分布计量资料计量资料正态分布正态分布计数资料计数资料 率或比率或比第34页,此课件共61页
22、哦 X X2 2检验检验 lX2检验或称卡方检验,是一种用途较广的假设检验方法,常用于检验两个或多个样本率及构成比之间有无差别,还用来检验配对定性资料及两种属性或特征之间是否有关系等。第35页,此课件共61页哦 2检验的适用资料检验的适用资料两组样本率的比较;两组样本率的比较;多组样本率的比较;多组样本率的比较;两组或多组构成比的比较;两组或多组构成比的比较;配对设计下两分类资料检验。配对设计下两分类资料检验。第36页,此课件共61页哦一、四格表资料的检验一、四格表资料的检验l四格表资料的检验主要用于两个样本率(或构成比)的假设检验,一般制成表6-2的计算格式(以阳性和阴性为例)。第37页,此
23、课件共61页哦表表6-2 6-2 四格表资料检验计算表四格表资料检验计算表组 别阳性数阴性数合计甲 组aba+b乙 组cdc+d合 计 a+cb+da+b+c+d=n第38页,此课件共61页哦X2检验的基本公式为 l理论频数T 条件:条件:n40,T5第39页,此课件共61页哦四格表检验专用公式 l省去计算T值第40页,此课件共61页哦例6.7 以例6.6资料为例 表6-3 用药组和对照组流感发病率的比较 组 别 发病人数 未发病人数合计用药组 14(20)86(80)100对照组 30(24)90(96)120合 计 44 176220第41页,此课件共61页哦两种方法计算结果第42页,此课
24、件共61页哦结果判断结果判断lX2临界值:X20.05,13.84,请记住 :X2 0.01,16.63,X2=u2 本例 :X2=4.125 X20.05,13.84,两组差别有统计学意义。与前面的结论相同。第43页,此课件共61页哦四格表值的校正四格表值的校正 l条件:l(1)任一格的1T5,且n40时,需计算校正值。l(2)任一格的T1或n40时,用确切概率计算法。基本公式基本公式 专用公式专用公式 第44页,此课件共61页哦例例6.86.8 某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表如表6-46-4,问两疗法的治愈率是否
25、相等?,问两疗法的治愈率是否相等?表6-4 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较 组 别 发病人数 未发病人数合计用药组 26(28.8)7(4.2)33对照组 36(33.2)2(4.8)38合 计 62 971第45页,此课件共61页哦计算结果及判断计算结果及判断l本例:X22.71 X2 0.05,1=3.84l本例若对X2值不校正,=4.06,得P0.05,结论正好相反。第46页,此课件共61页哦三、行列表的检验 l行列表(RC表)的检验主要用于解决多个样本率或多个样本构成比的比较以及有序分类资料的关联性检验。l 式式中中n n为为总总例例数数,A A为为每每格格子子的的实实
26、际际频频数数,n nR R、n nC C分分别别为为与与某某格子实际频数(格子实际频数(A A)同行、同列的合计数。)同行、同列的合计数。第47页,此课件共61页哦 行行列表资料的检验的注意事项列表资料的检验的注意事项l1.理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:l最好增加样本含量以增大理论频数;根本的方法。l删去理论频数太小的行和列;此法不好。l将理论频数较小的行或列与邻行或邻列合并以增大理论频数。但后两法可能会损失信息,第48页,此课件共61页哦 行行列表资料的检验的注意事项列表资料的检验的注意事项l2.当多个样本率(或
27、构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用下述的行列表的分割法。l3.对于行列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。第49页,此课件共61页哦t t检验与检验与u u检验的应用条件检验的应用条件两组数值变量资料比较;两组数值变量资料比较;小样本时用小样本时用t t检验,要求资料为随机样本并服检验,要求资料为随机样本并服从正态分布;从正态分布;大样本时用大样本时用u u检验,仍要求资料为随机样本
28、,检验,仍要求资料为随机样本,但正态性条件可以放宽;但正态性条件可以放宽;在两样本均数比较的在两样本均数比较的t t和和u u检验中,要求两组检验中,要求两组总体方差相等,即方差齐性;总体方差相等,即方差齐性;组间要求具有均衡可比性。组间要求具有均衡可比性。第50页,此课件共61页哦 单样本均数的t检验对于总体标准差未知的小样本数据对于总体标准差未知的小样本数据(n60)(n60),单,单样本均数的假设检验采用样本均数的假设检验采用t t检验,计算公式为检验,计算公式为第51页,此课件共61页哦 l例例 通过以往大规模调查,已知某地新生儿出生体重均数为3.30kg。从该地难产儿中随机抽取35名
29、新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿出生体重不同?第52页,此课件共61页哦第53页,此课件共61页哦1.1.统计表的结构统计表的结构2.2.统计表的种类统计表的种类3.3.编制统计表应注意的事项编制统计表应注意的事项统计表统计表第54页,此课件共61页哦包括标题、标目、线条、数字、备注包括标题、标目、线条、数字、备注标标题题:位位于于统统计计表表的的上上方方中中央央,要要表表达达出出统统计计表表的的主要内容,必要时应注明时间、地点。主要内容,必要时应注明时间、地点。标目:标目用简单的文字来说明表格内的项目,要有单位。标目:
30、标目用简单的文字来说明表格内的项目,要有单位。线条:线条:3 34 4条横线,禁用竖线、斜线。条横线,禁用竖线、斜线。统计表的结构统计表的结构 第55页,此课件共61页哦 统计表的种类统计表的种类 根据分组标目的复杂程度,统计表可大致分为简单表根据分组标目的复杂程度,统计表可大致分为简单表和复合和复合表。表。简单表简单表(simple table)(simple table):只按一个特征或标志:只按一个特征或标志分组。分组。组合表组合表(combinative table)(combinative table):按两个或两个:按两个或两个以上特征或标志结合起来分组。以上特征或标志结合起来分组
31、。第56页,此课件共61页哦数数字字:表表内内的的数数字字必必须须准准确确无无误误,用用阿阿拉拉伯伯数数字字表表示示。同同一一指指标标的的小小数数位位数数要要一一致致,上上下下要要对对齐齐,表表内内不不留留空空格格,数数字字暂暂缺缺或或未未记记录录用用“”表表示示,无无数数字用字用“”表示,数字若是表示,数字若是0,则填写,则填写0备备注注:表表中中用用“*”“*”标标出出,再再在在表表的的下下方方用用文文字字加加以以说明。说明。第57页,此课件共61页哦编制统计表应注意的事项编制统计表应注意的事项重点突出,简单明了。重点突出,简单明了。主谓分明,层次清楚。主谓分明,层次清楚。第58页,此课件共61页哦麦亚根糖浆治疗麦亚根糖浆治疗161例急慢性肝炎疗效例急慢性肝炎疗效第59页,此课件共61页哦改表举例:改表举例:麦亚根糖浆治疗麦亚根糖浆治疗161例急慢性肝炎疗效例急慢性肝炎疗效第60页,此课件共61页哦感感谢谢大大家家观观看看第61页,此课件共61页哦
限制150内