医学医学统计学..pptx
《医学医学统计学..pptx》由会员分享,可在线阅读,更多相关《医学医学统计学..pptx(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1医学医学(yxu)医学医学(yxu)统计学统计学.第一页,共46页。第一章第一章 绪论绪论(xln)第1页/共46页第二页,共46页。“统计(tngj)”一词,对一般人来说并不陌生。在报刊上常见用来说明我们工作、事业成绩的数字、表、图,称为统计(tngj)数字、统计(tngj)表和统计(tngj)图。在西方,统计(tngj)学(statistics)一词,源出于state(国家、情况),专指有关“国情”的学问,最初多用于文字记叙,后发展为数量比较,随着概率论思想与方法的引入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。第2页/共46页第三页,共46页。第一节第一节 医学医学(y
2、xu)统统计学的定义计学的定义n n统计学(statistics):是研究数据的收集、整理、分析的一门学科。n n医学统计学(medical statistics):是应用概率论和数理统计(sh l tn j)的基本原理和方法,研究医学数据的收集、整理、分析的一门应用学科。第3页/共46页第四页,共46页。例:治疗某病的新疗法新法:(100例)有效20例,有效率20;旧法:(100例)有效15例,有效率15;这两个百分数就是统计(tngj)描述指标,现在的问题是,这两种疗法的有效率会稳定不变吗?如果说不会,是什么原因?那么,两种疗法的真实有效率会是多少?我们能根据统计(tngj)描述(20与1
3、5)就去正式采用还有较大副作用的新疗法?对这样的差第4页/共46页第五页,共46页。异问题异问题,你能再凭直觉去作你能再凭直觉去作“否定否定”?”?在作在作任何回答之前任何回答之前,必须判断必须判断2020 与与1515 之间之间的差别是真实的差异的差别是真实的差异,或是仅仅由于或是仅仅由于“机遇机遇”所致所致(su(su zh)zh)。这里。这里,统计推断可提供帮助。学过统计推断可提供帮助。学过统统计学计学,将会了解不仅可判断新疗法是否较好将会了解不仅可判断新疗法是否较好?而且而且,如果判断它是较好如果判断它是较好,还能估计判断是还能估计判断是错误的可能性有多大。错误的可能性有多大。第5页/
4、共46页第六页,共46页。统计分析是科研工作中的一种有力工具。它从科研的总体设计、资料采集、资料整理、资料分析直到(zhdo)最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。需要运用统计方法的场合而不去运用它可能造成不应有的缺陷或得出错误的结论。第6页/共46页第七页,共46页。例例1:1:北京北京(bi jn(bi jn)某医院某大夫使用某医院某大夫使用“乌贝乌贝散散”(乌贼骨乌贼骨3 3钱钱,白芨白芨3 3钱钱,川贝川贝3 3钱钱,甘草甘草3 3钱钱,共研细末共研细末过过120120目筛目筛,冲服冲服)治疗胃溃疡病出血治疗胃溃疡病出血107107例
5、例,有效有效101101例例,有效率为有效率为94.494.4。那么如果别的医院。那么如果别的医院,其其它大夫使用它大夫使用“乌贝散乌贝散”来治疗胃溃疡病出血来治疗胃溃疡病出血,其有效率也一定是其有效率也一定是94.494.4 吗吗?显然显然,不一定恰为不一定恰为94.494.4,那么是多少呢那么是多少呢?比它高还是比它低比它高还是比它低?这就这就是一个求可信区间的问题。是一个求可信区间的问题。第7页/共46页第八页,共46页。例例2:2:某杂志中一篇文章报导某杂志中一篇文章报导,用某种用某种中草药治疗玫瑰糠疹中草药治疗玫瑰糠疹,有效率为有效率为7878,平均平均(pngjn)(pngjn)疗
6、程为三周左右。问此药治疗玫瑰糠疹的确疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗有效吗?由于玫瑰糠疹具有自然治愈的情况由于玫瑰糠疹具有自然治愈的情况,一般不服药一般不服药,多喝水多喝水,到三周左右有些患者到三周左右有些患者也会自愈。所以也会自愈。所以,此药的此药的7878疗效有待探讨。疗效有待探讨。这就要求设立具有可比性的对照组。这就要求设立具有可比性的对照组。第8页/共46页第九页,共46页。再譬如再譬如,用某药治某病用某药治某病,治一例治一例(yl)(yl)有效有效,能说能说100100有效吗有效吗?治疗二例有效治疗二例有效,能说明能说明100100有效吗有效吗?治十例治十例,其中九例有效
7、其中九例有效,能能说说9090有效吗有效吗?显然显然,观察的例数将是个重观察的例数将是个重要因素要因素,例数太少不足以说明问题。观察例例数太少不足以说明问题。观察例数太多数太多,将费时将费时,加重科研经济负担。那么加重科研经济负担。那么观察多少例能说明问题观察多少例能说明问题?这是一个样本可靠这是一个样本可靠性问题。性问题。第9页/共46页第十页,共46页。第二节第二节 医学统计学的主要医学统计学的主要(zhyo)内容内容(一一)统计研究统计研究(ynji)(ynji)设计设计 1.1.实验设计实验设计 2.2.调查设计调查设计第10页/共46页第十一页,共46页。在基础,临床和预防医学研究中
8、,经常遇到科研设计的问题。例如,在临床药物研究中,我们要了解某降压药的疗效。一般地,药物的疗效要受许多因素的影响:药物本身的性质,给药途径,给药时间,病人的病情以及病人的心理状态等。这些因素有些是可以(ky)控制的,有些是不能控制的。因此,我们在做研究前,要有一个全面合理的计划,以排除实验中的影响因素,使研究因素的效应突出地表现出来,从中得出准确的结论。第11页/共46页第十二页,共46页。医医学学统统计计中中讲讲的的研研究究设设计计就就是是设设计计医医学学实实验验或或调调查查研研究究的的过过程程,使使从从实实验验或或调调查查得得来来的的数数据据(shj)(shj)适适合合用用统统计计方方法法
9、分分析析,得得出出有有效效的的和和客观的结论。客观的结论。第12页/共46页第十三页,共46页。例例如如:现现有有两两种种抗抗肿肿瘤瘤药药,欲欲探探索索其其对对肿肿瘤瘤细细胞的敏感作用。胞的敏感作用。当当我我们们考考虑虑这这样样的的实实验验时时,有有许许多多问问题题(wnt)(wnt)要加以认真思考要加以认真思考,如如:1)1)目目前前抗抗肿肿瘤瘤药药的的效效果果如如何何?该该两两种种药药优优于于其其它抗肿瘤药的可能特点是什么它抗肿瘤药的可能特点是什么?2)2)在在这这个个实实验验中中要要用用多多少少种种癌癌细细胞胞?用用什什么么方方式把两种药作用到每种癌细胞式把两种药作用到每种癌细胞?3)3
10、)要要观观察察的的实实验验指指标标是是什什么么?如如何何收收集集实实验验数数据据?第13页/共46页第十四页,共46页。4)4)在这个实验中在这个实验中,可能影响实验结果的可能影响实验结果的非实验因素有哪些非实验因素有哪些(n(n xi)?xi)?应该怎样控制应该怎样控制?5)5)应该用什么统计方法分析该实验的数应该用什么统计方法分析该实验的数据据?怎样评价两种药物的效果怎样评价两种药物的效果?所有这些问题或者还有许多问题所有这些问题或者还有许多问题,都都必须在进行实验之前充分考虑必须在进行实验之前充分考虑,作到心中作到心中有数有数,然后决定怎样作这个实验然后决定怎样作这个实验,既作出既作出实
11、施实验步骤的计划实施实验步骤的计划,这个过程就是实验这个过程就是实验设计设计(design of experiment)(design of experiment)。第14页/共46页第十五页,共46页。(二)常用的基本统计方法 1.统计描述 2.统计推断(tudun)3.二项分布和Poisson分布 4.直线回归和相关、协方差分析等第15页/共46页第十六页,共46页。(三三)临床医学中常用临床医学中常用(chn yn)(chn yn)的统计方法的统计方法 1.1.随机对照实验、交叉设计、配对设计、配随机对照实验、交叉设计、配对设计、配伍组设计、析因设计及诊断与筛检试验设计伍组设计、析因设计
12、及诊断与筛检试验设计 2.2.随访资料的生存分析随访资料的生存分析 3.3.信度与效度分析信度与效度分析 4.Meta 4.Meta 分析分析第16页/共46页第十七页,共46页。(四)常用医学人口和疾病统计(tngj)指标及其应用;寿命表的编制原理及其在医学上的应用。(五)多因素分析的统计(tngj)方法:1.多重线性相关与回归 2.Logistic回归 3.Cox比例风险模型 第17页/共46页第十八页,共46页。第三节第三节 统计工作统计工作(gngzu)(gngzu)的基本步骤的基本步骤(一一)设计设计 1.确定研究目的确定研究目的2.确定研究对象及其数量确定研究对象及其数量3.确定观
13、察指标确定观察指标4.设立适当设立适当(shdng)对照对照 组及随机化分组组及随机化分组5.制定较好的原始记录表制定较好的原始记录表6.考虑好统计分析方法考虑好统计分析方法7.预期会有何结果预期会有何结果8.人员组织及经费预算人员组织及经费预算第18页/共46页第十九页,共46页。(二二)收集资料收集资料 收集资料就是根据研究的目的收集资料就是根据研究的目的,实验设实验设计的要求计的要求,收集准确的完整的充满收集准确的完整的充满(chngmn)(chngmn)信息的原信息的原始资料始资料(raw data)(raw data)。资料来源资料来源:1.1.临床试验中的病例观察表。临床试验中的病
14、例观察表。2.2.国家法定报表国家法定报表:卫生工作报表、传染病报表、卫生工作报表、传染病报表、职业病报表、医院工作报表。职业病报表、医院工作报表。3.3.大规模的流行病调查获取的现场调查资料。大规模的流行病调查获取的现场调查资料。第19页/共46页第二十页,共46页。这些资料这些资料(zlio)(zlio)的收集过程的收集过程,必须进行质量控必须进行质量控制。包括它的统一性制。包括它的统一性,确切性确切性,可重复性。可重复性。对这些原始数据的精度对这些原始数据的精度(precision)(precision)和偏性和偏性(bias)(bias)应有明确的控制范围。应有明确的控制范围。第20页
15、/共46页第二十一页,共46页。(三三)整理资料整理资料 整理资料就是把收集到的原始资料整理资料就是把收集到的原始资料,有有目的地进行目的地进行(jnxng)(jnxng)科学加工科学加工,使资料系统化、条理使资料系统化、条理化化,以便进行以便进行(jnxng)(jnxng)统计分析。统计分析。1.1.专业检查专业检查:男性患者的调查表中不应出现妇科疾男性患者的调查表中不应出现妇科疾病等病等;从专业的角度对资料的一致性进行从专业的角度对资料的一致性进行(jnxng)(jnxng)检查检查,比如诊断和疗效的评定标准是否统一比如诊断和疗效的评定标准是否统一,胃镜胃镜下萎缩性胃炎的严重程度的评定标准
16、是否一致下萎缩性胃炎的严重程度的评定标准是否一致等。等。2.2.逻辑检查逻辑检查:比如退休时的年龄不应出现小于比如退休时的年龄不应出现小于2020岁岁;六岁的孩子不应有大学文化程度。六岁的孩子不应有大学文化程度。第21页/共46页第二十二页,共46页。3.统计检查:检查报表(或报告卡)的纵向,横向的合计和总的合计是否吻合。体重(tzhng)8.50(公斤),身高69.0(cm),头围44.0(cm),胸围42.5(cm),坐高43.0(cm)。理论上算,这五个数据都是以0或5结尾可能性0.032 第22页/共46页第二十三页,共46页。(四四四四)分析资料分析资料分析资料分析资料 分析资料就是
17、把经过统计整理的资料分析资料就是把经过统计整理的资料分析资料就是把经过统计整理的资料分析资料就是把经过统计整理的资料,作一系列统计描述和统计推断作一系列统计描述和统计推断作一系列统计描述和统计推断作一系列统计描述和统计推断,阐明事物的阐明事物的阐明事物的阐明事物的规律性。应该注意规律性。应该注意规律性。应该注意规律性。应该注意,不同的资料使用的统计不同的资料使用的统计不同的资料使用的统计不同的资料使用的统计描述和统计推断的方法是不一样的描述和统计推断的方法是不一样的描述和统计推断的方法是不一样的描述和统计推断的方法是不一样的,必须加必须加必须加必须加以区分。以区分。以区分。以区分。1.1.统计
18、描述统计描述统计描述统计描述:指用统计指标、统计表、指用统计指标、统计表、指用统计指标、统计表、指用统计指标、统计表、统计图对资料的数量统计图对资料的数量统计图对资料的数量统计图对资料的数量(shling)(shling)特征及其分布规特征及其分布规特征及其分布规特征及其分布规律进行测定和描述。律进行测定和描述。律进行测定和描述。律进行测定和描述。2.2.统计推断统计推断统计推断统计推断:指如何抽样及由样本信息推断总体指如何抽样及由样本信息推断总体指如何抽样及由样本信息推断总体指如何抽样及由样本信息推断总体特征。特征。特征。特征。第23页/共46页第二十四页,共46页。第四节第四节 医学统计中
19、的基医学统计中的基本概念本概念 及医学资料及医学资料(zlio)的分类的分类一、基本概念(一)变异(variation):同质基础上个体值之间的差异,称为(chn wi)变异。医学研究的对象是有机的生命体,其机能是十分复杂的。不同的个体在相同的条件下,对外界环境因素可以发生不同的反应。例如,同种族、同年龄、同性别的健康人,在相同的条件下测其脉搏、呼吸、体温等生理指标可以有很大差异。在临床治疗中,用同样的药物治疗病情相同的病人,疗效也不尽相同。即使在实验室里,动物与动物之间也有明显的差异。这种现象称为(chn wi)个体差异或称为(chn wi)变异。变异是由众多的、偶然的、次要的因素造成的。第
20、24页/共46页第二十五页,共46页。由于医学统计研究的对象是有变异的事由于医学统计研究的对象是有变异的事物物,因此因此,用观察用观察1 12 2例的结果来推论出例的结果来推论出一般规律是不恰当的。例如一般规律是不恰当的。例如,我们不能用某我们不能用某一健康成人的红细胞数作为一般健康成人的一健康成人的红细胞数作为一般健康成人的红细胞数红细胞数;也不能因为用青木香治疗一例高也不能因为用青木香治疗一例高血压患者有效血压患者有效,而断定青木香治疗高血压有而断定青木香治疗高血压有效率为效率为 100 100,因为观察例数太少因为观察例数太少,受个受个别的偶然的因素影响太大。科学研究的工作别的偶然的因素
21、影响太大。科学研究的工作,主要任务之一就是要从表现为偶然性的大量主要任务之一就是要从表现为偶然性的大量(dling)(dling)数据中数据中,分析出其中必然性的规律。而概率论分析出其中必然性的规律。而概率论和数理统计就是要通过这种偶然性去寻找隐和数理统计就是要通过这种偶然性去寻找隐藏在其内部的必然规律性。藏在其内部的必然规律性。第25页/共46页第二十六页,共46页。(二)总体和样本1.总体(population):是根据研究目的确定的同质的所有观察单位某种变量值的集合。有限(yuxin)总体:指明确了特定的时间、空间范围的有限(yuxin)个观察单位所组成的总体。无限总体:没有时间和空间范
22、围限制的无限个观察单位所组成的总体。第26页/共46页第二十七页,共46页。2.2.样本样本(yngbn)(sample):(yngbn)(sample):是总体中随是总体中随机抽取的部分观察单位机抽取的部分观察单位,其实测值的集其实测值的集合。合。样本样本(yngbn)(yngbn)含量含量(sample size):(sample size):是是指样本指样本(yngbn)(yngbn)中所包含的观察单位中所包含的观察单位数。数。第27页/共46页第二十八页,共46页。譬如,我们要研究华北地区成年人的血液的红细胞数的正常值,那么,华北地区全部健康成年人的血液都是我们的研究对象,这称为总体。
23、但是,我们不可能把华北地区所有健康成年人都进行血液检查,而只能按照一定的科学方法从中抽取一部分人来进行血液检查。然后,根据检验结果来推论(tuln)华北地区成年人的血液的正常值。这种从总体中抽取部分个体的过程称为抽样(sampling),所抽得的部分成为样本,如何正确的从样本观察到的情况来推测总体,这就是医学统计学要解决的问题之一。第28页/共46页第二十九页,共46页。从总体中抽取样本,一定要遵循科学原则。一般来说,一个样本应具有“代表性(representative)”、“随机性(randomization)”和“可靠性(reliability)”。代表性:就是要求样本中的每一个个体必须符
24、合总体的规定。这就要求对总体有一个明确的规定。这种规定是根据研究(ynji)目的而具体确定的。第29页/共46页第三十页,共46页。例如例如,要调查华北地区成年男子的红细要调查华北地区成年男子的红细胞数的正常值胞数的正常值,则我们可以规定则我们可以规定(gudng)(gudng)研研究对象为体温正常、无急性病、无血液消究对象为体温正常、无急性病、无血液消耗性疾病耗性疾病,肝在肋缘下肝在肋缘下0.5cm0.5cm以内以内,血红蛋白血红蛋白在在12.512.5克以上克以上,血小板在血小板在1010万以上的华北地区万以上的华北地区1818岁以上的男子。必须做肝功、线胸透及岁以上的男子。必须做肝功、线
25、胸透及某些血项检查某些血项检查等等,那么所抽取的样本中那么所抽取的样本中的每个个体都必须做上述检查的每个个体都必须做上述检查,并符合上述并符合上述规定规定(gudng)(gudng)。第30页/共46页第三十一页,共46页。随机性 就是要保证总体中的每个个体有相同的几率被抽作样本。重要的是要避免主客观的“偏因”。必须指出,随机化抽样绝不等于随意抽样。例如,将40只小鼠分为两组。如果闭上眼睛,随意抓取20只作为(zuwi)第一组,留下的作为(zuwi)第二组。表面上看来是随机的,实际上是不随机的。因为体壮、活泼性强的小鼠难于抓到,故大部分留在第二组,两组的活泼性是不同的。第31页/共46页第三十
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学
限制150内