《医学统计学基本概念备课讲稿.ppt》由会员分享,可在线阅读,更多相关《医学统计学基本概念备课讲稿.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学基本概念第一章第一章 绪绪 论论n统计学的定义和发展统计学的定义和发展n统计工作的基本内容统计工作的基本内容n医学统计学中的基本概念医学统计学中的基本概念统计学统计学n统计学统计学(Statistics)是运用概率论和数是运用概率论和数理统计的方法,研究数据收集、整理、理统计的方法,研究数据收集、整理、分析、推断等的一门学科。分析、推断等的一门学科。n按应用划分:按应用划分:医学统计学:医学统计学:n医学统计学医学统计学(Medical Statistics)就是统计学原理就是统计学原理和方法在医学研究领域的应用。和方法在医学研究领域的应用。n现在生物医学实验室研究、临床研究、流行病
2、学现在生物医学实验室研究、临床研究、流行病学探索和公共卫生管理都要寻求统计学家的合作。探索和公共卫生管理都要寻求统计学家的合作。美国国立卫生研究院的基金申请要求合作者有统美国国立卫生研究院的基金申请要求合作者有统计学专家,并且必须有统计设计和分析的内容。计学专家,并且必须有统计设计和分析的内容。在药物开发中,制药公司要招聘统计学家指导研在药物开发中,制药公司要招聘统计学家指导研究设计、分析数据。总之,统计的思维和方法已究设计、分析数据。总之,统计的思维和方法已经渗透到医学研究和卫生政策之中。经渗透到医学研究和卫生政策之中。医学统计学发展:医学统计学发展:1.法国数学家法国数学家Laplace提
3、出医学是概率论应用提出医学是概率论应用的一个重要领域。的一个重要领域。2.19世纪,世纪,Louis 把统计学引入到医学,强把统计学引入到医学,强调用数据表达疗效调用数据表达疗效3.Karl Pearson是现在统计学之父。是现在统计学之父。4.另一位统计学奠基人另一位统计学奠基人Fisher,临床随机对临床随机对照实验照实验为什么要学习统计学n对对“证据证据”解释的苛刻要求,使医学研究人员认识解释的苛刻要求,使医学研究人员认识到:要使自己的研究结果成为被同行认可的科学证到:要使自己的研究结果成为被同行认可的科学证据,必须在研究工作中采用科学方法。据,必须在研究工作中采用科学方法。n统计学在医
4、学研究中的运用越来越广泛,越来越深统计学在医学研究中的运用越来越广泛,越来越深入。在医学研究报告和医学期刊中,一些研究结果入。在医学研究报告和医学期刊中,一些研究结果直接用数据和图表表示,并且充满了均数(直接用数据和图表表示,并且充满了均数()和)和标准差(标准差(S S)、)、随机分组、值等统计专业术语。随机分组、值等统计专业术语。n对医生和医学科学工作者来说,医学论文起到两个对医生和医学科学工作者来说,医学论文起到两个作用。一是通过撰写和发表论文,报告自己观察或作用。一是通过撰写和发表论文,报告自己观察或实验的研究结果,二是阅读别人的论文,吸收新知实验的研究结果,二是阅读别人的论文,吸收新
5、知识,了解学术进展。撰写论文,对自己研究结果的识,了解学术进展。撰写论文,对自己研究结果的数据资料要能够正确地表达和分析。数据资料要能够正确地表达和分析。医学论文中的统计学问题医学论文中的统计学问题60年代到年代到80年代,国外医学杂志调查结果:年代,国外医学杂志调查结果:有统计错误的论文有统计错误的论文20%72%。1996年对年对4586篇论文统计(中华医学会系篇论文统计(中华医学会系列杂志占列杂志占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。伪造统计数据违反科学道德伪造统计数据违反科学道德1976年年New Science 杂志关于科研舞弊杂志关于科研舞弊行为的调查行
6、为的调查(1)74%的调查表反映有不正当修改数据的调查表反映有不正当修改数据的情况的情况(2)17%拼凑实验结果拼凑实验结果(3)7%凭空捏造数据凭空捏造数据(4)2%故意曲解结果故意曲解结果第二节 统计工作的基本内容 (步骤)n实验设计n收集资料n整理资料n分析资料一、实验设计n根据研究目的,制定研究方案根据研究目的,制定研究方案,对整个过程进对整个过程进行安排,是整个工作的关键。行安排,是整个工作的关键。如何进行设计?专业设计和统计学设计如何进行设计?专业设计和统计学设计研究对象的纳入标准、排除标准、样本含量、样研究对象的纳入标准、排除标准、样本含量、样本获取方法,实验组和对照组的分组原则
7、,确本获取方法,实验组和对照组的分组原则,确定观察指标及精度,实验过程中的质量控制,定观察指标及精度,实验过程中的质量控制,拟使用的统计方法等拟使用的统计方法等n背景背景-目的目的-方法方法-内容内容-经费预算经费预算(1)专业设计n反映课题研究的深度与水平反映课题研究的深度与水平nwhywhy?了解专业现状、学术前沿、研究动态、了解专业现状、学术前沿、研究动态、水平及发展方向和条件,提出课题(立题依据,水平及发展方向和条件,提出课题(立题依据,项目研究意义和应用前景、国内外研究现状分项目研究意义和应用前景、国内外研究现状分析,附主要参考文献等)析,附主要参考文献等)nwhatwhat?主要解
8、决的问题(研究目目标,研究内主要解决的问题(研究目目标,研究内容和拟解决的关键问题等,提出详尽的分析是容和拟解决的关键问题等,提出详尽的分析是思路和技术路线,做好周密的考虑和安排)思路和技术路线,做好周密的考虑和安排)(2)统计设计nhowhow?n分析目的分析目的n研究对象研究对象n分析指标、观察单位、检测内容和方法分析指标、观察单位、检测内容和方法n如何获取资料、怎样整理计算如何获取资料、怎样整理计算n如何控制误差、组织实施等如何控制误差、组织实施等二、收集资料n来源:实验数据和现场调查资料、医疗来源:实验数据和现场调查资料、医疗工作记录、报表和报告卡。工作记录、报表和报告卡。n要求:要求
9、:1 1、完整、准确、及时、完整、准确、及时2 2、要有足够的数量、要有足够的数量3 3、资料的代表性和可比性、资料的代表性和可比性 三、整理资料n对资料进行整理、清理、核实、查对使资对资料进行整理、清理、核实、查对使资料系统化、条理化便于计算和分析。料系统化、条理化便于计算和分析。1.1.原始资料的检查与核对:原始资料的检查与核对:数据的取值范围数据的取值范围检错和数据间逻辑关系检错检错和数据间逻辑关系检错2.2.资料的分组设计与归纳汇总:资料的分组设计与归纳汇总:质量分组和质量分组和数量分组和编制频数分布表。数量分组和编制频数分布表。n常用软件:常用软件:ExcelExcel、SPSSSP
10、SS、SASSAS四、分析资料n运用统计学的基本原理和方法,分析计算运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。有关的指标和数据,揭示事物内部的规律。n统计描述、统计推断统计描述、统计推断n变异变异n总体与样本总体与样本n计量资料、计数资料计量资料、计数资料n参数与统计量参数与统计量n误差误差n概率概率第三节 医学统计学中的基本概念总体与样本(population and sample)n总体:总体:根据研究目的确定的根据研究目的确定的同质同质研究对象的研究对象的全体全体(集合)。分有限总体与无限总体(集合)。分有限总体与无限总体n样本:样本:从总体中随机抽取的部
11、分观察单位从总体中随机抽取的部分观察单位 样本包含的观察单位数称为样本含量或样本样本包含的观察单位数称为样本含量或样本大小。大小。用用n表示表示总 体样 本为了了解某地2029岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名2029岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()A该地所有2029的健康女性 B该地所有2029的健康女性的血红蛋白测量值 C抽取的这2000名2029岁女性 D抽取的这2000名2029岁女性的血红蛋白测量值B随机抽样n随机抽样:随机抽样:为了保证样本的为了保证样本的可靠性可靠性和和代代表性表性,需要采用随机的抽样方法,以保,需要采用随机的
12、抽样方法,以保证总体中证总体中每个个体每个个体都具有都具有相同的机会相同的机会被被抽到)。抽到)。n随机抽样方法:单纯随机抽样 分层抽样注意:随机不等于随便 计量资料n对每个观察对象的观察对每个观察对象的观察指标用定量方法测定其指标用定量方法测定其数值大小所得的资料,数值大小所得的资料,一般用度量衡单位表示,一般用度量衡单位表示,简单的说简单的说计量资料就是计量资料就是用度量衡测量出来带有用度量衡测量出来带有单位的资料。单位的资料。如身高、如身高、体重、血红蛋白体重、血红蛋白 计数资料n是先将观察对象的观察指标按性质或类别进是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的
13、数目所行分组,然后计数各组该观察指标的数目所得的资料。得的资料。分为无序分类资料和有序分类资分为无序分类资料和有序分类资料(等级资料)料(等级资料)1 1)无序分类:如各种血型的人数无序分类:如各种血型的人数2 2)有序分类:等级资料,如尿糖)有序分类:等级资料,如尿糖+、+、+注意计量资料和计数资料之间可以相互转化注意计量资料和计数资料之间可以相互转化住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月2025653202565322221
14、6016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产20194642019464
15、242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variablesQuantitative dataQuantitative data计量资料计量资料Qualitative data Qualitative data 计数资料计数资料Units;elements实例数据实例数据1实例数据实例数据2三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界
16、分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 单纯随机抽样单纯随机抽样系统抽样系统抽样分层抽样分层抽样(2)增加样本量增加样本量n(3)选择变异程度较小的研究指标选择变异程度较小的研究指标 概率(probabilityprobability)n举例:举例:抛一枚硬币,是否国徽面一定向上?明天的股市升还抛一枚硬币,是否国徽面一定向上?明天的股市升还是降?某患者痊愈的可能性?这些问题的答案都不可能绝对。是降?某患者痊愈的可能性?这些问题的答案都不可能绝对。n概念:概念:描述随机事件发生的可能性大小的数值,常用描述随机事件发生的可能性大小的数值,常用P来表来表示。示。n大小:
17、大小:0P1,越接近于越接近于1,说明发生的可能性越大,越,说明发生的可能性越大,越接近于接近于0,说明发生的可能性越小。,说明发生的可能性越小。n小概率事件:小概率事件:在统计学上,习惯将在统计学上,习惯将P0.05或或P0.01的事的事件作为小概率事件件作为小概率事件。n原原理理:小小概概率率事事件件在在一一次次抽抽样样或或实实验验中中不不发发生生。例例如如车车祸祸,飞机失事,学生上课迟到飞机失事,学生上课迟到 小结:n重点:几个基本概念(计量资料与计数重点:几个基本概念(计量资料与计数资料、参数与统计量、总体与样本、抽资料、参数与统计量、总体与样本、抽样误差)样误差)n熟悉:小概率事件、
18、统计工作的基本步熟悉:小概率事件、统计工作的基本步骤、减少抽样误差的方法骤、减少抽样误差的方法n了解:统计学定义及发展了解:统计学定义及发展1.1.统计学中所说的有代表性的样统计学中所说的有代表性的样本指的是(本指的是()A.随意抽取的总体中任意个体随意抽取的总体中任意个体B.有意识地选择总体中有典型个体有意识地选择总体中有典型个体C.依照研究者要求选取总体中有意义的个体依照研究者要求选取总体中有意义的个体D.最方便获取的部分个体最方便获取的部分个体E.依照随机原则抽取总体中的个体依照随机原则抽取总体中的个体E2.2.下列变量的观测结果属于等级下列变量的观测结果属于等级资料的是(资料的是()A
19、.白细胞计数白细胞计数B.住院天数住院天数C.门诊就诊人数门诊就诊人数D.患者病情分级患者病情分级E.各临床科室的患者数各临床科室的患者数D3.3.抽样的目的是(抽样的目的是()A.研究样本统计量研究样本统计量B.由样本统计量推断总体参数由样本统计量推断总体参数C.研究典型案例研究典型案例D.研究总体统计量研究总体统计量E.研究特殊个体特征研究特殊个体特征B4.4.关于随机抽样,下列哪一项说法关于随机抽样,下列哪一项说法是正确的(是正确的()A.抽样时应使得总体中的每一个个体都有同抽样时应使得总体中的每一个个体都有同等的机会被抽取等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样研究者在抽
20、样时应精心挑选个体,以使样本更能代表总体本更能代表总体C.随机抽样即随意抽取个体随机抽样即随意抽取个体D.为确保样本具有很好的代表性,样本量应为确保样本具有很好的代表性,样本量应越大越好越大越好E.选择符合研究者意愿的样本选择符合研究者意愿的样本A5 5、对某地、对某地200200名名1616岁中学生口腔岁中学生口腔检查,发现龋齿的人数检查,发现龋齿的人数5454人,人,该资料属于(该资料属于()A.计量资料B.计数资料C.等级资料D.经变量转换也可以作为计量资料B6 6、下面的变量中,属于计数变量、下面的变量中,属于计数变量的是(的是()A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血
21、压B7 7、某人记录了、某人记录了5050名病人体重的测定结果:名病人体重的测定结果:小于小于50Kg50Kg的的1313人,介于人,介于50Kg50Kg和和70 Kg70 Kg间间的的2020人,大于人,大于70 Kg70 Kg的的1717人人 ,此种资,此种资料属于(料属于()A.计量资料 B.计数资料 C.等级资料 D.无序分类的计数资料 E.名义变量资料C8 8、下面的变量中,属于计量变量、下面的变量中,属于计量变量的是(的是()nA.性别 nB.体重 nC.血型 nD.职业 nE.民族B9 9、调查某单位科研人员论文发表的情况,、调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于(统计每人每年的论文发表数应属于()A.计量资料 B.计数资料C.总体D.个体A1.在研究工作中 误差是不可避免的,误差是可以而且应该避免的,统计方法能处理的是 误差。2.统计分析的主要包括 。3.统计工作的四个步骤是:,。随机测量系统抽样统计描述和统计推断实验设计 收集资料整理资料分析资料 某年级甲班、乙班各有某年级甲班、乙班各有50人。从人。从两个班各抽取两个班各抽取10人测量身高,并求其人测量身高,并求其平均身高,如果甲班的平均身高高于平均身高,如果甲班的平均身高高于乙班,能否推论甲班所有同学的平均乙班,能否推论甲班所有同学的平均身高高于乙班?为什么?身高高于乙班?为什么?
限制150内