医学统计学基本概念.pptx
第一章第一章 绪绪 论论统计学的定义和发展统计学的定义和发展统计工作的基本内容统计工作的基本内容医学统计学中的基本概念医学统计学中的基本概念第1页/共45页第一节第一节 统计学的定义和发展统计学的定义和发展第2页/共45页举例:举例:生活中,统计班级中男生女生各多少人治疗两例有效就说明有效率100100药品宣传都说经过多家医院,临床实验上千病例,总有效率达到百分之90%,90%,而不说治疗两例有效两种药物治疗某种疾病,甲法治愈2020例,乙法治愈4040例,是否说明乙法就优于甲法 上课点名,点三次,某同学被抓两次 小说 第3页/共45页统计:统计:第4页/共45页统计学统计学统计学(Statistics)是运用概率论和数理统计的方法,研究数据收集、整理、分析、推断等的一门学科。按应用划分:第5页/共45页医学统计学:医学统计学:医学统计学(Medical Statistics)就是统计学原理和方法在医学研究领域的应用。现在生物医学实验室研究、临床研究、流行病学探索和公共卫生管理都要寻求统计学家的合作。美国国立卫生研究院的基金申请要求合作者有统计学专家,并且必须有统计设计和分析的内容。在药物开发中,制药公司要招聘统计学家指导研究设计、分析数据。总之,统计的思维和方法已经渗透到医学研究和卫生政策之中。第6页/共45页医学统计学发展:医学统计学发展:1.法国数学家Laplace提出医学是概率论应用的一个重要领域。2.19世纪,Louis 把统计学引入到医学,强调用数据表达疗效3.Karl Pearson是现在统计学之父。4.另一位统计学奠基人Fisher,临床随机对照实验第7页/共45页为什么要学习统计学为什么要学习统计学对“证据”解释的苛刻要求,使医学研究人员认识到:要使自己的研究结果成为被同行认可的科学证据,必须在研究工作中采用科学方法。统计学在医学研究中的运用越来越广泛,越来越深入。在医学研究报告和医学期刊中,一些研究结果直接用数据和图表表示,并且充满了均数()和标准差(S S)、随机分组、值等统计专业术语。对医生和医学科学工作者来说,医学论文起到两个作用。一是通过撰写和发表论文,报告自己观察或实验的研究结果,二是阅读别人的论文,吸收新知识,了解学术进展。撰写论文,对自己研究结果的数据资料要能够正确地表达和分析。第8页/共45页医学论文中的统计学问题60年代到年代到80年代,国外医学杂志调查结果:年代,国外医学杂志调查结果:有统计错误的论文有统计错误的论文20%72%。1996年对年对4586篇论文统计(中华医学会系篇论文统计(中华医学会系列杂志占列杂志占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。第9页/共45页伪造统计数据违反科学道德1976年年New Science 杂志关于科研舞弊杂志关于科研舞弊行为的调查行为的调查(1)74%的调查表反映有不正当修改数据的调查表反映有不正当修改数据的情况的情况(2)17%拼凑实验结果拼凑实验结果(3)7%凭空捏造数据凭空捏造数据(4)2%故意曲解结果故意曲解结果第10页/共45页第二节第二节 统计工作的基本内容统计工作的基本内容 (步骤)(步骤)实验设计收集资料整理资料分析资料第11页/共45页一、实验设计一、实验设计根据研究目的,制定研究方案根据研究目的,制定研究方案,对整个过程进行安排,是整个工对整个过程进行安排,是整个工作的关键。作的关键。如何进行设计?专业设计和统计学设计如何进行设计?专业设计和统计学设计研究对象的纳入标准、排除标准、样本含量、样本获取方法,实研究对象的纳入标准、排除标准、样本含量、样本获取方法,实验组和对照组的分组原则,确定观察指标及精度,实验过程中验组和对照组的分组原则,确定观察指标及精度,实验过程中的质量控制,拟使用的统计方法等的质量控制,拟使用的统计方法等背景背景-目的目的-方法方法-内容内容-经费预算经费预算第12页/共45页(1 1)专业设计)专业设计反映课题研究的深度与水平反映课题研究的深度与水平whywhy?了解专业现状、学术前沿、研究动态、水平及发展方向和了解专业现状、学术前沿、研究动态、水平及发展方向和条件,提出课题(立题依据,项目研究意义和应用前景、国内条件,提出课题(立题依据,项目研究意义和应用前景、国内外研究现状分析,附主要参考文献等)外研究现状分析,附主要参考文献等)whatwhat?主要解决的问题(研究目目标,研究内容和拟解决的关主要解决的问题(研究目目标,研究内容和拟解决的关键问题等,提出详尽的分析是思路和技术路线,做好周密的考键问题等,提出详尽的分析是思路和技术路线,做好周密的考虑和安排)虑和安排)第13页/共45页(2 2)统计设计)统计设计howhow?分析目的分析目的研究对象研究对象分析指标、观察单位、检测内容和方法分析指标、观察单位、检测内容和方法如何获取资料、怎样整理计算如何获取资料、怎样整理计算如何控制误差、组织实施等如何控制误差、组织实施等第14页/共45页二、收集资料二、收集资料来源:实验数据和现场调查资料、医疗工作记录、报表和报告卡。来源:实验数据和现场调查资料、医疗工作记录、报表和报告卡。要求:要求:1 1、完整、准确、及时、完整、准确、及时2 2、要有足够的数量、要有足够的数量3 3、资料的代表性和可比性、资料的代表性和可比性 第15页/共45页三、整理资料三、整理资料对资料进行整理、清理、核实、查对使资料系统化、条理化便于计算和分析。对资料进行整理、清理、核实、查对使资料系统化、条理化便于计算和分析。1.1.原始资料的检查与核对:原始资料的检查与核对:数据的取值范围检错和数据间逻辑关系检错数据的取值范围检错和数据间逻辑关系检错2.2.资料的分组设计与归纳汇总:资料的分组设计与归纳汇总:质量分组和数量分组和编制频数分布表。质量分组和数量分组和编制频数分布表。常用软件:常用软件:ExcelExcel、SPSSSPSS、SASSAS第16页/共45页四、分析资料四、分析资料运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。律。统计描述、统计推断统计描述、统计推断第17页/共45页变异变异总体与样本总体与样本计量资料、计数资料计量资料、计数资料参数与统计量参数与统计量误差误差概率概率第三节 医学统计学中的基本概念第18页/共45页总体与样本总体与样本(population and sample)总体:根据研究目的确定的根据研究目的确定的同质同质研究对象的研究对象的全体全体(集合)。分有限(集合)。分有限总体与无限总体总体与无限总体样本:从总体中随机抽取的部分观察单位从总体中随机抽取的部分观察单位 样本包含的观察单位数称为样本含量或样本大小。样本包含的观察单位数称为样本含量或样本大小。用用n表示表示总 体样 本第19页/共45页为了了解某地2029岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名2029岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()A该地所有2029的健康女性 B该地所有2029的健康女性的血红蛋白测量值 C抽取的这2000名2029岁女性 D抽取的这2000名2029岁女性的血红蛋白测量值B第20页/共45页随机抽样随机抽样随机抽样:为了保证样本的为了保证样本的可靠性可靠性和和代表性代表性,需要采用随机的抽样方法,以保证总体中,需要采用随机的抽样方法,以保证总体中每个个体每个个体都具有都具有相相同的机会同的机会被抽到)。被抽到)。随机抽样方法:单纯随机抽样 分层抽样注意:随机不等于随便 第21页/共45页计量资料计量资料对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位表示,简单的说计量资料就是用度量衡测量出来带有单位的资料。如身高、体重、血红蛋白 第22页/共45页计数资料计数资料 是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。分为无序分类资料和有序分类资料(等级资料)1 1)无序分类:如各种血型的人数2 2)有序分类:等级资料,如尿糖+、+、+注意计量资料和计数资料之间可以相互转化第23页/共45页住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月20256532025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variablesQuantitative dataQuantitative data计量资料计量资料Qualitative data Qualitative data 计数资料计数资料Units;elements第24页/共45页实例数据1第25页/共45页实例数据2第26页/共45页三类资料间关系三类资料间关系 例:一组20 40岁成年人的血压以12kPa12kPa为界分为正常与异常两组,统计每组例数 单纯随机抽样系统抽样分层抽样(2)增加样本量n(3)选择变异程度较小的研究指标 第31页/共45页概率概率(probabilityprobability)举例:抛一枚硬币,是否国徽面一定向上?明天的股市升还是降?某患者痊愈的可能性?这些问题的答案都不可能绝对。概念:描述随机事件发生的可能性大小的数值,常用P来表示。大小:0P1,越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。小概率事件:在统计学上,习惯将P0.05或P0.01的事件作为小概率事件。原理:小概率事件在一次抽样或实验中不发生。例如车祸,飞机失事,学生上课迟到 第32页/共45页小结:小结:重点:几个基本概念(计量资料与计数资料、参数与统计量、总体与样本、抽样误差)熟悉:小概率事件、统计工作的基本步骤、减少抽样误差的方法了解:统计学定义及发展第33页/共45页1.1.统计学中所说的有代表性的样本指的是(统计学中所说的有代表性的样本指的是()A.随意抽取的总体中任意个体B.有意识地选择总体中有典型个体C.依照研究者要求选取总体中有意义的个体D.最方便获取的部分个体E.依照随机原则抽取总体中的个体E第34页/共45页2.2.下列变量的观测结果属于等级资料的是(下列变量的观测结果属于等级资料的是()A.白细胞计数B.住院天数C.门诊就诊人数D.患者病情分级E.各临床科室的患者数D第35页/共45页3.3.抽样的目的是(抽样的目的是()A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体特征B第36页/共45页4.4.关于随机抽样,下列哪一项说关于随机抽样,下列哪一项说法是正确的(法是正确的()A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有很好的代表性,样本量应越大越好E.选择符合研究者意愿的样本A第37页/共45页5 5、对某地、对某地200200名名1616岁中学生口腔岁中学生口腔检查,发现龋齿的人数检查,发现龋齿的人数5454人,人,该资料属于(该资料属于()A.计量资料B.计数资料C.等级资料D.经变量转换也可以作为计量资料B第38页/共45页6 6、下面的变量中,属于计数变量的是(、下面的变量中,属于计数变量的是()A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压B第39页/共45页7 7、某人记录了、某人记录了5050名病人体重的测定结果:名病人体重的测定结果:小于小于50Kg50Kg的的1313人,介于人,介于50Kg50Kg和和70 70 KgKg间的间的2020人,大于人,大于70 Kg70 Kg的的1717人人 ,此种资料属于(此种资料属于()A.计量资料 B.计数资料 C.等级资料 D.无序分类的计数资料 E.名义变量资料C第40页/共45页8 8、下面的变量中,属于计量变量的是(、下面的变量中,属于计量变量的是()A.性别 B.体重 C.血型 D.职业 E.民族B第41页/共45页9 9、调查某单位科研人员论文发表的情况,、调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于统计每人每年的论文发表数应属于()A.计量资料 B.计数资料C.总体D.个体A第42页/共45页1.在研究工作中 误差是不可避免的,误差是可以而且应该避免的,统计方法能处理的是 误差。2.统计分析的主要包括 。3.统计工作的四个步骤是:,。随机测量系统抽样统计描述和统计推断实验设计 收集资料整理资料分析资料第43页/共45页 某年级甲班、乙班各有50人。从两个班各抽取10人测量身高,并求其平均身高,如果甲班的平均身高高于乙班,能否推论甲班所有同学的平均身高高于乙班?为什么?第44页/共45页谢谢您的观看!第45页/共45页