第十五章-人群健康研究的统计学方法课件.ppt
《第十五章-人群健康研究的统计学方法课件.ppt》由会员分享,可在线阅读,更多相关《第十五章-人群健康研究的统计学方法课件.ppt(165页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、内内 容容3 1 概述概述 统计学中的几个基本概念统计学中的几个基本概念2 统计资料的类型统计资料的类型3 3 统计工作的基本步骤统计工作的基本步骤4案例1某小儿科教授通过多年的观察,发现他治疗的某小儿科教授通过多年的观察,发现他治疗的小儿巨结肠病人中,天门市占的比例最大。小儿巨结肠病人中,天门市占的比例最大。该教授据此认为天门市小儿巨结肠发病率最高该教授据此认为天门市小儿巨结肠发病率最高问:此结论是否正确?问:此结论是否正确?案例2问:乙疗法的效果真的比甲疗法好吗?问:乙疗法的效果真的比甲疗法好吗?第十五章 医学统计学概述在自然界,在人们的实践活动中,所遇到的现象一般可在自然界,在人们的实践
2、活动中,所遇到的现象一般可以分为两类:以分为两类:确定现象确定现象 随机现象随机现象(偶然现象)(偶然现象)一、一、统计学的意义统计学的意义透过偶然现象,分析、判断和阐述事物的内在规律性确定性现象确定性现象:在一定条件下,:在一定条件下,一定一定会发生或一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫发生某种结果的叫必然事件必然事件;肯定不发生某种结;肯定不发生某种结果的叫果的叫不可能事件不可能事件。例如,向上抛一枚硬币,由于受到地心引力的作用,例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落我们把
3、这类现象称硬币上升到某一高度后必定会下落我们把这类现象称为确定性现象(或必然现象)水在为确定性现象(或必然现象)水在2会结冰,会结冰,肯定肯定不发生称不发生称不可能事件不可能事件。例如例如 抛掷一枚硬币,当硬币落在地面上时,可能抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪面朝上,在硬币落地前我们不能预知究竟哪一面朝上我们把这类现象称为一面朝上我们把这类现象称为随机现象随机现象(或偶然现象)(或偶然现象)同样,自动机床加工制造同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格一个
4、零件,可能是合格品,也可能是不合格品;射击运动员一次射击,可能击中品;射击运动员一次射击,可能击中10环,环,也可能击中也可能击中9环环8环环甚至脱靶等等也都是甚至脱靶等等也都是随机现象随机现象 医学医学统计学统计学是以医学理论为指是以医学理论为指导,运用统计学原理和方法导,运用统计学原理和方法,研究研究医学领域中居民健康状况以及卫生医学领域中居民健康状况以及卫生服务领域中服务领域中有关数据的搜集、整理、有关数据的搜集、整理、分析的一门应用性科学分析的一门应用性科学。是是研究研究随机现象随机现象的的统计规律性统计规律性的的一门科学一门科学。1.同质与变异同质与变异 是指统计研究中,是指统计研究
5、中,给观察单位规定给观察单位规定一些相同的因素一些相同的因素情况(性质相同情况(性质相同或相近的事物)或相近的事物)是指同质的是指同质的个体之间的个体之间的差异差异2.总体与样本总体与样本 是指根据研究目是指根据研究目的而确定的同质的而确定的同质观察单位的全体观察单位的全体是从总体中随是从总体中随机抽取的部分机抽取的部分有有代表性代表性的观的观察单位察单位,某指某指标的实测值即标的实测值即构成了样本。构成了样本。有限总体:有限总体:指总体所包指总体所包含的个体是含的个体是有限的有限的无限总体:无限总体:指总体所包指总体所包含的个体是含的个体是无限的无限的总体总体随机抽样随机抽样 为了保证样本的
6、为了保证样本的可可靠性靠性和和代表性代表性,需,需要采用随机的抽样要采用随机的抽样方法(在总体中每方法(在总体中每个个体具有个个体具有相同的相同的机会机会被抽到)。被抽到)。3.参数与统计量参数与统计量 参数参数:描述描述总体总体特征特征的统的统计指标,如总体均数、标计指标,如总体均数、标准差,采用希腊字母分别准差,采用希腊字母分别记为记为 (为为固定的常数固定的常数)总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 推断推断统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为丁字母分别记
7、为 。(参数附近波动的随机变量参数附近波动的随机变量)4.误差误差 实际实际观察值观察值与客观与客观真实值真实值之差之差误差误差过失误差过失误差随机误差随机误差系统误差系统误差(1 1)系统误差)系统误差 在一定的实验条件下,由于某种未被发现的固定偏差造成测定值具有倾向性的误差概念原因仪器初使状态未调整到零、标准试剂未经校正、掌握疗效的标准偏高或偏低等特点特点具有明显规律性如果已发现,要尽量查明原因,予以纠正处理处理(2)随机误差随机误差 随机测量误差随机测量误差随机抽样误差随机抽样误差在相同条件下多次在相同条件下多次测量同一变量时,测量同一变量时,观察值之间的差别观察值之间的差别从同一总体中
8、抽从同一总体中抽样,得到某变量样,得到某变量值的统计量与参值的统计量与参数之间的差别数之间的差别随机误差的特点和处理随机误差的特点和处理 在单次测定中,随机误差的大小和方向无法预在单次测定中,随机误差的大小和方向无法预言。但在大量重复测定中,它呈正态分布,均值为言。但在大量重复测定中,它呈正态分布,均值为零。零。在控制影响因素与消除系统误差和杜绝过失误在控制影响因素与消除系统误差和杜绝过失误差条件下,绝大部分的实验误差来自随机误差中的差条件下,绝大部分的实验误差来自随机误差中的抽样误差。抽样误差。处理处理通过实验设计加以控制通过实验设计加以控制指实验者因粗枝大叶或未遵守操作指实验者因粗枝大叶或
9、未遵守操作规程等主观因素错误而造成的误差规程等主观因素错误而造成的误差(3)过失误差:概念概念原因原因原因原因记录不正确与计算或抄写错误记录不正确与计算或抄写错误特点特点特点特点往往表现为实验结果远离均值或出现反常变化在科研中必须杜绝过失在科研中必须杜绝过失误差误差处理处理5、概概 率率特点特点特点特点概念概念描述某事件发生可能性大小的度量描述某事件发生可能性大小的度量其值介于其值介于0和和1之间之间必然事件必然事件 P P=1 =1 不可能事件不可能事件 P P=0 =0 随机事件随机事件 0 0P P11 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为称
10、为小概率事件小概率事件(习惯习惯),统计学上认为在一次,统计学上认为在一次实验或观察中该事件发生的可能性很小,可视实验或观察中该事件发生的可能性很小,可视为很可能不发生。为很可能不发生。小概率事件小概率事件第二节 统计资料的类型观察对象的特征或指标,如:性别、年龄、身高、体重、职业观察对象的特征或指标测量的结果称为变量值,男、女160cm,56kg工人、学生1、数值变量资料数值变量资料(计量资料)(计量资料)体重(体重(kg)、)、身高身高(cm)、血浆胆血浆胆固醇(固醇(mmol/L)等等例例例例用定量方法对观察单位进行测量得到用定量方法对观察单位进行测量得到的资料,一般用度量衡单位表示的资
11、料,一般用度量衡单位表示概念概念2、无序、无序分类变量资料分类变量资料(计数资料)(计数资料)先将观察对象的观察指标按性质或类先将观察对象的观察指标按性质或类别进行分组,然后清点各组该观察指别进行分组,然后清点各组该观察指标的数目所得的资料标的数目所得的资料例例例例性别、血型、职业等性别、血型、职业等概念概念3、有序分类变量资料(、有序分类变量资料(等级资料等级资料)分类资料各类之间有程度的差别,给人以“半定量”的概念概念概念例例例例疗效(治愈、好转、无效、死亡)、大便隐血试验(-、+、+、+、+)、受教育程度等 三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的
12、血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 12 12 轻度高血压轻度高血压 15 15 中度高血压中度高血压 17 17 重度高血压重度高血压计量资料计量资料等等级级资资料料计数资料计数资料第三节第三节 统计工作的基本步骤统计工作的基本步骤统计设计统计设计搜集资料搜集资料整理资料整理资料分析资料分析资料1、设计、设计设计设计设计设计将头脑中关于研究的题目、研究将头脑中关于研究的题目、研究动机与意义、研究目的和方法、动机与意义、研究目的和方法、步骤与进度、科研条件、预期结步骤与进度、科研条件、
13、预期结果等内容用书面形式表示出来果等内容用书面形式表示出来分为调查设计和实验设计分为调查设计和实验设计2、搜集资料 资料的来源资料的来源搜集资料的原则搜集资料的原则搜集资料的方式搜集资料的方式搜集资料搜集资料搜集资料搜集资料统计报表或报告卡;统计报表或报告卡;日常医疗卫生工作记录和报告日常医疗卫生工作记录和报告卡卡;专题调查和实验性研究资料专题调查和实验性研究资料准确、完准确、完整、及时整、及时直接观察、直接观察、采访、填表采访、填表和通信和通信3、整理资料方法方法步骤步骤根据研究设计者整理分析计划的根据研究设计者整理分析计划的要求要求,将资料进行分组与汇总将资料进行分组与汇总,使使其条理化、
14、系统化其条理化、系统化,以便分析以便分析1、检查核对、检查核对2、设计分组、设计分组 a、质量分组质量分组 b、数量分组数量分组3、归纳汇总、归纳汇总整理资料整理资料整理资料整理资料4、分析资料结合专业知识给出恰如其分的专业结论结合专业知识给出恰如其分的专业结论包括统计描述和统计推断包括统计描述和统计推断分析资料分析资料分析资料分析资料统计描述:将计算出的统计指标与统统计描述:将计算出的统计指标与统计图表相结合,全面描述计图表相结合,全面描述样本样本资料的资料的数量特征及分布规律数量特征及分布规律统计推断:利用样本信息推断总体特统计推断:利用样本信息推断总体特征(总体参数的估计和假设性检验)征
15、(总体参数的估计和假设性检验)目标自测题目标自测题(单项选择题单项选择题单项选择题单项选择题)1、统计学上所说的样本是指(、统计学上所说的样本是指()A、按研究者要求取总体中有意义的部分、按研究者要求取总体中有意义的部分 B 随意抽取总体中任意部分随意抽取总体中任意部分 C有意识地选择总体中典型部分有意识地选择总体中典型部分 D 按随按随机原则抽取总体中有代表性部分机原则抽取总体中有代表性部分 E总体中总体中的每一个个体的每一个个体2抽样误差是由(抽样误差是由()A 测量引起的测量引起的 B 个体差异造成的个体差异造成的 C计算引起的计算引起的 D 采样结果不准确引起的采样结果不准确引起的 E
16、试剂、仪器试剂、仪器未校正引起的未校正引起的3已知某地出生男婴平均体重已知某地出生男婴平均体重3.2公斤,从该地随公斤,从该地随机抽取名机抽取名 出生男婴,测得体重均数为出生男婴,测得体重均数为3.3公公斤则斤则3.3公斤与公斤与3.2公斤不同公斤不同,主要原因是主要原因是()A 个体变异个体变异 B 抽样误差抽样误差 C样本均数样本均数不同不同 D 随机测量误差随机测量误差4研究某地正常成年男子血压情况,用未经校正的研究某地正常成年男子血压情况,用未经校正的血压计测定血压计测定 200名正常成年人的血压值,名正常成年人的血压值,所得资料可出现(所得资料可出现()A系统误差系统误差 B 随机测
17、量误差随机测量误差 C 抽样误差抽样误差 D个体差异个体差异 E 偶然误差偶然误差5、为了了解某地、为了了解某地2029岁健康女性血红蛋白岁健康女性血红蛋白的正常值范围,现随机调查了该地的正常值范围,现随机调查了该地2000名名2029岁的健康女性,并对其血红蛋白进行岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是(测量,请问本次调查的总体是()A该地所有该地所有2029的健康女性的健康女性 B该地所有该地所有2029的健康女性的血红蛋白的健康女性的血红蛋白测量值测量值 C抽取的这抽取的这2000名名2029岁女性岁女性 D抽取的这抽取的这2000名名2029岁女性的血红蛋白岁女性的
18、血红蛋白测量值测量值B1型题型题 A、计数资料(无序分类变量)、计数资料(无序分类变量)B、计量资料、计量资料 (数值变量)(数值变量)C、等级资料(有序分类变量)、等级资料(有序分类变量)D、总体中的、总体中的个体个体6、身高是(、身高是()7、脉搏数(次、脉搏数(次/分)是(分)是()8、血型是(、血型是()9、疗效是(、疗效是()第二节第二节 数值变量资料数值变量资料的统计分析的统计分析 统计描述统计描述一一 数值变量资料的频数表数值变量资料的频数表二二 集中趋势集中趋势三三 离散趋势离散趋势四四 正态分布正态分布五五 抽样误差与参数估计抽样误差与参数估计六六 假设检验假设检验本节内容本
19、节内容数值变量资料的描述方法:数值变量资料的描述方法:1 1、频数表与频数分布频数表与频数分布2 2、统计指标统计指标 、集中趋势指标、集中趋势指标:平均指标(算平均指标(算 术均数、几何均数、中位数、众术均数、几何均数、中位数、众 数、调和均数)数、调和均数)、离散趋势指标:、离散趋势指标:变异指标(极变异指标(极 差、四分位间距、方差、标准差、差、四分位间距、方差、标准差、变异系数)变异系数)一一 、数值资料的频数分布、数值资料的频数分布(一)、频数分布表频数分布:指观察值在某组段出现的次数;频数表:为了解一组同质观察值的分布规律,在观察值个数(即样本含量,n)较多时,可编制频数分布表,简
20、称频数表。例例 某校诊断学基础教研室为某校诊断学基础教研室为研究健康成年女性体温正常值,随研究健康成年女性体温正常值,随机抽取机抽取102102名健康名健康(非排卵期非排卵期)女大女大学生测试其体温学生测试其体温 下列是测试午饭后休息一小时下列是测试午饭后休息一小时口腔温度口腔温度()()的结果,试编制频数的结果,试编制频数分布表。分布表。表表表表7-1 1027-1 102名正常成年女子的体温值名正常成年女子的体温值名正常成年女子的体温值名正常成年女子的体温值频数表的编制步骤频数表的编制步骤(1)求计算全距:即最大值与最小值之差,又称为)求计算全距:即最大值与最小值之差,又称为极差极差。用用
21、R表示表示 本例极差:本例极差:R=37.536.5=1.0(C)(2)决定决定组距组距、组数组数:组距用组距用 i 表示表示。组距。组距=极差极差/组数,组数,组数组数通常分通常分10-15个组,为方便计,组距参考极差的十分个组,为方便计,组距参考极差的十分之一之一,再略加调整。再略加调整。本例本例 i=R/10=1.0/10=0.1(C)(3)列出组段:第一组段应包含列出组段:第一组段应包含最小值最小值,最后一个组段,最后一个组段上限必须包含最大值上限必须包含最大值,其它组段上限值忽略。,其它组段上限值忽略。(4)统计频数统计频数:用划记法将所有数据归纳到各组段,得:用划记法将所有数据归纳
22、到各组段,得到各组段的频数。到各组段的频数。(5)确定频率与累计频率。确定频率与累计频率。均数3779.8/10237.06C(二)(二)频数分布图频数分布图人数(三三)频数分布特征频数分布特征集中趋势:变量值集中位置。本例在组段集中趋势:变量值集中位置。本例在组段“37.0”。平均水平指标平均水平指标离散趋势离散趋势:变量值围绕集中位置的分布情况。变量值围绕集中位置的分布情况。离离“中心中心”位置越远,频数越小;且围绕位置越远,频数越小;且围绕“中心中心”左右对称。左右对称。变异水平指标变异水平指标从不同角度说明被研究的事物。从不同角度说明被研究的事物。(四四)频数分布类型频数分布类型 正态
23、分布正态分布:集中位置在正中,左右两侧基本对称:集中位置在正中,左右两侧基本对称,也叫高斯分布,是最常见、,是最常见、最重要的一种连续型分布。最重要的一种连续型分布。偏态分布偏态分布:集中位置偏向一侧,频数分布不对称。:集中位置偏向一侧,频数分布不对称。正偏态分布正偏态分布 负偏态分布负偏态分布 分布类型不同,采用的统计方法不同。分布类型不同,采用的统计方法不同。正态分布:中间高、正态分布:中间高、两边低、左右对称两边低、左右对称正偏态分布:正偏态分布:长尾向长尾向右右延伸延伸负偏态分布:负偏态分布:长尾向长尾向左左延伸延伸(五五)、频数分布表的用途、频数分布表的用途1 1、揭示、揭示资料的分
24、布类型资料的分布类型;2 2、显示频数分布的两个重要特征;、显示频数分布的两个重要特征;集中趋势集中趋势 离散趋势离散趋势 3 3、根据频数分布的不同类型,根据频数分布的不同类型,便于进一便于进一步计算统计指标和做统计处理步计算统计指标和做统计处理;4 4、利于发现某些、利于发现某些特大或特小的可疑值特大或特小的可疑值。二、二、集中趋势(集中趋势(平均指标)平均指标)又称为又称为平均数平均数反映了资料的反映了资料的集中趋势集中趋势。常用的有:常用的有:1.算术均数,简称算术均数,简称均数均数 2.几何均数几何均数3.中位数中位数4.众数众数(一)算术均数(一)算术均数(meanmean)为求和
25、符号,读成sigma意义:一组性质相同(同质)的观察值在数量上的平均水平。意义:一组性质相同(同质)的观察值在数量上的平均水平。表示表示(总体)总体)X(样本)(样本)计算:直接法、加权法(间接法)、计算机计算:直接法、加权法(间接法)、计算机特征:特征:(X-X)=0 估计误差之和为估计误差之和为0。应用:正态分布或近似正态分布应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义注意:合理分组,才能求均数,否则没有意义。X X1 1+X2+X3+.+Xn+X2+X3+.+Xn=-=/n=-=/n n n 均数的应用均数的应用1、均数反映一组同质观察值的平均水平,并均数反映一组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十五 人群 健康 研究 统计学 方法 课件
限制150内