第十五讲医学统计学概述课件.ppt





《第十五讲医学统计学概述课件.ppt》由会员分享,可在线阅读,更多相关《第十五讲医学统计学概述课件.ppt(136页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第十五章第十五章 医学统计学概述医学统计学概述统计统计(Statistics)(Statistics)学的涵义?学的涵义?工作生活中常见的统计问题工作生活中常见的统计问题如何判断药物的疗效?如何判断药物的疗效?如何判断药物的疗效?如何判断药物的疗效?体育彩票能否中奖?体育彩票能否中奖?体育彩票能否中奖?体育彩票能否中奖?子女为什么子女为什么子女为什么子女为什么像像像像父母,其强度有多大?父母,其强度有多大?父母,其强度有多大?父母,其强度有多大?糖尿病的危险因素是什么?糖尿病的危险因素是什么?糖尿病的危险因素是什么?糖尿病的危险因素是什么?济南市济南市济南市济南市10101010岁女童的身高
2、是不是和北京市的一样?岁女童的身高是不是和北京市的一样?岁女童的身高是不是和北京市的一样?岁女童的身高是不是和北京市的一样?思考思考1 1:两种药物治疗某种疾病,甲法治愈两种药物治疗某种疾病,甲法治愈2020例,例,乙法治愈乙法治愈4040例,是否说明乙法就优于甲例,是否说明乙法就优于甲法?法?常见的医学统计问题常见的医学统计问题思考思考2 2 吸烟导致肺癌,抗生素治疗胃溃疡,吸烟导致肺癌,抗生素治疗胃溃疡,锻炼有助于预防心脏病锻炼有助于预防心脏病 我们怎么我们怎么知道这些?知道这些?统计学是什么?统计学是什么?大英百科全书指出:大英百科全书指出:“统计学是统计学是一门收一门收集集数据数据、分
3、析、分析数据数据、并根据、并根据数数据据进行进行推断推断的艺术和科学的艺术和科学”。统计学是什么?统计学是什么?本书:医学统计学是以本书:医学统计学是以医学理论医学理论为为指导,运用数理统计学的原理和方法,指导,运用数理统计学的原理和方法,研究医学科研中有关研究医学科研中有关数据数据的收集、整的收集、整理和分析的应用科学。理和分析的应用科学。l统计学统计学:是关于是关于数据(数据(data)的科学,是的科学,是从数据中提取信息的一门学科从数据中提取信息的一门学科。l医学统计学:医学统计学:用统计学的原理和方法研究用统计学的原理和方法研究医学医学中中的问题的问题。统计学是什么?统计学是什么?主主
4、要要内内容容第一节第一节 统计学中的几个基本概念统计学中的几个基本概念第二节第二节 统计资料的类型统计资料的类型第三节第三节 统计工作的基本步骤统计工作的基本步骤 第四节第四节 统计表与统计图统计表与统计图 一、同质与变异一、同质与变异 n同质同质(homogeneity):统计学的各个统计学的各个观察单观察单位位的一些的一些相同的性质相同的性质。实际工作中,影响被研究指标的主要的可实际工作中,影响被研究指标的主要的可控制的因素达到相同或基本相同就可认为控制的因素达到相同或基本相同就可认为是同质。是同质。例例1.调查调查2013年年济南济南市市山东英才学院山东英才学院大大二二女生的身高和体重女
5、生的身高和体重。一、同质与变异一、同质与变异 一、同质与变异一、同质与变异 n变异变异(variation):宇宙中的事物千差万别,宇宙中的事物千差万别,各不相同,即使是同质事物,各不相同,即使是同质事物,就某一观察就某一观察指标来看,各观察单位指标来看,各观察单位(亦称个体亦称个体)之间也之间也有差别,这种有差别,这种同质事物间的差别同质事物间的差别即为变异。即为变异。例例1.调查调查2013年年济南济南市市山东英才学院山东英才学院大大二二女生的身高和体重女生的身高和体重。一、同质与变异一、同质与变异 1.1.没有同质性就构不成一个总体供人们研究没有同质性就构不成一个总体供人们研究,如不同年
6、龄组男童的身高不能计算平均数,因如不同年龄组男童的身高不能计算平均数,因为所得结果没有意义。为所得结果没有意义。2 2.变异表现在两个方面:变异表现在两个方面:个体与个体间的差别;个体与个体间的差别;同一个体重复测量值间的差别。同一个体重复测量值间的差别。3 3.变异是有变异是有规律规律的,统计学就是探讨变异规律、的,统计学就是探讨变异规律、并运用其规律性进行深入分析的一门学科。并运用其规律性进行深入分析的一门学科。二、总体与样本二、总体与样本n总体总体(population)(population):根据研究目的所确定的同根据研究目的所确定的同质质观察单位观察单位的全体,确切地说,是同质的所
7、有的全体,确切地说,是同质的所有观察单位某种观察单位某种变量值的集合变量值的集合。(。(N N)n样本样本(sample)(sample):从总体中从总体中随机抽取随机抽取部分观察单部分观察单位变量值的集合。位变量值的集合。其大小称为样本含量其大小称为样本含量(n n )。例例1.调查调查2013年年济南济南市市山东英才学院山东英才学院大大二二女女生的身高和体重生的身高和体重。二、总体与样本二、总体与样本 样样本本总总体体总体是唯一的、确定的,而样本是不确定的、可变的、随机的。总体是唯一的、确定的,而样本是不确定的、可变的、随机的。样样本本例例2 2 为了了解某地为了了解某地20202929岁
8、健康女性血红蛋岁健康女性血红蛋白的正常值范围,现随机调查了该地白的正常值范围,现随机调查了该地20002000名名20202929岁的健康女性,并对其血红蛋白进行岁的健康女性,并对其血红蛋白进行测量。测量。总体总体?样本样本?二、总体与样本二、总体与样本例例2 2 为了了解某地为了了解某地20202929岁健康女性血红蛋岁健康女性血红蛋白的正常值范围,现随机调查了该地白的正常值范围,现随机调查了该地20002000名名20202929岁的健康女性,并对其血红蛋白进行岁的健康女性,并对其血红蛋白进行测量。测量。总体:总体:某地所有某地所有20202929岁健康女性血红蛋白岁健康女性血红蛋白测量值
9、测量值。样本:样本:该地该地20002000名名20202929岁的健康女性血红岁的健康女性血红蛋白测量值蛋白测量值。二、总体与样本二、总体与样本二、总体与样本二、总体与样本例例3调查某地某年正常成年男子的红细胞数。调查某地某年正常成年男子的红细胞数。l同质基础:同质基础:l观察单位:观察单位:l研究总体:研究总体:l样本:样本:二、总体与样本二、总体与样本例例3调查某地某年正常成年男子的红细胞数。调查某地某年正常成年男子的红细胞数。l同质基础:同质基础:同一地区,同一年份同一地区,同一年份,同为正常人,同为成,同为正常人,同为成年男性;年男性;l观察单位:观察单位:该地该年的每一个正常成年男
10、子;该地该年的每一个正常成年男子;l研究总体:研究总体:该地该年全部正常成年男子的红细胞数的集该地该年全部正常成年男子的红细胞数的集合;合;l样本:样本:从中抽取若干名,分别测得其红细胞数,则这些从中抽取若干名,分别测得其红细胞数,则这些检测值构成一个样本。检测值构成一个样本。二、总体与样本二、总体与样本有限总体与无限总体有限总体与无限总体1.1.上述的总体明确规定了空间、时间、人群范围内上述的总体明确规定了空间、时间、人群范围内有限的观察单位,称为有限的观察单位,称为有限总体有限总体(finite(finite population)population)。2.2.有时总体是假想的,是没有时
11、间和空间概念的,有时总体是假想的,是没有时间和空间概念的,因而观察单位是无限的,称为因而观察单位是无限的,称为无限总体无限总体(infinite population)(infinite population)。二、总体与样本二、总体与样本有限总体与无限总体有限总体与无限总体1.1.上述的总体明确规定了空间、时间、人群范围内上述的总体明确规定了空间、时间、人群范围内有限的观察单位,称为有限的观察单位,称为有限总体有限总体(finite(finite population)population)。2.2.有时总体是假想的,是没有时间和空间概念的,有时总体是假想的,是没有时间和空间概念的,因而观察
12、单位是无限的,称为因而观察单位是无限的,称为无限总体无限总体(infinite population)(infinite population)。三、参数与统计量三、参数与统计量n总体参数:总体参数:根据总体个体值统计计算出来的描根据总体个体值统计计算出来的描述总体的特征。一般用述总体的特征。一般用希腊字母希腊字母表示。表示。n样本统计量:样本统计量:根据样本个体值统计计算出来的根据样本个体值统计计算出来的描述样本的特征量。一般用描述样本的特征量。一般用拉丁字母拉丁字母表示。表示。例例1.调查调查2013年年济南济南市市山东英才学院山东英才学院大大二二女女生的身高和体重生的身高和体重。三、参数
13、与统计量三、参数与统计量 总体参数:总体参数:反映总体数量特征的指标。其数值是反映总体数量特征的指标。其数值是唯一的、确定唯一的、确定的。的。样本统计量:样本统计量:根据样本分布计算的指标。是根据样本分布计算的指标。是随机变量随机变量。平均数平均数标准差、方差标准差、方差成数成数参数参数 、2p统计量统计量S、S2P 总体总体 样本样本统计学的分析思路统计学的分析思路samplepopulationSampling(抽抽样样研究研究)Inferring(统计统计推断推断)例例4 4.研究某年某地出生的所有新生儿的畸形发研究某年某地出生的所有新生儿的畸形发生率,随机抽取生率,随机抽取500500
14、名新生儿进行观察名新生儿进行观察。l参数参数?l统计量统计量?三、参数与统计量三、参数与统计量例例4 4.研究某年某地出生的所有新生儿的畸形发研究某年某地出生的所有新生儿的畸形发生率,随机抽取生率,随机抽取500500名新生儿进行观察名新生儿进行观察。l参数参数:某年某地出生的所有新生儿的畸形发某年某地出生的所有新生儿的畸形发生率的均数生率的均数(),标准差),标准差()。l统计量统计量:500500名新生儿畸形发生率的均数名新生儿畸形发生率的均数(X)(X),标准差,标准差(S)(S)。三、参数与统计量三、参数与统计量l 例例5 5.研究研究英才英才学院大一女生的平均身高学院大一女生的平均身
15、高。l随机抽取随机抽取100100名女生,名女生,平均身高平均身高158.2cm158.2cm;随;随机抽取机抽取10001000名女生,平均身高名女生,平均身高163.1cm163.1cm;随;随机抽取机抽取20002000名女生,平均身高名女生,平均身高163.8cm163.8cm。误差误差(error)(error):是指实测值和真实值之差。:是指实测值和真实值之差。四、误差四、误差四、误差四、误差n误差按误差按其产生原因和性质可分为随机误差与非随其产生原因和性质可分为随机误差与非随机误差,后者又分为系统误差与非系统误差。机误差,后者又分为系统误差与非系统误差。n随机误差:随机误差:是一
16、类不恒定的、随机变化的误差,是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。由多种尚无法控制的因素引起。n影响因素众多,变化无方向性,不可避免,但可影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析。用统计方法进行分析。四、误差四、误差抽样误差抽样误差(sampling error)(sampling error):样本的统计指样本的统计指标(统计量)与总体的统计指标(参数)的标(统计量)与总体的统计指标(参数)的差别,差别,可以被控制可以被控制,但是不能被消除但是不能被消除 。例例6 6 从某地某年从某地某年1313岁女生的总体中随机抽取含量岁女生的总体中随机抽取含量为
17、为120120的样本,算得其平均身高(的样本,算得其平均身高(统计量统计量)为)为155.4cm155.4cm,这个数不一定恰好等于该地,这个数不一定恰好等于该地1313岁女岁女生的总体均数(生的总体均数(参数参数)。)。四、误差四、误差n非随机误差非随机误差l系统误差:系统误差:是一类恒定不变或遵循你一定变化规是一类恒定不变或遵循你一定变化规律的误差,其产生原因往往是可知的或可能掌握律的误差,其产生原因往往是可知的或可能掌握的。的。受确定因素影响,大小变化有方向性。受确定因素影响,大小变化有方向性。l非系统误差非系统误差(过失误差)(过失误差):是由研究者偶然失误:是由研究者偶然失误而造成的
18、误差。而造成的误差。例例5 5.双色球一等奖的中奖双色球一等奖的中奖双色球一等奖的中奖双色球一等奖的中奖率为率为率为率为1/177210881/177210881/177210881/17721088。概率概率概率概率(probability)(probability)(probability)(probability):是描述事件发生的可能性大:是描述事件发生的可能性大:是描述事件发生的可能性大:是描述事件发生的可能性大小的一个量值,小的一个量值,小的一个量值,小的一个量值,记作记作P(A)或或P。P P值值取值范围在取值范围在0 0 1 1之间。之间。五、概率五、概率lP(A)=0表示表示
19、A为为不可能事件不可能事件,即,即A不可能发生;不可能发生;lP(A)=1表示表示A为为必然事件必然事件,即,即A必然要发生。必然要发生。l可能发生也可能不发生的事件称为可能发生也可能不发生的事件称为随机事件随机事件。五、概率五、概率投掷一枚硬币,观察出现正面的投掷一枚硬币,观察出现正面的投掷一枚硬币,观察出现正面的投掷一枚硬币,观察出现正面的频频频频率率率率。按照下面表格的方式来统计实验结果:按照下面表格的方式来统计实验结果:按照下面表格的方式来统计实验结果:按照下面表格的方式来统计实验结果:投掷次数投掷次数出现正面的次数出现正面的次数正面出现的频率正面出现的频率1234567五、概率五、概
20、率在在n次随机试验中,事件次随机试验中,事件A发生了发生了m次,则比值:次,则比值:f 称为事件称为事件A在这在这n次试验中出现的频率,次试验中出现的频率,0f1。m称为频称为频数。数。(一)频率(一)频率u通过实验,我们可以发现:每次试验出现通过实验,我们可以发现:每次试验出现正面的次数和投掷次数存在一个比值关系,正面的次数和投掷次数存在一个比值关系,即即频率频率。u而随着试验次数的增加,这个比值越来越而随着试验次数的增加,这个比值越来越接近一个常数,这个常数我们就成为接近一个常数,这个常数我们就成为概率概率(P)(P)。u因此概率为一常数,是因此概率为一常数,是固定不变固定不变的。的。五、
21、概率五、概率n n投投掷掷一一枚枚质质量量均均匀匀的的硬硬币币,出出现现正正面面和和反反面面的概率各为的概率各为1/21/2;n n投掷一枚骰子出现投掷一枚骰子出现1 16 6点的概率各为点的概率各为1/61/6。在重复试验中,事件在重复试验中,事件A的频率,随着试验次的频率,随着试验次数的不断增加将愈来愈接近一个常数数的不断增加将愈来愈接近一个常数p,频率的这,频率的这一特性称为一特性称为频率的稳定性频率的稳定性。在实际问题中,当重复观测次数足够大时,在实际问题中,当重复观测次数足够大时,可以可以频率作为概率的估计值频率作为概率的估计值。五、概率五、概率五、概率五、概率例例6如检查某药品的合
22、格率,其结果如下:如检查某药品的合格率,其结果如下:某药抽样次品率随抽样次数变化情况某药抽样次品率随抽样次数变化情况抽出样品抽出样品数数n:5010060015006000900018000次 品 数m:027195693176次 品 率()f:021.171.270.931.030.98随着抽样的大量进行,抽取的样品数逐渐增加,次随着抽样的大量进行,抽取的样品数逐渐增加,次品率品率f将愈来愈接近常数将愈来愈接近常数1。五、概率五、概率统计学上一般将统计学上一般将P0.05或或P0.01的事件称的事件称为小概率事件。为小概率事件。这种小概率事件虽不是不可能事件,但一这种小概率事件虽不是不可能事
23、件,但一般认为小概率事件在一次随机试验中基本上不般认为小概率事件在一次随机试验中基本上不会发生,这就是会发生,这就是小概率原理小概率原理。小概率事件小概率事件主主要要内内容容第一节第一节 统计学中的几个基本概念统计学中的几个基本概念第二节第二节 统计资料的类型统计资料的类型第三节第三节 统计工作的基本步骤统计工作的基本步骤 第四节第四节 统计表与统计图统计表与统计图 一、变量和变量值一、变量和变量值变量:变量:确定总体之后,研究者对每个观察单位确定总体之后,研究者对每个观察单位的的某项特征某项特征进行观察或测量,这种特征性表现进行观察或测量,这种特征性表现观察单位的变异性,称为变量。观察单位的
24、变异性,称为变量。如患者的年龄、性别、职业等。如患者的年龄、性别、职业等。变量值或观察值:变量值或观察值:变量的观测值。变量的观测值。如实际的年龄、体重、性别的男女等。如实际的年龄、体重、性别的男女等。二、变量的分类 变量变量离散型变量离散型变量连续性变量连续性变量无序分类无序分类有序分类有序分类二项二项多项多项定量变量定量变量定性变量定性变量 数值变量资料(定量资料或计量资料)数值变量资料(定量资料或计量资料),为,为观测每个观察单位某项指标的观测每个观察单位某项指标的大小大小大小大小而获得的而获得的资料。资料。l其变量值是其变量值是定量的,定量的,表现为表现为数值大小数值大小,一般,一般有
25、有度量衡度量衡单位。根据其观测值取值是否连续,单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。又可分为连续型或离散型两类。1.1.离散型变量:离散型变量:如儿童龋齿数、胎次等;如儿童龋齿数、胎次等;2.2.连续性变量:连续性变量:如身高、体重等。如身高、体重等。(一一)数值变量资料数值变量资料1.1.无序分类变量资料无序分类变量资料例例例例.测量测量测量测量200200200200人红细胞数,正常组人红细胞数,正常组人红细胞数,正常组人红细胞数,正常组176176176176人,异常组人,异常组人,异常组人,异常组24242424人人人人。l 无序分类变量资料:将观察单位按某种属性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十五 医学 统计学 概述 课件

限制150内