卫生统计学第方积乾主编定量资料的统计描述.pptx
《卫生统计学第方积乾主编定量资料的统计描述.pptx》由会员分享,可在线阅读,更多相关《卫生统计学第方积乾主编定量资料的统计描述.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 学习要求学习要求 了解:了解:应用应用SASSAS程序编制频率表的方法和程序编制频率表的方法和meansmeans、univariateunivariate过程对定量资料的描述。过程对定量资料的描述。熟悉:熟悉:定量资料频率表的编制方法和用途。定量资料频率表的编制方法和用途。掌握:掌握:算术均数、几何均数、中位数的计算方法和算术均数、几何均数、中位数的计算方法和使用条件;四分位间距、方差、标准差、变异系数的使用条件;四分位间距、方差、标准差、变异系数的计算方法和使用条件。计算方法和使用条件。2023/3/111第1页/共69页 统计描述是用统计图表、统计指标来描述资料的分布统计描述是用统计图
2、表、统计指标来描述资料的分布规律及其数量特征的。规律及其数量特征的。第一节第一节 频率分布表与频率分布图频率分布表与频率分布图 医学研究资料变量值的个数较多时医学研究资料变量值的个数较多时,对个变量值出现的对个变量值出现的频数或频率列表即为频数分布表或频率分布表(频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称),简称频数表频数表或或频率表频率表。2023/3/112第2页/共69页 一、离散型定量变量的频率分布一、离散型定量变量的频率分布 例例2-1 1998年某山区年某山区96名孕妇产前检查次数资料,编制频率表。名孕妇产前检查次数资
3、料,编制频率表。表表2-1 1998年某地年某地96名孕妇产前检查次数频率分布名孕妇产前检查次数频率分布检查次数检查次数检查次数检查次数(1 1 1 1)频数频数频数频数(2 2 2 2)频率(频率(频率(频率(%)(3 3 3 3)累计频数累计频数累计频数累计频数(4 4 4 4)累计频率累计频率累计频率累计频率(%)(%)(%)(%)(5 5 5 5)01234554711132623124.27.311.513.527.124.012.541122356184964.211.522.936.563.587.5100.0合计合计961002023/3/113第3页/共69页 图2-1 19
4、98年某地年某地96名孕妇产前检查次数频率分布名孕妇产前检查次数频率分布 离散型定量变量的频率分布图可用直条图表达,以等离散型定量变量的频率分布图可用直条图表达,以等宽直条的高度表示各组频率的多少宽直条的高度表示各组频率的多少2023/3/114第4页/共69页二、连续型定量变量的频率分布二、连续型定量变量的频率分布 例例2-2 抽样调查某地抽样调查某地120名名1835岁健康男性居民血清铁含量岁健康男性居民血清铁含量(mmo/L),数数据如下。试编制血清铁含量的频率分布表。据如下。试编制血清铁含量的频率分布表。2023/3/115第5页/共69页频率表的编制步骤如下:频率表的编制步骤如下:1
5、.计计算算极极差差(range,R),亦亦称称全全距距,即即最最大大值值与与最最小小值值之之差差。本本例例最最大值为大值为29.64,最小值为,最小值为7.42,故,故R=29.64-7.42=22.22(mmo/L)。2.确确定定组组段段数数与与组组距距(class interval)组组段段数数一一般般取取10组组左左右右。组组距距用用i表表示示,组组距距=极极差差/组组段段数数,本本例例拟拟分分10组组,i=22.22/10=2.22,一一般般取取靠靠近的整数作为组距,本例取近的整数作为组距,本例取i2。3.确确定定各各组组段段的的上上、下下限限 每每个个组组段段的的起起点点称称为为组组
6、段段的的下下限限,终终点点称称为为组组段段的的上上限限。第第一一组组段段要要包包括括最最小小值值,其其下下限限取取小小于于或或等等于于最最小小值值的的整整数数,本本例例取取6最最为为第第一一组组段段的的下下限限(也也可可取取7),最最后后一一个个组组段段要要包包括括最最大大值值。注注意意各各组组段段不不能能重重合合,每每组组段段只只写写出出下下限限,如如6,8,最最后后一个组段可包括其上限值,如本例一个组段可包括其上限值,如本例2830。4.列表列表 清点各组的频数,计算频率、累积频率数和累计频率。清点各组的频数,计算频率、累积频率数和累计频率。2023/3/116第6页/共69页组段(1)频
7、数(2)频率(%)(3)累计频数(4)累计频率(%)(5)6810121416 18 20 22 24 26 2830 1 3 6 81220271812 8 4 1 0.83 2.50 5.00 6.6710.0016.6722.5015.0010.00 6.67 3.33 0.83 1 4 10 18 30 50 77 95107115119120 0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17100.00合计120100.00表2-2120名正常成年男子血清铁含量(mmo/L)频率分布2023/3/117第7页
8、/共69页图图2-2 120名健康成年男子血清铁含量(名健康成年男子血清铁含量(mol/L)分布分布2023/3/118第8页/共69页2-2 1202-2 120名健康成年男子血清铁含量名健康成年男子血清铁含量(mmo/L)(mmo/L)分布分布2023/3/119第9页/共69页三、频率分布表(图)的用途三、频率分布表(图)的用途 1.1.揭示资料的分布类型揭示资料的分布类型 2023/3/1110第10页/共69页 正偏态(右偏态)负偏态(左偏态)2.2.观察资料的集中趋势和离散趋势观察资料的集中趋势和离散趋势 3.3.便于发现某些特大或特小的可疑值便于发现某些特大或特小的可疑值 4.4
9、.便于进一步计算统计指标和作统计处理便于进一步计算统计指标和作统计处理2023/3/1111第11页/共69页第二节第二节 描述集中趋势的统计指标描述集中趋势的统计指标 医学定量资料中,描述集中趋势的统计指标主要有医学定量资料中,描述集中趋势的统计指标主要有算术均数、几何均数和中位数。算术均数、几何均数和中位数。一、算术均数一、算术均数(arithmetic mean)(arithmetic mean)简称均数。均数适用于对称分布或近似对称分布的简称均数。均数适用于对称分布或近似对称分布的资料。习惯上以希腊字母资料。习惯上以希腊字母 表示总体均数表示总体均数(population(popula
10、tion mean)mean),以表示样本均数,以表示样本均数 (sample mean)(sample mean)。常用计算。常用计算方法有直接法和频率表法(亦称加权法)。方法有直接法和频率表法(亦称加权法)。2023/3/1112第12页/共69页1.1.直接法直接法 例例2-32-3 测测得得8至至正正常常大大白白鼠鼠血血清清总总酸酸性性磷磷酸酸酶酶(TACP)含含量量(U/L)为为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试试求求其其算术均数。算术均数。本例本例(U/L)2023/3/1113第13页/共69页 2.频频率率表表法法 当当变变量量值
11、值的的个个数数较较多多时时,在在编编制制频频率率表表的基础上,应用加权法计算均数的近似值。的基础上,应用加权法计算均数的近似值。公式中,公式中,f 为各组段的频数,为各组段的频数,X0为各组段的组中值,为各组段的组中值,X0=(组段上限(组段上限+组段下限)组段下限)/2。例例2-4 (mmo/L)如用直接法计算如用直接法计算,=18.61(mmo/L)2023/3/1114第14页/共69页 表表2-3 2-3 频数表法计算均数频数表法计算均数组段组段(1)组中值组中值(X0)(2)频数频数(f)(3)fX0(4)=(2)(3)68101214161820222426283079111315
12、17192123252729136812202718128417276610418034051337827620010829合计合计12022282023/3/1115第15页/共69页二、几何均数(geometric mean,)几几何何均均数数使使用用于于原原始始变变量量不不呈呈对对称称分分布布,但但对对变变量量经经对对数数转转换换后后呈呈对对称称分分布布的的资资料料,又又称称对对数数正正态态分分布布资资料料。常常见见于于正正偏偏态态分分布布资资料料,如如抗抗体体滴滴度度,某某些些传传染染病病的的潜潜伏伏期期,细细菌菌计数等。计算公式亦可用直接法和频数表法。计数等。计算公式亦可用直接法和频
13、数表法。1.1.直接法直接法 对数的形式为对数的形式为 2023/3/1116第16页/共69页 例例2-5 7名慢性迁延型肝炎患者的名慢性迁延型肝炎患者的HBsAg滴度资料为滴度资料为:1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。试计算其几何均数。本例先求平均滴度的倒数本例先求平均滴度的倒数7 7名慢性迁延型肝炎患者的名慢性迁延型肝炎患者的HBsAgHBsAg滴度几何均数为滴度几何均数为1:641:64。2023/3/1117第17页/共69页 2.2.频频率率表表法法:当当资资料料中中相相同同变变量量值值的的个个数数f(即即频频数数)较多时,
14、可通过频率表法计算几何均数,公式为较多时,可通过频率表法计算几何均数,公式为 表表2-4 52例慢性肝炎患者的例慢性肝炎患者的 HBsAg滴度资料滴度资料抗体滴度抗体滴度频数(频数(f)滴度倒数滴度倒数(X)logXflogX1:161:321:641:1281:2561:5122711131271632641282565121.204121.505151.806182.107212.408242.709272.4082410.5360519.8679827.3937328.8988818.96489合计合计52108.069772023/3/1118第18页/共69页本例本例f lgX=10
15、8.06977,f=52,代入公式得代入公式得 52例慢性肝炎患者的例慢性肝炎患者的 HBsAg滴度的几何均数为滴度的几何均数为1:119.75 计计算算几几何何均均数数应应注注意意:变变量量值值中中不不能能有有0 0;不不能能同同时时有有正正值值和和负负值值;若若全全是是负负值值,计计算算时时可可先先把把负负号号去去掉掉,得得出出结果后再加上负号。结果后再加上负号。2023/3/1119第19页/共69页滴度倒数滴度倒数XlgX频数频数f20.3010440.6021780.903115161.204120321.505116641.806271282.107232023/3/1120第20
16、页/共69页2023/3/1121第21页/共69页2023/3/1122第22页/共69页三、中位数及百分位数三、中位数及百分位数 1.1.中位数(中位数(median,median,M M)将将一一组组变变量量值值从从小小到到大大按按顺顺序序排排列列,位位次次居居中中的的变变量量值值称称为为中中位位数数。在在全全部部变变量量值值中中,大大于于和和小小于于中中位位数数的的变变量量值值的个数相等。的个数相等。用用中中位位数数表表示示平平均均水水平平主主要要适适用用于于:变变量量值值中中出出现现个个别别特特小小或或特特大大的的数数值值;资资料料的的分分布布呈呈明明显显偏偏态态,即即大大部部分分的
17、的变变量量值值偏偏向向一一侧侧;变变量量值值分分布布一一端端或或两两端端无无确确定定数数值值,只有小于或大于某个数值只有小于或大于某个数值;资料的分布不清。资料的分布不清。2023/3/1123第23页/共69页 (1 1)直直接接法法 当当例例数数较较少少时时,先先将将变变量量值值由由小小到到大大顺序排列,再按以下公式计算。顺序排列,再按以下公式计算。n为奇数时为奇数时 n为偶数时为偶数时 式中式中X的下标为变量值的位置。的下标为变量值的位置。2023/3/1124第24页/共69页 例例2-7 某某药药厂厂观观察察9只只小小鼠鼠口口服服高高山山红红景景天天醇醇提提物物后后在在乏乏氧氧条条件
18、件下下的的生生存存时时间间(min)如如下下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.9,69.0。试求其中位数。试求其中位数。本例本例n=9,为奇数,为奇数如果如果n=10例,生存时间为例,生存时间为69.6,则中位数为,则中位数为2023/3/1125第25页/共69页 (2 2)频频率率表表法法 当当例例数数较较多多时时,先先将将变变量量值值从从小小到到大大编编制制频频率率表表,并并分分别别计计算算累累计计频频数数和和累累计计频频率率(见见表表2-52-5)。先先从累计频率找出从累计频率找出M M所在的组段,然后按下式计算。所在的组段,然后按下式计算。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 第方积乾 主编 定量 资料 统计 描述
限制150内