计量资料统计描述.pptx
《计量资料统计描述.pptx》由会员分享,可在线阅读,更多相关《计量资料统计描述.pptx(138页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、NEJM:Olaparib维持治疗可显著延长铂类敏感性复发性高级别浆液性卵巢癌患者生存期第1页/共138页NEJM:吲哚美辛可显著减少ERCP术后胰腺炎发生率随机,安慰剂对照双盲临床试验对ERCP术后胰腺炎高危患者立即经直肠给予单一剂量吲哚美辛或安慰剂治疗。受试者为已被确诊并具备手术相关危险因素的高危患者。试验主要结束指标为ERCP术后胰腺炎发生率,表征为新发生的腹疼,术后24小时后胰酶含量为正常范围上限的至少3倍以上,并住院至少2天。试验共纳入602例患者并全部完成随访。大部分患者(82%)出现疑似胆道口括约肌功能紊乱症。吲哚美辛处理组295例患者中有27例发生ERCP术后胰腺炎(9.2%)
2、,而安慰剂处理组307例患者中则有52例(16.9%)发生胰腺炎(P=0.005)。吲哚美辛处理组有13例患者发生中度至高度胰腺炎(4.4%),而安慰剂组这一数据则为27例(8.8%)(P=0.03)。第2页/共138页第二章第二章 计量资料的统计描述计量资料的统计描述第一节 频数分布第二节 集中趋势的描述第三节 离散趋势的描述第四节 正态分布第五节 医学参考值范围的制定32023/3/21第3页/共138页第二章第二章 计量资料的统计描述计量资料的统计描述 常用的描述定量资料分布规律的统计方法有两类:统计图表:统计图表:频数分布表频数分布表/图图 选用适当的统计指标:选用适当的统计指标:集中
3、趋势指标:均数、中位数集中趋势指标:均数、中位数离散趋势指标:极差、标准差、方差、四分位间距、变异系数离散趋势指标:极差、标准差、方差、四分位间距、变异系数42023/3/21第4页/共138页第5页/共138页第一节第一节 频数分布频数分布频数分布表(frequency distribution table):将变量值化分为若干个组段,清点并记录各组段变量值的个数,称为频数表(frequency table)。62023/3/21第6页/共138页第一节第一节 频数分布频数分布72023/3/21最小值最大值例1第7页/共138页一、频数分布表一、频数分布表频数表的编制步骤1.求极差:极差(
4、range)是全部数据中的最大值与最小值之差,它描述了数据的变异幅度。公式:RXMaxXMin 例1:XMax=5.59 XMin=3.60 R=5.59-3.60=1.99 82023/3/21第8页/共138页一、频数分布表一、频数分布表 (2)确定组段数和组距 确定组段数:n100,1015组;n100,810组 确定组距:组距可以相等也可以不相等,一般采用等距分组,组距可以相等也可以不相等,一般采用等距分组,组距组距=极差极差/组数组数 例例1 1.99/102,故组距,故组距=2mmol/L92023/3/21第9页/共138页一、频数分布表一、频数分布表(3)划分组段 每个组段的起
5、点为该组的每个组段的起点为该组的下限下限L(low limit),终点终点为为上限上限U(upper limit),上限上限=下限下限+组距;变量值组距;变量值X的归组统一定为的归组统一定为LX U,最后组段写出上限,起始最后组段写出上限,起始组段和最后组段应包含最小值和最大值组段和最后组段应包含最小值和最大值各组段不能重叠,每一组段均为半开半闭区间,即包各组段不能重叠,每一组段均为半开半闭区间,即包括下限,不包含上限。括下限,不包含上限。例例1 第一组段下限为第一组段下限为 3.60,上限为,上限为3.60+0.20=3.80 即即3.60,3.80);以此类推。最后一组段 5.40,5.6
6、0 102023/3/21第10页/共138页一、频数分布表一、频数分布表112023/3/21最后一组段第一组段列出各组段第11页/共138页一、频数分布表一、频数分布表(4)分组划记并统计频数 122023/3/21将原始数据一一对应入每个组段,通过划“正”字,来统计每个组段内的数据第12页/共138页一、频数分布表一、频数分布表132023/3/21(4)分组划记并统计频数统计每个组段内的频数(例数)频数的合计数等于样本含量第13页/共138页一、频数分布表一、频数分布表142023/3/21(4)分组划记并统计频数计算出每个组段的频率每组的频数 样本含量第14页/共138页一、频数分布
7、表一、频数分布表152023/3/21(4)分组划记并统计频数计算出每个组段的累计频率=本组段的频率+上一组段的累计频率第15页/共138页一、频数分布表一、频数分布表162023/3/21第16页/共138页二、频数分布图二、频数分布图 绘制频数分布直方图坐标轴横坐标:变量值即研究指标,无需从0开始,以单位尺度划分。纵坐标:为频数f,必须从0开始(f为每一组段内的人数)直条直条的宽度:组距直条的高度:每一组段的频数累计172023/3/21第17页/共138页二、频数分布图二、频数分布图182023/3/21第18页/共138页二、频数分布图二、频数分布图192023/3/21第19页/共1
8、38页三、频数表和频数分布图的用途三、频数表和频数分布图的用途1.描述频数分布的类型2.描述频数分布的特征3.便于发现某些特大或特小可疑值4.便于进一步做统计分析和处理202023/3/21第20页/共138页1.频数分布的类型频数分布的类型 频数分布又可分为对称分布和偏态分布对称分布:集中位置在正中,左右两侧频数分布大体对称偏态分布:集中位置偏向一侧,频数分布不对称正偏态分布:集中位置偏向年龄小的一侧负偏态分布:集中位置偏向年龄大的一侧 不同类型的分布,应采用相应的统计分析方法。212023/3/21第21页/共138页1.频数分布的类型频数分布的类型222023/3/21正态分布(norm
9、al distribution)中间高、两边低、左右对称属于对称分布的一种许多医学资料都属于这种分布,例如人体正常的生理生化指标正态分布第22页/共138页1.频数分布的类型频数分布的类型232023/3/21 a.尖峭峰 b.正态峰c.平阔峰第23页/共138页1.频数分布的类型频数分布的类型242023/3/21正偏态分布正偏态分布:峰偏左,尾部向右侧延伸如:以儿童为主的传染病发病人数的分布右偏态负偏态分布:峰偏右,尾部向左侧延伸如:以老年人为主的慢性病发病人数的分布左偏态负偏态分布(positive skewed)(negative skewed)第24页/共138页252023/3/2
10、1正(右)偏态分布第25页/共138页262023/3/21g负(左)偏态分布第26页/共138页2.频数分布的特征频数分布的特征从频数表可以看到频数分布的两个重要的特征 集中趋势(central tendency)血糖值向中央部分(中等水平)集中,以中等水平的血糖值者居多,是为集中趋势。离散趋势(tendency of dispersion)从中央部分到两侧(血糖值从中等水平到较低或较高水平)的频数分布逐渐减少,是为离散趋势。集中趋势和离散趋势是频数分布的两个重要侧面,从这两方面就可全面的分析所研究的事物。272023/3/21第27页/共138页3、便于发现某些特大或特小可疑值、便于发现某
11、些特大或特小可疑值282023/3/21第28页/共138页白细胞分布直方图的模式 第29页/共138页白细胞的干扰“R”的分布 类似于“R0、R1、R2、R3、R4及Rm”这样的标记经常会出现在CD1600的报告单的WBC计数及分类的数值结果旁边,这些R的标记是对白细胞分布中的某些区域数值异常所进行的提示 第30页/共138页中介值细胞区域出异常白细胞峰 第31页/共138页由大量白血病细胞出现形成的单一峰 第32页/共138页第33页/共138页红细胞分布直方图 第34页/共138页第35页/共138页第36页/共138页第二节第二节 集中趋势的描述集中趋势的描述算术均数(arithmet
12、ic mean)几何均数(geometric mean)中位数和百分位数(median percentile)以上统称为平均数(average)常用于描述一组变量值的集中位置,代表其平均水平或是集中位置的特征值。372023/3/21第37页/共138页一、算术均数一、算术均数又简称为均数(mean)定义:是反映一组观察值在数量上的平均水平。总体均数用希腊字母 表示,样本均数用 表示计算方法:直接法:直接法:加权法:加权法:应用:正态分布或近似正态分布资料 382023/3/21(arithmetic mean)第38页/共138页一、算术均数一、算术均数计算方法直接法:即将所有观察值x1,x
13、2,x3,xn直接相加再除以观察值的个数,写成公式2023/3/2139 为样本均数,n为变量值个数,i为各变量值,表示求和第39页/共138页一、算术均数一、算术均数 例2 有9名健康成人的空腹胆固醇测定值(mmol/L)为5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93,求算术均数。402023/3/21第40页/共138页一、算术均数一、算术均数 计算方法 加权法(weighting method)当资料中相同观察值的个数较多时,可将相同观察值的个数,即频数f,乘以该观察值x,以代替相同观察值逐个相加。对于频数表资料,用各组段的频数作f,以相应的组
14、中值(class mid-value)作x。组中值组中值=(下限(下限+上限)上限)/2公式公式412023/3/21 fi为各组段的频数xi为各组段的组中值第41页/共138页一、算术均数一、算术均数422023/3/21第42页/共138页一、算术均数一、算术均数432023/3/21组中值=(下限+上限)/2如:3.60组段的组中值=(3.60+3.80)/2=3.70以此类推第43页/共138页一、算术均数一、算术均数f1,f2,fk分别为各组段的频数,这里的f起到了“权数”的作用,它权衡了各组中值由于频数不同对均数的影响。即频数多,权数大,作用也大;频数少,权数小,作用也小,故称为加
15、权法。442023/3/21用组中值,加权法计算出的均数是精确值吗?第44页/共138页一、算术均数一、算术均数 均数的两个重要特性各离均差(即各观察值x与均数 x之差)的总和等于零。离均差的平方和小于个观察值x与任何数(x)之差的平方和。452023/3/21第45页/共138页一、算术均数一、算术均数462023/3/21v各离均差(即各观察值x与均数 x之差)的总和等于零。第46页/共138页一、算术均数一、算术均数1、最常用,特别是正态分布资料2、均数对极值特别敏感,极大值或极小值通常将均数拉向自己472023/3/21均数的特征第47页/共138页二、几何均数二、几何均数定义:有些医
16、学资料,如抗体滴度、细菌计数等,其频数分布明显偏态,各观察值之间呈倍数变化(等比关系),此时宜用几何均数反映其平均增减倍数。计算方法:直接法加权法应用:等比资料或对数正态分布资料482023/3/21(geometric mean)第48页/共138页二、几何均数二、几何均数 计算方法:直接法:直接将n个观察值(x1,x2,x3,xn)的乘积开n次公式公式写成对数形式为写成对数形式为 492023/3/21几何均数:变量对数值的算术均数的反对数。第49页/共138页二、几何均数二、几何均数例3 有7份血清的抗体效价分别为1:2,1:4,1:8,1:16,1:32,1:64,1:128,求平均抗
17、体效价。本例先求抗体效价的倒数,再求几何均数本例先求抗体效价的倒数,再求几何均数502023/3/21血清抗体的平均效价为1:16第50页/共138页二、几何均数二、几何均数计算方法:加权法:当资料中相同观察值得个数f(即频数)较多时,如频数表资料写成公式写成公式512023/3/21第51页/共138页二、几何均数二、几何均数例4 有60人的血清抗体效价,分别为7人1:5,11人 1:10,22人1:20,12人1:40,8人1:80,求平均抗体效价。522023/3/2160人的血清平均抗体效价为1:20.705第52页/共138页二、几何均数二、几何均数 注意事项等比资料,如:等比资料,
18、如:抗体的平均滴度、药物的平均效价、卫抗体的平均滴度、药物的平均效价、卫生事业平均发展速度、人口的几何增长生事业平均发展速度、人口的几何增长对数正态分布:对数正态分布:是右偏态分布是右偏态分布观察值不能有观察值不能有0 0。因为因为0 0不能去对数,不能与任何其他数不能去对数,不能与任何其他数呈倍数关系。呈倍数关系。观察值不能同时有正值和负值。观察值不能同时有正值和负值。若全是负值,计算是可若全是负值,计算是可以把负号去掉,得出结果后再加上负号。以把负号去掉,得出结果后再加上负号。同一组资料求得的几何均数小于算术均数。同一组资料求得的几何均数小于算术均数。532023/3/21第53页/共13
19、8页二、几何均数二、几何均数 若一组数值变量资料为偏态分布,变量为x,令y=lgx后,变量y服从正态分布,请问变量x为什么样的偏态分布资料?542023/3/21正偏态分布正态分布变量y 服从则变量x服从抗体滴度抗体滴度 人数人数,f f 滴度倒数滴度倒数,X X lglgX X1:2.51:101:401:1601:640 合计合计141822126722.510.040.0160.0640.00.39791.00001.60212.20412.8062102.1032 第54页/共138页三、中位数和百分位数三、中位数和百分位数(一)中位数定义:定义:是将一组观察值从小到大按顺序排列,位次
20、是将一组观察值从小到大按顺序排列,位次居中的居中的观察值观察值就是中位数。就是中位数。例:例:552023/3/21((median percentile))X:5,5,6,7,20,位次:1 2 3 4 5中位数(M):6.523 6第55页/共138页(一)中位数(一)中位数计算方法:计算方法:直接由原始数据计算中位数直接由原始数据计算中位数先将观察值按大小顺序排列,再按下面公式计算:先将观察值按大小顺序排列,再按下面公式计算:562023/3/21第56页/共138页(一)中位数(一)中位数 例5 有7名正常人的血压(舒张压)测定值(mmHg)为:72,75,76,77,81,82,86
21、,求中位数。解:n=7 为奇数 变量x:72,75,76,77,81,82,86 位 次:1 2 3 4 5 6 7572023/3/21 请大家思考下:计算中位数和其他平均数有什么不同?特点:仅利用了中间的12个数据第57页/共138页(一)中位数(一)中位数计算方法:计算方法:用频数表计算中位数,用频数表计算中位数,按所分组段,由小到大计算累计频数和累计频率。按所分组段,由小到大计算累计频数和累计频率。再按下面公式计算为:再按下面公式计算为:582023/3/21第58页/共138页592023/3/21下限值L上限值Ui;fm中位数M(一)中位数第59页/共138页602023/3/21
22、0 2.27 4.55 10.61 28.03 46.21 65.15 80.30 89.39 96.97 (一)中位数累计频数3 614376186106118128132第60页/共138页612023/3/21(一)中位数1.反映了位次居中的观察值的水平 优点:不受两端特大值和特小值影响 缺点:并非考虑到每个观测值2.适用于各种分布类型的资料,特别适合于:大样本偏态分布资料 或者一端/两端无确切数值的资料 3.中位数和算术均数再对称分布的资料中,理论上数值是相 同的中位数的特征第61页/共138页622023/3/21(二)百分位数v定义:是一种位置指标,用 PX 来表示。将n个变量值从
23、小到大依次排列,再把它们的位次转换为百分位。对应于X%位次的数值即为第X百分位数。变量值:5 5 8 89 758 位 次:1 2 3 75 150 百分位次:0.7%1.3%2%50%100%第62页/共138页632023/3/21百分数示意(100-x)%x%位图(二)百分位数 一个PX将全部变量值分为两部分,在不包含 PX的全部变量值中有X%的变量值比它小,有(100-X)%的变量值比它大。PX是一个界值。第63页/共138页v计算方法计算方法直接计算法直接计算法 设有n个原始数据从小到大排列,第X百分位数的计算公式为:当 为带有小数位时:当 为整数时:642023/3/21Trunc
24、()取整函数(二)百分位数第64页/共138页例例 对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第5百分位数和第百分位数和第99百分位数百分位数。(1)n=120,1205%=6,为整数:652023/3/21(二)百分位数患 者:住院天数:第65页/共138页 (2)12099%=118.8,带有小数,故取整 trunc(118.8)=118662023/3/21患 者:住院天数:(二)百分位数第66页/共138页v计算方法计算方法 频数表法频数表法 公式如下公式如下672
25、023/3/21(二)百分位数Lx:第X百分位数所在组段的下限ix:第X百分位数所在组段的组距fx:第X百分位数所在组段的频数 :第X百分位数所在组段上一组段累计频数第67页/共138页l例8.3 某传染性疾病的潜伏期(天)见表8-3,求平均潜伏期和潜伏期的第25、75与95百分位数P25,P75,P95。682023/3/21(二)百分位数第68页/共138页692023/3/21(二)百分位数第69页/共138页1、四分位数(Quartile)(三个四分位数)2、十分位数(Centile):9个十分位数3、百分位数(Percentile)99个百分位数702023/3/21(二)百分位数P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 资料 统计 描述
限制150内