定量变量的统计描述.ppt
定量变量的统计描述定量变量的统计描述现在学习的是第1页,共30页对于计量资料对于计量资料如果观察值较少,可直接计算统计描述指标;如果观察值较少,可直接计算统计描述指标;如果如果观察值较多观察值较多,应先进行整理,应先进行整理列出频数表,然后列出频数表,然后再进行统计描述。再进行统计描述。第一节 频数分布表与频数分布图现在学习的是第2页,共30页例例例例6.1 6.1 某地某地某地某地120120名健康成人血糖(名健康成人血糖(名健康成人血糖(名健康成人血糖(mmol/Lmmol/L)测定结果如下)测定结果如下)测定结果如下)测定结果如下4.604614.655.864.754.805.814.715.045.254.335.704.945.325.784.854.285.484.484.294.935.214.584.054.114.785.144.154.495.264.384.635.124.955.115.224.665.094.674.685.623.67*5.273.833.914.454.925.354.064.284.405.134.525.125.404.885.015.005.595.534.964.574.835.435.065.334.904.084.485.044.425.235.084.424.235.244.255.625.284.305.024.564.775.375.644.725.164.865.524.334.985.484.964.785.105.315.345.384.504.824.954.554.815.564.554.894.695.194.725.454.154.806.16*5.555.134.865.754.955.064.99现在学习的是第3页,共30页频数表编制步骤频数表编制步骤:(1)(1)计计算算全全距距(range):亦亦称称极极差差,简简记记为为R,R=XmaxXmin,本本例例最最大大值为值为6.16,最小值为,最小值为3.67,故:,故:R=6.163.67=2.49(mmol/L)(2)(2)确定组距:确定组距:一般分为一般分为815组。本例:组。本例:R=2.49,i=R/k=2.49/10=0.249(mmol/L),定组距为定组距为i=0.20(mmol/L)比较适宜。比较适宜。(3)(3)确定组限:确定组限:第一组段应包括最小值;第一组段应包括最小值;各个组段只包括下限值,不包括上限值;各个组段只包括下限值,不包括上限值;最末一组段应包括最大值,并同时写出其下限和上限。最末一组段应包括最大值,并同时写出其下限和上限。(4)(4)划记,列频数表划记,列频数表(见表(见表6-1)现在学习的是第4页,共30页表表表表6-1 6-1 6-1 6-1 某地某地某地某地120120120120名成人血糖的频数分布名成人血糖的频数分布名成人血糖的频数分布名成人血糖的频数分布 血糖(血糖(mmol/L)频频数(数(f)3.63.84.04.24.44.64.85.05.25.45.65.8 6.06.2 1 2 6 9141521181510 5 3 1合 计 120(f)现在学习的是第5页,共30页图图6-1 6-1 某地某地120120名健康成人血糖(名健康成人血糖(mmol/Lmmol/L)频数分布图)频数分布图现在学习的是第6页,共30页图6-2 频数分布的三种类型示意图现在学习的是第7页,共30页频数分布表的用途频数表的用途:频数表的用途:1.作作为为陈陈述述资资料料的的形形式式,可可以以替替代代繁繁杂杂的的原原始始资资料料,便便于进一步统计分析。于进一步统计分析。2.揭示资料的分布特征和分布类型。揭示资料的分布特征和分布类型。3.便于发现某些特大或特小的可疑值(离群值)。便于发现某些特大或特小的可疑值(离群值)。4.当样本量较大时,可以各组段的频率作为概率的估计值。当样本量较大时,可以各组段的频率作为概率的估计值。现在学习的是第8页,共30页第二节第二节 描述平均水平的统计指标描述平均水平的统计指标 统计描述即用恰当的统计指标描述资料统计描述即用恰当的统计指标描述资料的数量特征。的数量特征。计量资料的统计描述分为两个方面:计量资料的统计描述分为两个方面:集中趋势集中趋势(central tendency)主要指平均水平主要指平均水平 离散趋势离散趋势(tendency of dispersion)现在学习的是第9页,共30页平均数(average)平均数是反映一组同质的数值变量资料的集中趋势平均数是反映一组同质的数值变量资料的集中趋势或平均水平的指标或平均水平的指标。常用的平均数有三种:。常用的平均数有三种:一、算术均数一、算术均数(arithmetic mean(arithmetic mean,)二、几何均数二、几何均数(geometric mean(geometric mean,G G)三、中位数三、中位数(median(median,M M)和百分位数和百分位数 (percentile(percentile,P Px x)现在学习的是第10页,共30页一、算术均数一、算术均数(arithmetic mean)是是n个变量值的数值平均值,即各个变量值之和除以个变量值的数值平均值,即各个变量值之和除以变量值的个数。适用于对称分布资料。变量值的个数。适用于对称分布资料。例例 测得测得5名周岁儿童的头围名周岁儿童的头围(cm)为:为:44、45、46、47、48,求其,求其平均头围。平均头围。(一)直接法:(一)直接法:现在学习的是第11页,共30页(二)加权法(二)加权法(weighting method):当观察值较多时,可先编制频数表当观察值较多时,可先编制频数表(frequency table),然后用加权法,然后用加权法(weighting method)计算:计算:一、算术均数一、算术均数(arithmetic mean)现在学习的是第12页,共30页 一、算术均数一、算术均数(arithmetic mean)SD=0.482现在学习的是第13页,共30页二、几何均数二、几何均数(geometric mean)几何均数是几何均数是n个变量值的乘积开个变量值的乘积开n次方所得的根。次方所得的根。直接法直接法现在学习的是第14页,共30页二、几何均数二、几何均数(geometric mean)例例7.2 有有5人的血清中某抗体效价分别为人的血清中某抗体效价分别为1:10、1:20、1:40、1:80、1:160,求其平均效价。,求其平均效价。即5人血清中该抗体平均效价为1:40 现在学习的是第15页,共30页二、几何均数二、几何均数(geometric mean)加权法加权法 现在学习的是第16页,共30页例例7.3 40名麻疹易感儿接种疫苗名麻疹易感儿接种疫苗1个月后血凝抑制抗体滴度见表个月后血凝抑制抗体滴度见表7-3,求平均滴度。,求平均滴度。现在学习的是第17页,共30页本例本例flgx=72.2471,代入公式得:,代入公式得:即即40名麻疹易感儿接种疫苗名麻疹易感儿接种疫苗1个月后血凝抑个月后血凝抑制抗体平均滴度为制抗体平均滴度为1:64。现在学习的是第18页,共30页三、中位数和百分位数三、中位数和百分位数中位数中位数(median)将一组观察值按大小依次排列,位置居将一组观察值按大小依次排列,位置居中的数即中位数。中的数即中位数。现在学习的是第19页,共30页三、中位数和百分位数三、中位数和百分位数 直接法(计算实例):直接法(计算实例):测得测得5人的极低密度脂蛋白人的极低密度脂蛋白(VLDL)中的载脂中的载脂B蛋白蛋白含量含量(mg/dl)分别为:分别为:0.84、2.85、5.46、8.58、9.60 M=5.46(mg/dl)如仅测如仅测4人:人:0.84、2.85、8.58、9.60。M=(2.85+8.58)/2=5.72(mg/dl)现在学习的是第20页,共30页频数表计算法频数表计算法:例7 某地205例伤寒患者潜伏期见下表,求平均潜伏期 现在学习的是第21页,共30页频数表计算法频数表计算法:例7.4 某地205例伤寒患者潜伏期见表7-4,求平均潜伏期 LfMfL现在学习的是第22页,共30页LnfiLM-的各组累积频数小于样本量,即总频数中位数所在组的频数中位数所在组的组距中位数所在组的下限式中:fL现在学习的是第23页,共30页 本例为第本例为第4个组段。个组段。L=8天,天,i=2天,天,f50=50,fL=97。代入式。代入式7.1得:得:故平均潜伏期为故平均潜伏期为8.22天。天。现在学习的是第24页,共30页百分位数百分位数(Percentile,Px)的各组累积频数的各组累积频数小于小于样本量,即总频数样本量,即总频数所在组的频数所在组的频数所在组的组距所在组的组距所在组的下限所在组的下限分位数分位数第第式中:式中:LnPfPiPLxPxxxxx fL现在学习的是第25页,共30页百分位数的计算实例百分位数的计算实例表表 某地某地630名正常女性甘油三脂含量名正常女性甘油三脂含量甘油三脂甘油三脂(mg/dl)频数频数(f)累积频数累积频数(f)累积频率累积频率(1)(2)(3)(4)10 27 27 4.3 40169196 31.1 70167363 57.6100 94457 72.5130 81538 85.4160 42580 92.1190 28608 96.5220 14622 98.7250 4626 99.4280 3629 99.8310 1630100.0合合 计计630-现在学习的是第26页,共30页根据上表数据计算根据上表数据计算P25和和P75四分位数的计算实例四分位数的计算实例()()()()dlmgPdlmgP/7.135457%756308130130/2.6327%2563016930407525=-+=-.+=.现在学习的是第27页,共30页现在学习的是第28页,共30页学习要点学习要点u频数表的编制频数表的编制 求全距求全距 定组距定组距 确定组限确定组限 划记列表划记列表u平均数的计算平均数的计算 直接法、加权法直接法、加权法(或频数表法或频数表法)u三种平均数的应用三种平均数的应用现在学习的是第29页,共30页指指 标标 应应 用用 条条 件件 算术均数算术均数对称分布;对称分布;封口资料。封口资料。几何均数几何均数等比资料或对数正态分布资料;等比资料或对数正态分布资料;封口资料;封口资料;观察值不能为观察值不能为0,也不能同时既有正值又有,也不能同时既有正值又有负值。负值。中中 位位 数数所所有有分分布布类类型型的的资资料料,但但主主要要用用于于偏偏态态分分布或分布不明的资料;布或分布不明的资料;有不确定值(开口资料)。有不确定值(开口资料)。三种平均数的应用条件比较三种平均数的应用条件比较 现在学习的是第30页,共30页