《集中趋势的统计描述课件.ppt》由会员分享,可在线阅读,更多相关《集中趋势的统计描述课件.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、集中趋势的统计描述2023/4/111第1页,此课件共36页哦集中趋势:集中趋势:观察值的平均水平或集观察值的平均水平或集 中位置,用中位置,用平均数平均数反映反映离散趋势:离散趋势:观察值的变异程度或离观察值的变异程度或离 散程度,用散程度,用变异指标变异指标反映反映描述资料的集中趋势与离散趋势描述资料的集中趋势与离散趋势2023/4/112第2页,此课件共36页哦第二章第二章 计量资料的集中趋势计量资料的集中趋势一、计量资料的频数分布一、计量资料的频数分布二、集中趋势指标二、集中趋势指标*1.了解统计描述的基本概念,频数分布表的编制、了解统计描述的基本概念,频数分布表的编制、类型及用途,连
2、续型变量的频数分布图。类型及用途,连续型变量的频数分布图。2.掌握算术平均数、几何平均数、中位数的计算及适掌握算术平均数、几何平均数、中位数的计算及适 用范围。用范围。2023/4/113第3页,此课件共36页哦一、计量资料的频数分布一、计量资料的频数分布频数分布表的概念频数分布表的概念频数分布表的制作频数分布表的制作频数分布表在统计分析中的作用频数分布表在统计分析中的作用2023/4/114第4页,此课件共36页哦(一)频数分布表一)频数分布表 frequency distribution table对观察到的计量资料对观察到的计量资料,按变量的取值范围进行分段按变量的取值范围进行分段,统计
3、变量值出现在每一个段中的次数统计变量值出现在每一个段中的次数(即即频数频数,frequency),),以表格的形式列出各个段及其对应以表格的形式列出各个段及其对应的频数的频数.此类表格称为此类表格称为频数分布表频数分布表.2023/4/115第5页,此课件共36页哦频数分布表频数分布表2023/4/116第6页,此课件共36页哦(二)频数表的制作方法(二)频数表的制作方法计算极差计算极差(R)决定组数决定组数(k)、组段和组距、组段和组距(i)列表划记列表划记2023/4/117第7页,此课件共36页哦 例例1.1 某地某地140名正常成年男子红细胞数名正常成年男子红细胞数P82023/4/1
4、18第8页,此课件共36页哦极差:极差:组数:组数:组距:组距:组段:组段:解题步骤:2023/4/119第9页,此课件共36页哦2023/4/1110第10页,此课件共36页哦 图图2-1 140名正常男子红细胞计数的直方图名正常男子红细胞计数的直方图 2023/4/1111第11页,此课件共36页哦1 1、作为陈述资料的形式:作为陈述资料的形式:简单明了或直观形象,便于进一简单明了或直观形象,便于进一步作统计分析。步作统计分析。(三)频数表与频数分布图的用途(三)频数表与频数分布图的用途2023/4/1112第12页,此课件共36页哦2、揭示计量资料的分布特征、揭示计量资料的分布特征频数分
5、布类型频数分布类型正偏态分布正偏态分布右偏态分布右偏态分布负偏态分布负偏态分布左偏态分布左偏态分布正态分布正态分布2023/4/1113第13页,此课件共36页哦101名正常成年女性血清总胆固醇频数分布名正常成年女性血清总胆固醇频数分布频频数数血清总血清总胆固醇胆固醇正态分布正态分布2023/4/1114第14页,此课件共36页哦2023/4/1115第15页,此课件共36页哦2023/4/1116第16页,此课件共36页哦3、描述资料的集中趋势与离散趋势、描述资料的集中趋势与离散趋势频数分布特征频数分布特征集中趋势集中趋势离散趋势离散趋势指频数分布集中分布于指频数分布集中分布于某些组段趋势某
6、些组段趋势指频数分布从集中位置指频数分布从集中位置逐渐向两侧递减的趋势逐渐向两侧递减的趋势2023/4/1117第17页,此课件共36页哦4.4.便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值可疑值可疑值可疑值可疑值2023/4/1118第18页,此课件共36页哦二、集中趋势指标二、集中趋势指标statistics of location平均数平均数(average)是一类用描述数值变量资料集中趋势是一类用描述数值变量资料集中趋势(即即平均水平平均水平)的指标的指标.2023/4/1119第19页,此课件共36页哦平均数的表示符号2023/4/1120第20页,此课件共36页哦1
7、.算术平均数算术平均数意义:意义:一组性质相同的观察值在数量上的平均水平。一组性质相同的观察值在数量上的平均水平。样本算术平均数的计算公式:2023/4/1121第21页,此课件共36页哦 组段组段 (1)频数,频数,f(2)组中值,组中值,X(3)fX(4)=(2)(3)3.8023.907.804.0064.1024.64.20114.3047.34.40254.50112.54.60324.70150.44.80274.90132.35.00175.1086.75.20135.3068.95.4045.5022.05.6025.7011.45.806.00 合合计计15.905.9140
8、669.8第22页,此课件共36页哦算术平均数的适用条件算术平均数的适用条件资料呈现正态分布或对称分布资料呈现正态分布或对称分布2023/4/1123第23页,此课件共36页哦2.几何平均数几何平均数意义:N个数值的乘积开N次方即为这N 个数的几何均数。样本几何平均数的计算公式样本几何平均数的计算公式:2023/4/1124第24页,此课件共36页哦直接法:例直接法:例2.2Page11例例2.2 测得测得10人的血清滴度的倒数分别为人的血清滴度的倒数分别为2,2,4,4,8,8,32,32,求平均滴度。,求平均滴度。2023/4/1125第25页,此课件共36页哦间接法:例间接法:例2.3
9、Page11例例2.3 某医师使用胎盘浸液钩端螺旋体菌对某医师使用胎盘浸液钩端螺旋体菌对326名农民接种两月后测得血名农民接种两月后测得血清清IgG抗体滴度如下,计算平均抗体滴度。抗体滴度如下,计算平均抗体滴度。IgG滴度倒数X lgX 例数 lgX 20 1.301 16 20.816 40 1.602 57 91.417 80 1.903 76 144.635 160 2.204 75 165.309 320 2.505 54 135.278 640 2.806 25 70.155 1280 3.107 23 71.466 2023/4/1126第26页,此课件共36页哦 变量值中不能有0
10、;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得 出结果后再加上负号。计算几何均数注意事项:计算几何均数注意事项:2023/4/1127第27页,此课件共36页哦几何平均数的适用条件几何平均数的适用条件当一组观察值为非对称分布、且差距较大当一组观察值为非对称分布、且差距较大数值按大小顺序排列后,各观察值呈倍数关数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系或呈对数正态分布。系或近似倍数关系或呈对数正态分布。常用于计算抗体平均滴度、常用于计算抗体平均滴度、药物的平均效价等药物的平均效价等2023/4/1128第28页,此课件共36页哦3.中位数中位数(median)*1)直接
11、法)直接法:当当 n 为奇数时为奇数时 当当 n 为偶数时为偶数时 2)频数表法:)频数表法:该公式适用于原始数据资料该公式适用于原始数据资料 该公式适用于频数表资料该公式适用于频数表资料LM,iM,fM分别为分别为M 所在组段的下限、组距和频数,所在组段的下限、组距和频数,fL为为M M 所在组段所在组段之前各组段的累积频数。之前各组段的累积频数。样样本本中中位位数数的的计计算算公公式式意义:意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中将一组观察值从小到大排序后,居于中间位置的那个值或两个中 间值的平均值。间值的平均值。2023/4/1129第29页,此课件共36页哦 1,
12、3,7,55,86,100,中位数为多少中位数为多少?1,3,7,55,100,中位数为多少中位数为多少?2023/4/1130第30页,此课件共36页哦 表表2-4 某地某地630名正常女性血清甘油三脂含量名正常女性血清甘油三脂含量(mg/dl)甘油三脂甘油三脂频数频数 累积频数累积频数累积频率累积频率(%)0.10 27 27 4.30.40169196 31.10.70167363 57.6 1.00 94457 72.51.30 81538 85.41.60 42580 92.11.90 28608 96.52.20 14622 98.72.50 4626 99.42.80 3629
13、99.83.10 1630100.0 合计合计630-M2023/4/1131第31页,此课件共36页哦中位数的适用条件中位数的适用条件当资料呈明显的偏态分布当资料呈明显的偏态分布资料一端或两端无确定数值资料一端或两端无确定数值资料的分布情况不明资料的分布情况不明*对于任何分布资料都可以用中位数反映平均水平对于任何分布资料都可以用中位数反映平均水平,但中位数没有但中位数没有利用全部数据的信息利用全部数据的信息,只受位置居中的观察值的影响只受位置居中的观察值的影响.*若资料呈对称或正态分布若资料呈对称或正态分布,总体中位数与总体算术平均数相总体中位数与总体算术平均数相等等;样本中位数与样本算术平
14、均数不一定完全相等样本中位数与样本算术平均数不一定完全相等,但一般情但一般情况下况下,近似相等近似相等.2023/4/1132第32页,此课件共36页哦4.百分位数百分位数Px(percentile)百分位数是把一组数据从小到大排列百分位数是把一组数据从小到大排列,分成分成100等份等份,各等份含各等份含1%的观察值的观察值,分割界限上的数值就是百分位数分割界限上的数值就是百分位数.中位数即第中位数即第50百分位数百分位数,记为记为P50.把某些特殊的百分位数结合起来把某些特殊的百分位数结合起来,能较全面地反映数据的集中趋能较全面地反映数据的集中趋势和离散趋势势和离散趋势.如如P5,P25,P
15、50,P75,P95 等指标结合起来等指标结合起来.百分位数常常用于医学参考值范围的估计百分位数常常用于医学参考值范围的估计.2023/4/1133第33页,此课件共36页哦计算公式计算公式:例例2.5资料资料 P25,P50,P75,P90 计算结果计算结果2023/4/1134第34页,此课件共36页哦1.先找到包含先找到包含Px的最小累计频率;的最小累计频率;2.该累计频率同行左边的组段值为该累计频率同行左边的组段值为L;3.L 同行右边的频数为同行右边的频数为fx(或或 fm);4.L 前一行的累计频数为前一行的累计频数为fL;5.将上述已知条件代入公式计算将上述已知条件代入公式计算Px或或P50。计算中位数及百分位数的步骤:计算中位数及百分位数的步骤:2023/4/1135第35页,此课件共36页哦课后复习和预习:课后复习和预习:复习思考复习思考:1.统计学的几个基本概念统计学的几个基本概念 2.统计资料的类型统计资料的类型3.集中趋势的统计描述的概念和指标及其应用条件集中趋势的统计描述的概念和指标及其应用条件预习:预习:1.几个变异指标的公式,应用条件几个变异指标的公式,应用条件2.正态分布及医学参考值。正态分布及医学参考值。2023/4/1136第36页,此课件共36页哦
限制150内