平均数-标准差课件.ppt
《平均数-标准差课件.ppt》由会员分享,可在线阅读,更多相关《平均数-标准差课件.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量资料的统计描述计量资料的统计描述 statistical description本本次课内容次课内容一、计量资料的频数分布一、计量资料的频数分布二、集中趋势指标二、集中趋势指标三、离散趋势指标三、离散趋势指标四、正态分布四、正态分布计量资料计量资料(复习)(复习)统计描述统计描述(statistical description):对资料的属性、特点进行的有关叙述、显示、对资料的属性、特点进行的有关叙述、显示、计算等,是统计推断的基础。计算等,是统计推断的基础。描述必须基于资料的描述必须基于资料的分布分布(distribution)类型,类型,主要是资料的分布特征。分布类型不同,统计主要是资
2、料的分布特征。分布类型不同,统计指标不同。指标不同。分布分布:数值在所研究样本(或总体)中:数值在所研究样本(或总体)中的存在状态,通常用频数的存在状态,通常用频数(frequency)来表示。来表示。频数频数:某变量值出现的次数(某现象发:某变量值出现的次数(某现象发生的次数)。生的次数)。某市某市19951995年年110110名名7 7岁男童的身高岁男童的身高(cm(cm)频数表频数表 身高身高(cm)(cm)某市某市19951995年年110110名名7 7岁男童的身高分布直方图岁男童的身高分布直方图频数表揭示频数的两个重要特征:频数表揭示频数的两个重要特征:集中趋势集中趋势(cent
3、ral tendency):数值高低不数值高低不等,但中等水平的人数最多。等,但中等水平的人数最多。离散趋势离散趋势(tendency of dispersion):数值之数值之间参差不齐;逐渐变大(或变小)的人间参差不齐;逐渐变大(或变小)的人数渐少。向两端分散。数渐少。向两端分散。两方面含义:两方面含义:数值大小数值大小和和位置位置。集中趋势集中趋势central tendency平均数(平均数(average):用于描述数值变量资料用于描述数值变量资料的集中趋势(平均水平)。的集中趋势(平均水平)。特点:简明概括,便于比较。特点:简明概括,便于比较。包括:算术平均数,几何平均数,中位数,
4、包括:算术平均数,几何平均数,中位数,百分位数百分位数1、算术平均数(、算术平均数(arithmetic mean)一组变量值之和除以变量值个数所得的商一组变量值之和除以变量值个数所得的商,简称均数。简称均数。总体均数总体均数,样本均数,样本均数 表示。表示。适用条件:资料成正态分布(或近似正态,适用条件:资料成正态分布(或近似正态,或对称分布)。或对称分布)。计算方法:直接法,加权法计算方法:直接法,加权法直接法:当样本的观察值个数不多时,将直接法:当样本的观察值个数不多时,将各观察值各观察值X1,X2,Xn相加再除相加再除以观察值的个数以观察值的个数n(样本含量)即得均样本含量)即得均数。
5、数。公式:公式:加加权法法weighted method当观察值个数较多时,可先将各观察当观察值个数较多时,可先将各观察值分组归纳成值分组归纳成频数表频数表,用加权法求均数。,用加权法求均数。利用频数表,计算组中值(为本组段的利用频数表,计算组中值(为本组段的下限与相邻较大组段的下限的均值),下限与相邻较大组段的下限的均值),各组段频数与组中值的乘积,近似等于各组段频数与组中值的乘积,近似等于该组变量值之和,各乘积之和除以总频该组变量值之和,各乘积之和除以总频数,所得的商,就是均数。数,所得的商,就是均数。加加权法法计算算数均数的公式算算数均数的公式例题:计算算术均数例题:计算算术均数直接法:
6、略直接法:略加权法加权法均数的两个重要属性:均数的两个重要属性:(1)各离均差(各观察值与均数之差)的)各离均差(各观察值与均数之差)的总和等于零。总和等于零。(2)离均差的平方和小于各个观察值)离均差的平方和小于各个观察值X与与任何数任何数a()之差的平方和。之差的平方和。均数是一组观察值理想的代表值。均数是一组观察值理想的代表值。均数的应用:均数的应用:(1)只能在合理分布的基础上,对同)只能在合理分布的基础上,对同质事物求均数才有意义,才能反映事质事物求均数才有意义,才能反映事物的特性。物的特性。(2)均数最适用于对称分布,尤其是)均数最适用于对称分布,尤其是正态分布资料。此时,均数位于
7、分布正态分布资料。此时,均数位于分布的中央,能反映观察值的集中趋势。的中央,能反映观察值的集中趋势。2、几何均数、几何均数geometric mean G将将n个个观观察察值值的的乘乘积积再再开开n次次方方的的方方根根(或或各观察值对数值均值的反对数)。各观察值对数值均值的反对数)。适用条件:适用条件:(1)观观察察值值为为非非对对称称分分布布,差差距距较较大大,用用算算术术均均数数表表示示其其平平均均水水平平会会受受少少数数特特大或特小值影响;大或特小值影响;(2)数数值值按按大大小小顺顺序序排排列列后后,各各观观察察值呈倍数关系或近似倍数关系。值呈倍数关系或近似倍数关系。如:抗体滴度,药物
8、效价等如:抗体滴度,药物效价等几何均数是算数均数的近似值。几何均数是算数均数的近似值。直接法直接法:当观察例数不多时采用。当观察例数不多时采用。加权法:观察例数多时采用。加权法:观察例数多时采用。为什么滴度资料的几何均数需校正?为什么滴度资料的几何均数需校正?假设有假设有13人接种疫苗后抗体滴度为:人接种疫苗后抗体滴度为:1/20,1/20,1/40,1/40,1/40,1/80,1/80,1/80,1/80,1/80,1/80,1/160,1/320可以证明,这种取下限值的计算,会使可以证明,这种取下限值的计算,会使得到的几何均数偏小,即:几何均数在得到的几何均数偏小,即:几何均数在取反对数
9、之前偏小半个组距(在作取反对数之前偏小半个组距(在作d倍倍稀释时就是稀释时就是1/2lgd)。)。几何均数的应用几何均数的应用:(1)常用于等比级数资料,滴度,效价,)常用于等比级数资料,滴度,效价,卫生事业平均发展速度,人口几何增长,卫生事业平均发展速度,人口几何增长,对数正态分布资料;对数正态分布资料;(2)观察值不能有)观察值不能有0;(3)观察值不能同时有正值和负值。)观察值不能同时有正值和负值。(4)同一组资料求得的几何均数小于算)同一组资料求得的几何均数小于算术均数。术均数。几何均数的计算几何均数的计算3,4,5,6,17,算数均数:算数均数:几何均数:几何均数:3、中位数(、中位
10、数(median,M):位于中间位置上的数值。位于中间位置上的数值。把一组观察值,按大小顺序排列,位置居把一组观察值,按大小顺序排列,位置居中的变量值(奇数个)或位置居中的两中的变量值(奇数个)或位置居中的两个变量值的均值(偶数个)。是位置指个变量值的均值(偶数个)。是位置指标,以中位数为界,将观察值分为两半,标,以中位数为界,将观察值分为两半,有一半比它大,一般比它小。有一半比它大,一般比它小。中位数适用于:中位数适用于:(1)资料偏态分布;)资料偏态分布;(2)两端无确定数值;)两端无确定数值;(3)资料分布不清楚;)资料分布不清楚;潜伏期,毒物测定值等用中位数表示潜伏期,毒物测定值等用中
11、位数表示其集中趋势。其集中趋势。中位数的算法:未分组资料,依变量个中位数的算法:未分组资料,依变量个数定。数定。分组资料,用下公式。分组资料,用下公式。L:L:中位数所在组的下限中位数所在组的下限W:W:中位数所在组的宽度中位数所在组的宽度f:f:中位数所在组的频数(例数)中位数所在组的频数(例数)n:n:总频数总频数C:C:中位数所在组的前一组的累计频数中位数所在组的前一组的累计频数 中位数常用于描述中位数常用于描述偏态分布资料的集中偏态分布资料的集中趋势趋势,它反映居中位置的变量值的大小。,它反映居中位置的变量值的大小。不受特大,特小值的影响,只受位置居不受特大,特小值的影响,只受位置居中
12、的观察值的影响,因而不够敏感。中的观察值的影响,因而不够敏感。而均数,几何均数是由全部观察值综合而均数,几何均数是由全部观察值综合计算出的,敏感性好。计算出的,敏感性好。理论上,中位数等于算术均数。理论上,中位数等于算术均数。例题:例题:中位数的计算中位数的计算 P244、百分位数、百分位数(percentile,P):位于某个百分位置上的数值位于某个百分位置上的数值。把一组数据从小到大排列,分成把一组数据从小到大排列,分成100等份,等份,各等份含各等份含1%的观察值,处在分割界线的观察值,处在分割界线上的数值,就是百分位数,上的数值,就是百分位数,Pr 表示。表示。百分位数将总体或样本的全
13、部观察值百分位数将总体或样本的全部观察值分为两部分,理论上有分为两部分,理论上有r%的观察值的观察值比它小,有(比它小,有(100-r)%的观察值比的观察值比它大。它大。如含量为如含量为n的样本,的样本,P5即表示:理论上即表示:理论上有有n5%个观察值比个观察值比P5小,有小,有n95%个个观察值比观察值比P5大。大。常用的百分位数:常用的百分位数:5,25,75,95 分分位数。位数。百分位数频数表法计算:百分位数频数表法计算:Pr:百分位数;百分位数;L:该百分位数所在组段的下限;该百分位数所在组段的下限;W:组距;组距;f:该百分位数所在组段的频数;该百分位数所在组段的频数;C:小于小
14、于L的各组段的累积频数;的各组段的累积频数;n:样本数样本数中位数是特殊的百分位数。中位数是特殊的百分位数。图解法计算百分位数图解法计算百分位数也可用图解法也可用图解法:横轴横轴:变量值变量值;纵轴纵轴:累计百分数累计百分数 p25p25 百分位数常用于描述一组资料在某百分百分位数常用于描述一组资料在某百分位置上的水平和分布特征。多个百分位置上的水平和分布特征。多个百分位数结合使用,可更全面地描述总体位数结合使用,可更全面地描述总体或样本的分布特征,包括位置大小和或样本的分布特征,包括位置大小和变异度。变异度。例题:百分位数的计算,例题:百分位数的计算,P25百分位数常用于确定医学正常值范围百
15、分位数常用于确定医学正常值范围(normal range)。医学正常值范围,不用样本观察值的极医学正常值范围,不用样本观察值的极差,习惯上用包括差,习惯上用包括95%正常人的界值,正常人的界值,百分位数是数列的百分界值。百分位数是数列的百分界值。如:白细胞数的确定,过高,过低都属如:白细胞数的确定,过高,过低都属异常,故计算异常,故计算P2.5,P97.5,为双侧的正常为双侧的正常值范围。值范围。如:肺活量如:肺活量95%正常值范围,只有过正常值范围,只有过低算异常,故计算低算异常,故计算P5.如:尿铅如:尿铅,过高为异常,故计算过高为异常,故计算P95.一般地说,分布中部的百分位数相当稳一般
16、地说,分布中部的百分位数相当稳定,具有较好代表性,靠近两端的百分定,具有较好代表性,靠近两端的百分位数,只在样本含量足够大时,才稳定,位数,只在样本含量足够大时,才稳定,故样本量不够大时,不应取太近两端的故样本量不够大时,不应取太近两端的百分位数。百分位数。以上是集中趋势指标。以上是集中趋势指标。脑筋急转弯:脑筋急转弯:请看下面数据,有问题吗?请看下面数据,有问题吗?A:8 9 10 11 12B:3 7 10 13 17 两组均数都为两组均数都为1010,但离散程度不同,但离散程度不同,B B组组较大。较大。均数只反映平均水平,不能反映离散度。均数只反映平均水平,不能反映离散度。离散趋势离散
17、趋势tendency of dispersion全距,四分位数间距,方差,标准差,全距,四分位数间距,方差,标准差,变异系数。变异系数。全距(全距(Range):极大与极小值之差。全极大与极小值之差。全距大,资料离散程度大,但易受极端距大,资料离散程度大,但易受极端值大小的影响。样本量越大,抽到极值大小的影响。样本量越大,抽到极端值的可能性越大,全距可能会越大。端值的可能性越大,全距可能会越大。故:全距不宜单独使用。故:全距不宜单独使用。四分位数间距(四分位数间距(quartile interval Q):将一组资料分为四等份,上四分位数将一组资料分为四等份,上四分位数P75和下四分位数和下四
18、分位数P25之差,叫四分位数间距。之差,叫四分位数间距。意义:意义:Q越大,离散程度越大,通常用于越大,离散程度越大,通常用于描述偏态分布资料的离散程度。描述偏态分布资料的离散程度。优点:比全距稳定;若资料一端或两端优点:比全距稳定;若资料一端或两端无确切数值,只能选择无确切数值,只能选择Q作为离散指标。作为离散指标。缺点:未考虑全部观察值,不能全面反缺点:未考虑全部观察值,不能全面反映资料离散趋势。映资料离散趋势。方差(方差(variance)和标准差和标准差(standard deviation SD)对总体而言,为了克服极差和四分位数间对总体而言,为了克服极差和四分位数间距的缺点,要描述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 平均数 标准差 课件
限制150内