正态分布及参考值范围估课件.ppt
吴成秋吴成秋公共卫生学院卫生学教研室公共卫生学院卫生学教研室正态分布与参考值范围估计正态分布与参考值范围估计Normal distribution and estimation of reference range(2 2 学时)学时)正态分布的概念正态分布的概念:资料的频数分布曲线略呈钟型,两头低,资料的频数分布曲线略呈钟型,两头低,中间高,左右完全对称,并永远不与横轴相交中间高,左右完全对称,并永远不与横轴相交的曲线,该曲线称为正态分布曲线。该资料称的曲线,该曲线称为正态分布曲线。该资料称为正态分布资料。这种分布称为正态分布,又为正态分布资料。这种分布称为正态分布,又称称Gauss分布分布(Gaussian distribution).由于频数的总和等于由于频数的总和等于100%或或1,故横轴上曲线,故横轴上曲线下的面积等于下的面积等于100%或或1。x x fffu 0F(x)(u)(u)f(x)f(x)u=x-u=x-x s 一般正态分布一般正态分布N(N(,2 2)标准正态分布标准正态分布N(0,1)N(0,1)大样本资料大样本资料正态分布函数正态分布函数(密度函数密度函数)f(x)=1 e-(x-)2/2 2 -x+(u)=1 e-u2/2 -u1.96)=2 (-1.96)=0.05 P(u 2.58)=(+2.58)-(-2.58)=0.99 P(u1.645)=(-1.645)=0.05 P(u1)=(-1)=0.1587求求两个变量值之间的面积,即概率两个变量值之间的面积,即概率(由由x x求求 u u及及P)P)例:随机抽取某地例:随机抽取某地120120名成年男子,测红名成年男子,测红细胞计数,得细胞计数,得 X X=4.7168(1012/L),S=0.5665(1012/L)。求红细胞计数在求红细胞计数在4 45(5(10101212/L)L)之间的人数及所占比例。之间的人数及所占比例。解:已知解:已知 X X=4.7168,S=0.5665 =4.7168,S=0.5665 X=4X=4时,时,u=(x-u=(x-x)/s=(4-4.7168)/0.5665=-1.265x)/s=(4-4.7168)/0.5665=-1.265X=5X=5时,时,u=(x-u=(x-x)/s=(5-4.7168)/0.5665=0.500 x)/s=(5-4.7168)/0.5665=0.500P=P=(0.5)-(0.5)-(-1.265)=(1-0.3085)-0.1029=0.5886(-1.265)=(1-0.3085)-0.1029=0.5886人数:人数:1201200.5886=71 0.5886=71 人人 (实际人数为实际人数为7070人人)例:为了解某地低体重儿的出生概率,某医例:为了解某地低体重儿的出生概率,某医师从该地随机抽取师从该地随机抽取100100名新生儿,测定他们的名新生儿,测定他们的平均体重为平均体重为34003400g g,标准差为标准差为900900g g。求:求:该地低体重儿的出生概率该地低体重儿的出生概率 分别求分别求 x1s,x1s,x1.96s,x1.96s,x2.58sx2.58s范围范围内的新生儿占该地总出生新生儿数的百分比内的新生儿占该地总出生新生儿数的百分比。解:已知解:已知 X X=3400,S=900=3400,S=900(低体重儿是指出生体重低体重儿是指出生体重25002500g)g)u=(x-u=(x-x)/S=(2500-3400)/900=-1)/S=(2500-3400)/900=-1P=P=(-1)=0.1587(-1)=0.1587该地低体重儿的出生概率为该地低体重儿的出生概率为0.15870.15872500 3400求某部分面积所对应的变量值求某部分面积所对应的变量值(由由P求求u及及x)-u 0 +u-u 0/2 /2在正态分布曲线下,当双侧或单侧的尾部面积为指在正态分布曲线下,当双侧或单侧的尾部面积为指定值定值 时,横轴上相对的时,横轴上相对的 u值称值称u界值,记为界值,记为 u 。有有单侧和双侧之分。即单侧和双侧之分。即P(uu)=。-u 0 +u-u 0/2 /2 常用的常用的u u 值值 u 单侧单侧 双侧双侧 u0.1 1.282 1.645 u0.05 1.645 1.96 u0.01 2.33 2.58 120120名成年男子名成年男子RBCRBC的实际分布与理论分布比较的实际分布与理论分布比较 x RBC 范围范围 实际分布实际分布 理论分布理论分布 人数人数%x1.00s 4.155.28 83 69.17 68.27 x1.96s 3.615.83 114 95.00 95.00 x2.58s 3.266.18 120 100.00 99.00 从上表可以看出,从上表可以看出,120120名成年男子的实际分布与理名成年男子的实际分布与理论分布的百分数很接近,说明该论分布的百分数很接近,说明该120120名成年男子的名成年男子的RBCRBC分分布接近正态分布。实际分布与理论分布的百分数越接近,布接近正态分布。实际分布与理论分布的百分数越接近,资料越近似正态分布。资料越近似正态分布。参考值范围估计参考值范围估计参考值范围参考值范围(rang of reference value)的概念的概念:医学参考值是指正常人的各种生理、生医学参考值是指正常人的各种生理、生化数据,组织或排泄物中各种成分的含量。化数据,组织或排泄物中各种成分的含量。由于同质观察单位某项测定指标在一定范围由于同质观察单位某项测定指标在一定范围内波动。内波动。正常人的这些指标值的波动范围,正常人的这些指标值的波动范围,称为参考值范围;也称正常值范围称为参考值范围;也称正常值范围(range of normal value).前者较合理。前者较合理。参考值范围估计的一般原则与步骤参考值范围估计的一般原则与步骤1.1.确定研究总体,保证研究对象的同质性。确定研究总体,保证研究对象的同质性。2.2.确定样本含量,一般确定样本含量,一般 n100.n100.3.3.确定单侧或双侧确定单侧或双侧(根据专业知识确定根据专业知识确定)。4.4.确定适当百分范围确定适当百分范围(1-(1-)。常取。常取95%95%,99%99%,80%80%,90%90%等。等。5.5.选定适当的统计方法选定适当的统计方法正态分布法:适用于正态分布资料正态分布法:适用于正态分布资料百分位数法:适用于偏态分布资料百分位数法:适用于偏态分布资料参考值范围的估计方法参考值范围的估计方法1.正态分布法正态分布法(适于正态分布资料适于正态分布资料)(1-)的参考值范围:的参考值范围:双侧双侧 xu s 单侧单侧(x-u s)双侧双侧95%参考值范围参考值范围:x1.96s 单侧单侧95%参考值范围:参考值范围:x-1.64s2.百分位数法百分位数法(适于非正态分布资料适于非正态分布资料)(1-)的参考值范围:的参考值范围:双侧双侧 P/2100P(1-/2)100 单侧单侧 P 100 双侧双侧95%参考值范围参考值范围:P2.5P97.5 单侧单侧95%参考值范围:参考值范围:P53.对数正态分布法对数正态分布法(适于对数正态分布资料适于对数正态分布资料)(1-)的参考值范围:的参考值范围:双侧双侧 :lg-1(xlgxu slgx)单侧单侧:lg-1(xlgx-u slgx)例例1:某地调查正常成年男子:某地调查正常成年男子144人的红细人的红细胞数,均数为胞数,均数为5.381012/L,标准差为标准差为0.44 1012/L。适适估计该地成年男子红细胞数的估计该地成年男子红细胞数的95%参考值范围。参考值范围。双侧双侧95%参考值范围参考值范围:x1.96s =5.381.960.44=(4.526.24)1012/L例例2:某市:某市1974年为了解该地居民发汞的年为了解该地居民发汞的基础水平,调查了留住该市一年以上,基础水平,调查了留住该市一年以上,无汞作业接触史的健康居民无汞作业接触史的健康居民238人的发汞人的发汞含量如下表,试估计该市居民发汞值的含量如下表,试估计该市居民发汞值的95%参考值范围。参考值范围。发汞值的分布为偏态分布,过高为不正发汞值的分布为偏态分布,过高为不正常,故求单侧常,故求单侧95%的上限,用百分位数的上限,用百分位数法,即求法,即求P95 某市某市238名健康人发汞含量名健康人发汞含量发汞发汞值值(g/g)人数人数累积频数累积频数累积频率累积频率(%)0.3-0.7-1.1-1.5-1.9-2.3-2.7-3.1-3.5-3.9-4.3 20 66 60 48 18 16 6 1 0 3 20 86146194212228234235235238 8.40 36.13 61.34 81.51 89.08 95.80 98.32 98.74 98.74100.00 合计合计238100.00Px=L+i (nx%-fL)P95=2.3+0.4(23895%-212)=2.65该市健康居民发汞值得该市健康居民发汞值得95%参考值范围应参考值范围应小于小于2.65 g/g fm16正常人正常人病人病人误诊误诊漏诊漏诊可可根据实际需要调整根据实际需要调整1-的大小的大小 敏感性(Se)就是真阳性率,试验的特异性(Sp)就是真阴性率 从临床角度考虑,(1-Se)就是漏诊率,(1-Sp)就是误诊率