《3-常用概率分布.ppt》由会员分享,可在线阅读,更多相关《3-常用概率分布.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、常用概率分布掌握:掌握:三个常用概率分布的概念;二项分布及Poisson分布的概率函数与累计概率、正态分布的分布函数的计算方法;医学参考值的计算熟悉:熟悉:三个常用概率分布的特征了解:了解:质量控制的意义、原理及方法教学要求教学要求一、二项分布一、二项分布 二、二、PoissonPoisson分布分布三、正态分布三、正态分布 常见随机变量的分布:常见随机变量的分布:连续型变量连续型变量离散型变量离散型变量第一节 二项分布及其应用1.1 1.1 二项分布的概念和函数二项分布的概念和函数1.2 1.2 二项分布的特征二项分布的特征1.31.3 二项分布的应用二项分布的应用一、二项分布的概念 和概率
2、函数摸摸 球球 模模 型型 一个袋子里有一个袋子里有5个乒乓球,其中个乒乓球,其中2个黄球、个黄球、3个白球,个白球,我们进行摸球游戏,每次摸我们进行摸球游戏,每次摸1球,放回后再摸。先后球,放回后再摸。先后摸摸100次,请问:次,请问:摸到摸到0次黄球的概率是多大?次黄球的概率是多大?解:解:每次摸到白球的概率每次摸到白球的概率 =0.6=0.6 第第1 1次摸到白球的概率次摸到白球的概率=0.6=0.6第第2 2次摸到白球的概率次摸到白球的概率=0.6=0.6第第100100次摸到白球的概率次摸到白球的概率=0.6=0.6 100次摸到次摸到0次黄球的概率次黄球的概率=0.60.60.6=
3、0.6100 先后先后摸摸100次,摸到次,摸到3次黄球的概率是多大?次黄球的概率是多大?解:解:每次摸到黄球的概率每次摸到黄球的概率 =0.4=0.4黄黄白白黄黄白白黄黄白白白白白白概率概率=(0.4)=(0.4)3 3(0.6)(0.6)9797 100次摸到次摸到3次黄球的概率次黄球的概率 =(0.4)3(0.6)97+(0.4)3(0.6)97+(0.4)3(0.6)97+=C1003(0.4)3(0.6)97每次摸到白球的概率每次摸到白球的概率 =0.6=0.6黄黄黄黄黄黄白白白白白白白白白白黄黄白白黄黄黄黄白白白白白白白白概率概率=(0.4)=(0.4)3 3(0.6)(0.6)9
4、797概率概率=(0.4)=(0.4)3 3(0.6)(0.6)9797 先后先后摸摸100次,摸到次,摸到x次黄球的概率是多大?次黄球的概率是多大?解:解:100次摸到次摸到x次黄球的概率次黄球的概率=C100 x(0.4)x(0.6)100-x100次摸到次摸到3次黄球的概率次黄球的概率=C1003(0.4)3(0.6)97 先后摸先后摸n次,摸到次,摸到x次黄球的概率是多大?次黄球的概率是多大?n次摸到次摸到x次黄球的概率次黄球的概率=Cnx(0.4)x(0.6)n-x解:解:如果摸到黄球的概率不是如果摸到黄球的概率不是0.4,而是,而是,先后先后摸摸n次,摸到次,摸到x次黄球的概率是多
5、大?次黄球的概率是多大?n次摸到次摸到x次黄球的概率次黄球的概率=Cnx()x(1-)n-x解:解:小结:小结:摸球模型摸球模型二分类:每次摸球都有两种可能的结果(黄球二分类:每次摸球都有两种可能的结果(黄球或白球)或白球)独立:每次摸球都是彼此独立的独立:每次摸球都是彼此独立的重复:每次摸到黄球的概率都是重复:每次摸到黄球的概率都是、摸到白球摸到白球的概率都是的概率都是1-所以,先后摸所以,先后摸n次,摸到次,摸到x次黄球的概率为:次黄球的概率为:n次摸到次摸到x次黄球的概率次黄球的概率=Cnx()x(1-)n-x 在在医医学学研研究究中中,许许多多观观察察或或试试验验的的可可能能结结果果可
6、可以以归归结结为为二二个个相相互互排排斥斥的的结结果果。如如检检查查的的结结果果为为“阳阳性性”或或”阴阴性性”,治治疗疗结结果果可可分分为为“有有效效”或或“无无效效”,也也可可为为“生生存存”或或“死死亡亡”等等。二项分布的二项分布的概念概念:如如果果每每个个观观察察对对象象阳阳性性结结果果的的发发生生概概率率均均为为,阴阴性性结结果果的的发发生生概概率率均均为为(1-);而而且且每每个个观观察察对对象象的的结结果果是是相相互互独独立立的的,那那么么,重重复复观观察察n个个人人,发发生生阳阳性性结结果果的人数的人数X的概率分布为的概率分布为二项分布二项分布,记作:,记作:B(n,)。P(x
7、)=Cnx()x(1-)n-xCnx=n!x!(n-x)!其中:其中:一般地,若随机变量取值一般地,若随机变量取值x的概率为:的概率为:(x 取值取值0、1、2、n)二项分布的二项分布的密度函数密度函数:举举 例:例:临床上用针炙治疗某型头痛,有效的概率为临床上用针炙治疗某型头痛,有效的概率为60%;现以该法治疗患者;现以该法治疗患者3例,其中例,其中0例、例、1例、例、2例、例、3例有效的概率各是多大?例有效的概率各是多大?解:解:有效人数有效人数(x)C3x x(1-)n-x出现该结果概率出现该结果概率P(x)010.600.430.064130.610.420.288230.620.41
8、0.432310.630.400.216P(x)=Cnx()x(1-)n-x 二、二项分布的特征P(x)=Cnx()x(1-)n-x 1.二项分布的图形特征二项分布的图形特征:独立、重复实验的次数独立、重复实验的次数某研究事件发生的概率某研究事件发生的概率 和和n 是二项分布的是二项分布的两个参数两个参数,n决定决定x的取的取值范围,值范围,n 和和 决定了决定了x的概率分布。的概率分布。=0.5时,不同时,不同n值对应的二项分布值对应的二项分布 n=30,=0.3n=20,=0.5n=10,=0.3n=5,=0.3=0.3时,不同时,不同n值对应的二项分布值对应的二项分布二项分布图的形态取决
9、于二项分布图的形态取决于和和n,高峰在高峰在=n处处当当=0.5,图形是对称的;,图形是对称的;当当0.5,图形不对称;,图形不对称;离离0.5愈远,对称性愈愈远,对称性愈差,但随着差,但随着n的增大,分布趋向于对称。的增大,分布趋向于对称。当当n时,只要时,只要不太靠近不太靠近0或或1(特别是特别是 n 和和 n(1-)都大于都大于5时时),二项分布接近于正态分,二项分布接近于正态分布。布。对对于于二二分分类类情情况况,进进行行n次次试试验验,每每次次试试验验出出现现阳阳性性结结果果的的概概率率均均为为,出出现现阳阳性性结结果果的的次次数数为为x,则则X的的总总体体均均数数、方方 差差2及及
10、标标准准差差分分别别为为:总体方差:总体方差:2=n(1-)2.二项分布的均数和标准差:二项分布的均数和标准差:总体均数:总体均数:=n总体标准差:总体标准差:=n(1-)对于二分类情况,进行对于二分类情况,进行n次随机试验,每次试次随机试验,每次试验出现阳性结果的概率为验出现阳性结果的概率为,则出现阳性结果,则出现阳性结果x的的概率概率P、概率概率P的均数的均数P,概率概率P的方差的方差P2及及概率概率P的标准差的标准差P为:为:概率概率P的均数:的均数:P=概率:概率:P=xn概率概率P的方差:的方差:P2=(1-)n概率概率P的标准差:的标准差:p=(1-)n三、二项分布的应用二项分布的
11、应用:二项分布的应用:概率估计概率估计:举例举例:如果某地钩虫感染率是如果某地钩虫感染率是13%13%,随机观察当地,随机观察当地150150人,其中人,其中1010人感染钩虫的概率有多大?人感染钩虫的概率有多大?解析解析:二分类(感染、不感染)二分类(感染、不感染)独立(假定互不影响)独立(假定互不影响)重复(重复(n=150),每人感染钩虫机率均为),每人感染钩虫机率均为=0.13故:故:感染钩虫的人数感染钩虫的人数x符合二项分布符合二项分布B(150,0.13)所以:所以:P(x=10)=C15010 0.13100.87140=0.0055单侧累积概率的计算:单侧累积概率的计算:单纯计
12、算二项分布单纯计算二项分布x恰好取某值的概率恰好取某值的概率没有太大意义没有太大意义经常需要计算的是二项分布的经常需要计算的是二项分布的累积概率累积概率P(xk)=Cnx()x(1-)n-x nx=kP(xk)=Cnx()x(1-)n-x kx=0(1)出现阳性次数至多为)出现阳性次数至多为k次的概率为:次的概率为:(2)出现阳性次数至少为)出现阳性次数至少为k次的概率为:次的概率为:举例举例:某地钩虫感染率是某地钩虫感染率是13%13%,随机观察当地,随机观察当地150150人。人。(1 1)其中最多有)其中最多有2 2人感染的概率有多大?人感染的概率有多大?解解:P(x2)=C150 x
13、0.13x(0.97)150-x 2x=0=C1500 0.130 0.97150+C1501 0.131 0.97149+C1502 0.132 0.97148=2.31 10-7(2 2)其中最少有)其中最少有2 2人感染的概率有多大?人感染的概率有多大?P(x 2)=C150 x 0.13x(0.97)150-x 150 x=2=1-(C1500 0.130 0.97150+C1501 0.131 0.97149)1解解:(3 3)其中最少有)其中最少有2020人感染的概率有多大?人感染的概率有多大?150 x=20P(x 20)=C150 x 0.13x(0.97)150-x=0.48
14、79=1-C150 x 0.13x(0.97)150-x 190解解:第二节 Poission分布及其应用1.1 Poission 1.1 Poission 分布的概念和函数分布的概念和函数1.2 1.2 Poission Poission 分布的特征分布的特征1.31.3 Poission Poission 分布的应用分布的应用一、Poission分布的概念 和概率函数Poission分布分布的概念的概念:Poisson分布分布是描述罕见事件发生次数的概率分布。是描述罕见事件发生次数的概率分布。如:出生缺陷、多胞胎、染色体异如:出生缺陷、多胞胎、染色体异常、常、细菌在单位面积的分布细菌在单位
15、面积的分布等。等。Poisson分布可看作是二项分布的特例:分布可看作是二项分布的特例:独立重复的次数很大很大独立重复的次数很大很大 每次出现某事件的概率每次出现某事件的概率,或未出现,或未出现某事件的概率某事件的概率1-很小很小,接近于很小很小,接近于0或或1(如(如0.001或或0.999)。)。举例:举例:1毫升水样品中大肠杆菌数目毫升水样品中大肠杆菌数目X的分布的分布:将将1毫升水等分为毫升水等分为n个微小体积,这里个微小体积,这里n很大很大很大很大;每每1个微小体积中大肠杆菌是否出现,相互独立;个微小体积中大肠杆菌是否出现,相互独立;第第1个微小体积中大肠杆菌出现的概率都是个微小体积
16、中大肠杆菌出现的概率都是,且很小很小,且很小很小想象:想象:每毫升水中大肠杆菌数目每毫升水中大肠杆菌数目X服从服从Poission分布分布例:放射性物质一定时间内放射出质点数的分布例:放射性物质一定时间内放射出质点数的分布时间时间“n 很大、独立、概率都是 且很小”的二项分布 -Poisson分布 注意:注意:举举若若n次观察互不独立次观察互不独立,或,或发生的概率发生的概率不等不等,则不能看作是则不能看作是Poission分布。分布。举例:举例:传染性疾病的流行模型:首例病例出现后,便成为传染性疾病的流行模型:首例病例出现后,便成为传染原,可增加后继病例出现的概率。传染原,可增加后继病例出现
17、的概率。污染牛奶细胞的播布:成集落存在及繁殖。污染牛奶细胞的播布:成集落存在及繁殖。钉螺在繁殖期一窝一窝的散布钉螺在繁殖期一窝一窝的散布这些现象均不能用这些现象均不能用Poission分布这个理论模型处理分布这个理论模型处理Poission分布分布的概念的概念:对二项分布,当对二项分布,当n,n 时,可以证明:时,可以证明:P(x)=Cnx()x(1-)n-x P(x)=e-x X!所以,若随机变量所以,若随机变量X的概率函数为:的概率函数为:P(x)=e-x X!若则称此变量服从若则称此变量服从Poission分布分布,记作,记作P()。三、Possion分布的图形特征P(x)=e-x x!
18、Poission分布的概率函数:分布的概率函数:=n为为Poission分布的总体均数分布的总体均数 是是Poisson分布的分布的总体参数总体参数,也是,也是唯一的参数唯一的参数Poission的概率分布示意图:的概率分布示意图:PoissionPoission分布图形的特征:分布图形的特征:poission分布图的形态取决于分布图的形态取决于 5时为偏峰,时为偏峰,愈小分布愈偏愈小分布愈偏;随着随着 的增大,分布趋向于对称。的增大,分布趋向于对称。总体均数总体均数=总体方差总体方差=;观察结果具有可加性,即:观察结果具有可加性,即:PoissionPoission分布的两个重要特征:分布的
19、两个重要特征:若若X1服从总体均数为服从总体均数为 1的的Poission分布分布,X2服从总体均数为服从总体均数为 2的的Poission分布分布,则则T=X1+X2服从总体均数为服从总体均数为 1+2的的Poission分布。分布。举例:从同一水源独立取水样举例:从同一水源独立取水样5次,进行细胞培养次,进行细胞培养 把把5份水样混合,则合计菌落数也符合份水样混合,则合计菌落数也符合Poission分布,分布,则:则:X1+X2+X3+X4+X5 (1+2+3+4+5)第第1 1样水样的菌落数样水样的菌落数 X1 (1)第第2 2样水样的菌落数样水样的菌落数 X2 (2)第第5 5样水样的
20、菌落数样水样的菌落数 X5 (5)医学研究中常利用其可加性,将小的观察单位合医学研究中常利用其可加性,将小的观察单位合并,来增大发生次数并,来增大发生次数X,以便用后面讲到的正态近似法,以便用后面讲到的正态近似法作出统计推断。作出统计推断。三、Possion分布的应用 概率估计概率估计:举例举例1:若某地新生儿先天性心脏病的发病概率是若某地新生儿先天性心脏病的发病概率是8 8,那么该地,那么该地120120名新生儿中有名新生儿中有4 4人患先天性心脏病人患先天性心脏病的概率是多少?的概率是多少?解析解析:发病、不发病发病、不发病发病概率发病概率8 8,概率很小,概率很小n=120,相对较大,相
21、对较大0 =n=120 8=0.960.964 4!=2.71828-0.96P(4)=e-x X!=0.014故:故:二项分布二项分布PoissionPoission分布分布单侧累积概率的计算:单侧累积概率的计算:(1)稀有事件发生次数至多为)稀有事件发生次数至多为k次的概率为:次的概率为:(2)稀有事件发生次数至少为)稀有事件发生次数至少为k次的概率为:次的概率为:P(xk)=kx=0e-x X!举例举例1:若某地新生儿先天性心脏病的发病概率是若某地新生儿先天性心脏病的发病概率是8 8,那么该地那么该地120120名新生儿中:名新生儿中:(1 1)至多有)至多有4 4人患先天性心脏病的概率
22、是多少?人患先天性心脏病的概率是多少?(2 2)至少有)至少有5 5人患先天性心脏病的概率是多少?人患先天性心脏病的概率是多少?P(xk)=nx=ke-x X!k-1=1-x=0e-x X!举例举例2:实验室显示某实验室显示某100cm100cm2 2的培养皿中平均菌落数为的培养皿中平均菌落数为6 6个,试估计个,试估计(1)(1)该培养皿中菌落数小于该培养皿中菌落数小于3 3的概率,的概率,(2)(2)大于大于1 1个的概率。个的概率。解析解析:菌落长、不长菌落长、不长长概率长概率很小,很小,n很大很大 =n=6故故:二项分布二项分布PoissionPoission分布分布P(x3)=2x=
23、0e-6x6X!=+=0.062e-6060!e-661!1e-662!2(1)P(x1)=nx=2e-6x6X!1=1-x=0e-6x6X!e-6060!e-661!1=1-=0.983(2)练习:如生三胞胎的概率为练习:如生三胞胎的概率为104,求,求105次次分娩中,有分娩中,有0,1,2次生三胞胎的概率。次生三胞胎的概率。解解:第三节 正态分布及其应用一、正态分布的概念 一、正态分布的概念正态分布是自然界最常见的一种分布 测量的误差、人体的尺寸、许多生化指标等等都近似服从正态分布。许多其它分布可用正态分布近似正态分布正态分布(normal distribution)的概念的概念正态分布
24、正态分布德莫佛最早发现了二项概率德莫佛最早发现了二项概率的一个近似公式,这一公式被的一个近似公式,这一公式被认为是正态分布的首次露面。认为是正态分布的首次露面。正态分布在十九世纪前叶由正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯加以推广,所以通常称为高斯分布高斯分布(Gauss distribution)。德莫佛德莫佛高高 斯斯10马克的钱币马克的钱币 【典型案例分析典型案例分析】举例:举例:随机调查某医院随机调查某医院14021402例待分娩孕例待分娩孕妇,测得她们的体重,试述其体重频数分妇,测得她们的体重,试述其体重频数分布的特征。布的特征。表表5-1 某医院某医院1402例分娩
25、孕妇体重频数分布例分娩孕妇体重频数分布 作图作图:以体重测量值为以体重测量值为横轴横轴,以频率与组距的比,以频率与组距的比值为值为纵轴纵轴作出直方图。作出直方图。1.由于该直方图的纵轴由于该直方图的纵轴表示在每个组段内单位表示在每个组段内单位长度所占有的频率,相长度所占有的频率,相当于当于频率密度频率密度,因此将,因此将此图称为此图称为频率密度图频率密度图。图图5-1 体重频率密度图体重频率密度图 2.由由于于频频率率的的总总和和为为100%或或1,所所以以该该曲曲线线下下横横轴轴面面积积为为100%或或1。.。正态曲线正态曲线:高峰位于中间,两侧逐渐下降并完全对称,:高峰位于中间,两侧逐渐下
26、降并完全对称,曲线两端永远不与横轴相交的曲线两端永远不与横轴相交的“钟型钟型”曲线。曲线。正态分布的密度函数正态分布的密度函数f(x),即正态曲线的函数表达式:即正态曲线的函数表达式:总体均数总体均数总体标准差总体标准差(一)正态分布的两个参数:(一)正态分布的两个参数:和和 是正态分布的是正态分布的两个参数两个参数,和和决定了决定了x的概率分布;习惯上用的概率分布;习惯上用 N(,2)表示均数为表示均数为,标,标准差为准差为的正态分布。的正态分布。(二)(二)正态分布图形的特征正态分布图形的特征:1.关于关于x=对称对称2.正态曲线在横轴上方,正态曲线在横轴上方,当当x=时时,f(x)取最大
27、值,即均取最大值,即均数位于曲线的最高处数位于曲线的最高处,在在 x=处有拐点处有拐点3.曲线下的面积为曲线下的面积为1。4.是正态曲线的位置参数,决定曲线在横轴上的位置;是正态曲线的位置参数,决定曲线在横轴上的位置;增大曲线沿横轴向右移,增大曲线沿横轴向右移,减小曲线沿横轴向左移。减小曲线沿横轴向左移。5.是正态曲线的形状参数,是正态曲线的形状参数,越大数据越分散,曲线越越大数据越分散,曲线越“矮胖矮胖”,越小数据越集中,曲线越越小数据越集中,曲线越“瘦高瘦高”。当当固定不变时,固定不变时,越大,曲线沿横轴越大,曲线沿横轴越向右移动;反之,越向右移动;反之,越小,则曲线沿横轴越向左移越小,则
28、曲线沿横轴越向左移动,所以动,所以叫正态曲线叫正态曲线N(,2)的)的位置参数位置参数,。1.位置参数:位置参数:图图5-4 正态分布位置随参数正态分布位置随参数变换示意图变换示意图2.形状参数形状参数:当当固定不变时,固定不变时,越大,曲线越平阔;越大,曲线越平阔;越小,曲线越尖峭,越小,曲线越尖峭,叫叫正态曲线正态曲线N(,2)的)的形形状参数状参数。医学研究中许多正常人的生理,生化指标等多医学研究中许多正常人的生理,生化指标等多呈正态分布或近似正态分布。呈正态分布或近似正态分布。一般来说,若影响某一数量指标的随机因素很一般来说,若影响某一数量指标的随机因素很多,而每个因素所起的作用均不太
29、大,那么这多,而每个因素所起的作用均不太大,那么这个指标服从正态分布,如实验中的随机误差,个指标服从正态分布,如实验中的随机误差,通常表现为正态分布。通常表现为正态分布。二、正态曲线下的面积1.一个共同的规律一个共同的规律 正态分布性质决定的正态分布性质决定的 2.Z变换与标准正态分布变换与标准正态分布对于任何一个服从正态分布的随机变量,可作如下对于任何一个服从正态分布的随机变量,可作如下标准化变换,也称标准化变换,也称Z变换,变换,把把z代入概率密度函数代入概率密度函数,得标准正态分布的概率密,得标准正态分布的概率密度函数:度函数:变换后的变换后的Z值仍然服从正态分布,称为为标准正态分布值仍
30、然服从正态分布,称为为标准正态分布 N(0,1)。)。统计学家编制了标准曲线下面积分布表,因为两边统计学家编制了标准曲线下面积分布表,因为两边对称,只给出对称,只给出Z取负值的情况。取负值的情况。(Z)称为标准正态分布的分布函数。)称为标准正态分布的分布函数。任意正态分布曲线任意正态分布曲线 XN(,2)标准正态分布曲线标准正态分布曲线XN(0,1)可见,任一正态分布曲线下的面积分布规律可通过可见,任一正态分布曲线下的面积分布规律可通过Z变换后,与标准正态分布曲线下面积对应变换后,与标准正态分布曲线下面积对应1.左半侧左半侧Z值对应面积的查法:值对应面积的查法:正态曲线下面积对称,则区间(正态
31、曲线下面积对称,则区间(1.96,)的面积也是)的面积也是0.025。Z取值于(取值于(-1.96,1.96)的概率为)的概率为1-20.025=0.95,即,即X取值在区间取值在区间 上的概率为上的概率为95%。同理,同理,X取值在区间取值在区间 的概率为的概率为99%。例例 4-10 X服从均数为服从均数为 ,标准差为,标准差为 的正态的正态分布,试估计分布,试估计(1)X取值在区间取值在区间 上的概率;上的概率;(2)X取值在区间取值在区间 上的概率;上的概率;先做标准化变化:例例 4-11 已知某地已知某地1986年年120名名8岁男童身高均数岁男童身高均数 ,S=4.79 cm ,估
32、计,估计(1)该地该地8岁男孩身高在岁男孩身高在130 cm以上者占该地以上者占该地8岁男孩总数的百分比;岁男孩总数的百分比;(2)身高界于身高界于120cm128cm者占该地者占该地8岁岁男孩总数的比例;男孩总数的比例;(3)该地该地80%男孩身高集中在哪个范围?男孩身高集中在哪个范围?先做标准化变化先做标准化变化:理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的7.21%。(2)计算身高在120-128cm者占该地8岁男孩总数的百分比:(3)欲求该地)欲求该地80%的的8岁男孩身高集中岁男孩身高集中 在哪个范围:在哪个范围:查附表查附表1,标准正态分布曲线下左侧面积为,标准正
33、态分布曲线下左侧面积为0.10所对应所对应的的Z值为值为-1.28,所以,所以80%的的8岁男孩身高值集中在岁男孩身高值集中在 区间内,即区间内,即116.9cm129.2cm(1)曲线下横轴上的总面积为)曲线下横轴上的总面积为100%(2)表中曲线下面积为)表中曲线下面积为(-,0)(3)标准正态曲线下的面积以)标准正态曲线下的面积以0为对称,即为对称,即如区间如区间(-,-1.96)与区间与区间(1.96,+)的面积相等。的面积相等。小结小结:F(F(u)=1-F(-)=1-F(-u)对标准正态分布曲线对标准正态分布曲线三、正态分布在医学中的应用(一)制定医学参考值范围(一)制定医学参考值
34、范围v参考值范围:指特定的参考值范围:指特定的“正常正常”人群的解剖、生理、生化指人群的解剖、生理、生化指标及组织代谢产物含量等数据大多数个体的取值所在的范围。标及组织代谢产物含量等数据大多数个体的取值所在的范围。v制定参考值范围的步骤:制定参考值范围的步骤:1.选择足够数量的正常人作为调查对象。选择足够数量的正常人作为调查对象。2.样本含量足够大。样本含量足够大。3.确定取单侧还是取双侧正常值范围。确定取单侧还是取双侧正常值范围。4.选择适当的百分界限。选择适当的百分界限。5.选择适当的方法。选择适当的方法。以不同的方法计算参考值范围:以不同的方法计算参考值范围:(2)正态分布法:正态分布法
35、:适用于正态或近似正态分布资料适用于正态或近似正态分布资料表表 常用参考值范围的制定常用参考值范围的制定 举例举例1:某地调查某地调查120名健康女性血红蛋白,直方图显示,其分名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为布近似于正态分布,得均数为117.4g/L,标准差为,标准差为10.2g/L,试,试估计该地正常女性血红蛋白的估计该地正常女性血红蛋白的95%医学参考值范围。医学参考值范围。解析解析:1.分布近似正态分布近似正态2.过高过低均为异常过高过低均为异常3.求上、下界值求上、下界值正态分布法求参考值范围正态分布法求参考值范围设定双侧界值设定双侧界值上界:上界:下界:
36、下界:所以,该地健康女性血红蛋白的所以,该地健康女性血红蛋白的95%参考值范围是参考值范围是(97.41,137.39)g/l。举例举例2:某地调查某地调查120名健康成年男性的第一秒肺通名健康成年男性的第一秒肺通气量得均数气量得均数 X=4.2(L),标准差标准差S=0.7(L),试据此估,试据此估计其第一秒肺通气量的计其第一秒肺通气量的95%参考值范围。参考值范围。解析解析:1.分布近似正态分布近似正态2.仅过低为异常仅过低为异常3.求下界值求下界值正态分布法求参考值范围正态分布法求参考值范围单侧下限单侧下限下界:下界:所以,该地健康成年男子第一秒肺通气量的所以,该地健康成年男子第一秒肺通
37、气量的95%参参考值范围为不低于考值范围为不低于3.05(L)。)。注意注意:1、95%医学参考值范围仅仅告诉我们某特医学参考值范围仅仅告诉我们某特定人群中,定人群中,95%的个体指标测定值在此范的个体指标测定值在此范围内,并不能说明凡在此范围内都围内,并不能说明凡在此范围内都“正常正常”。在临床上只能作为参考。在临床上只能作为参考。2、确定参考值范围必须有足够的样本,并、确定参考值范围必须有足够的样本,并判定是否分层确定参考值。判定是否分层确定参考值。(二)进行质量控制(二)进行质量控制 基本原理基本原理:许多临床检验指标,当影响某一:许多临床检验指标,当影响某一指标的随机因素很多,而每个因
38、素所起的作用均指标的随机因素很多,而每个因素所起的作用均不太大时,这个指标的不太大时,这个指标的随机波动随机波动属于属于随机误差随机误差,则往往服从则往往服从正态分布正态分布。若存在系统性误差,这是。若存在系统性误差,这是指标波动就不再服从正态分布。指标波动就不再服从正态分布。(三)进行质量控制(三)进行质量控制控制图:如果某一波动由个体差异或随机测量误差所致,则观控制图:如果某一波动由个体差异或随机测量误差所致,则观察结果服从正态分布。察结果服从正态分布。控制方法控制方法:控制图共有:控制图共有7条水平线,中心线均数处,条水平线,中心线均数处,常以常以 X 2s 作为上下警戒值,以作为上下警
39、戒值,以 X 3s作为上下控作为上下控制值。此外还有制值。此外还有2条位于条位于X s 处。处。判断异常的判断异常的8 8种情况是:种情况是:v有一个点距中心线的距离超过有一个点距中心线的距离超过3 3个标准差(个标准差(控制限控制限以外)以外)v在中心线的一侧连续有在中心线的一侧连续有9 9个点个点v连续连续6 6个点稳定地增加或减少个点稳定地增加或减少v连续连续1414个点交替上下个点交替上下v连连续续3 3个个点点中中有有两两个个点点距距中中心心线线距距离离超超过过2 2个个标标准准差差(警警戒戒限限以外)以外)v连续连续5 5个点中有个点中有4 4个点距中心线距离超过个点距中心线距离超
40、过1 1个标准差个标准差v中中心心线线一一侧侧或或两两侧侧连连续续1515个个点点距距中中心心线线距距离离都都超超出出1 1个个标标准准差差以内以内v中中心心线线一一侧侧或或两两侧侧连连续续8 8个个点点距距中中心心线线距距离离都都超超出出1 1个个标标准准差差范围。范围。三、二项分布、三、二项分布、PoissonPoisson分布的的正态近似分布的的正态近似1.1.二项分布的正态近似二项分布的正态近似 二项分布的形状取决于二项分布的形状取决于n,n,,当,当=0.5=0.5时分布对时分布对称,当称,当0.50.5时,分布呈偏态,特别是时,分布呈偏态,特别是n n较小时,较小时,偏离偏离0.5
41、0.5越远,分布的对称性越差,随着越远,分布的对称性越差,随着n n的增大,的增大,分布逐渐趋向于对称。理论上可以证明,不管分布逐渐趋向于对称。理论上可以证明,不管如如何,当何,当n n相当大时,只要相当大时,只要不接近不接近1 1和和0 0时,时,特别是特别是当当n n或或n n(1-1-)都大于)都大于5 5时时,二项分布,二项分布B(X;n,)B(X;n,)近似正态分布近似正态分布N(nN(n,n,n(1-(1-)。二项分布累积概率的正态近似公式为:二项分布累积概率的正态近似公式为:例例4-14 如果某地钩虫感染率为如果某地钩虫感染率为13%,随机观察当地,随机观察当地150人人,其中其
42、中至少至少有有20人感染钩虫的概率有多大人感染钩虫的概率有多大?n=1500.13=19.5n(1-)=150(1-0.13)=130.5至少有至少有20人感染钩虫的概率为人感染钩虫的概率为50%。2.PoissonPoisson分布的正态近似分布的正态近似 PoissonPoisson分布,当总体均数分布,当总体均数 小于小于5 5时,时,越小,越小,分布越呈偏态,随着分布越呈偏态,随着 的增大,分布逐渐趋向的增大,分布逐渐趋向于对称。理论上可以证明,随着于对称。理论上可以证明,随着 PoissonPoisson分布也渐近为正态分布。分布也渐近为正态分布。当当 时,时,PoissonPois
43、son分布资料可按正态分布处理。分布资料可按正态分布处理。PoissonPoisson分布累积概率的正态近似公式为:分布累积概率的正态近似公式为:例例4-15 实验显示某放射性物质实验显示某放射性物质半小时半小时内发出的脉冲内发出的脉冲数服从数服从PoissonPoisson分布,平均为分布,平均为360个,试估计该放射性个,试估计该放射性物质物质半小时半小时内发出的脉冲数大于内发出的脉冲数大于400个的概率。个的概率。试估计该放射性物质半小时内发出的脉冲数大于试估计该放射性物质半小时内发出的脉冲数大于400个的概率为个的概率为1.66%。1.满足(满足()时,二项分布)时,二项分布B(n,)近似正态分布。近似正态分布。A n 和和n(1-)均大于等于均大于等于5 B n 或或n(1-)均大于等于均大于等于5 C n50 D n足够大足够大2.满足(满足()时,)时,Poisson分布分布P()近似正态分布。近似正态分布。A 无限大无限大 B 20 C =1 D =0.53.满足(满足()时,二项分布)时,二项分布B(n,)近似近似Poisson分布。分布。A n 和和n(1-)均大于等于均大于等于5 B n C n很大且很大且接近接近0.5 D n很大且很大且接近接近0THANK YOU!
限制150内