几种常见概率分布律.ppt
关于几种常见的概率关于几种常见的概率分布律分布律第一张,PPT共八十八页,创作于2022年6月第一节 二项分布3.1.1 3.1.1 3.1.1 3.1.1 贝努利试验及二项分布的概率函数贝努利试验及二项分布的概率函数贝努利试验及二项分布的概率函数贝努利试验及二项分布的概率函数 最早被研究的随机试验模型之一,只有两种可能最早被研究的随机试验模型之一,只有两种可能最早被研究的随机试验模型之一,只有两种可能最早被研究的随机试验模型之一,只有两种可能的试验结果。如掷钱币可能正面,也可能反面;抽验的试验结果。如掷钱币可能正面,也可能反面;抽验的试验结果。如掷钱币可能正面,也可能反面;抽验的试验结果。如掷钱币可能正面,也可能反面;抽验一个产品可能合格,也可能不合格等。它概括了最简一个产品可能合格,也可能不合格等。它概括了最简一个产品可能合格,也可能不合格等。它概括了最简一个产品可能合格,也可能不合格等。它概括了最简单、也是最常用的一类随机现象。因瑞士数学家雅科单、也是最常用的一类随机现象。因瑞士数学家雅科单、也是最常用的一类随机现象。因瑞士数学家雅科单、也是最常用的一类随机现象。因瑞士数学家雅科布布布布 贝努利首先研究而得名。贝努利首先研究而得名。贝努利首先研究而得名。贝努利首先研究而得名。第二张,PPT共八十八页,创作于2022年6月 这是一个生产数学家和物理学家的家属这是一个生产数学家和物理学家的家属,Bernoulli一家在欧洲享有盛誉,有一个传说,讲一家在欧洲享有盛誉,有一个传说,讲的是的是Daniel Bernoulli(他是(他是John Bernoulli的儿子)的儿子)有一次正在做穿过欧洲的旅行,他与一个陌生人有一次正在做穿过欧洲的旅行,他与一个陌生人聊天,他很谦虚的自我介绍:聊天,他很谦虚的自我介绍:“我是我是Daniel Bernoulli。”那个人当时就怒了,说:那个人当时就怒了,说:“我是还是我是还是Issac Newton(牛顿)呢。(牛顿)呢。”Daniel从此之后在很从此之后在很多的场合深情的回忆起这一次经历,多的场合深情的回忆起这一次经历,把把它当作自己曾经听过的最衷心的它当作自己曾经听过的最衷心的 赞扬。赞扬。第三张,PPT共八十八页,创作于2022年6月 对于对于n n次独立的试验次独立的试验 ,如果每次试验结,如果每次试验结果出现且只出现对立事件果出现且只出现对立事件A A与与 之一,之一,在在每次试验中出现每次试验中出现A A的概率是常数的概率是常数p p(0(0p p1)1),因而出现对立事件因而出现对立事件 的概率是的概率是1-p=q1-p=q,则,则 称称 这一串重复的独立试验为这一串重复的独立试验为n n重贝努利试验,重贝努利试验,简称贝努利试验简称贝努利试验(Bernoulli trials)(Bernoulli trials)。第四张,PPT共八十八页,创作于2022年6月 贝努里试验具有如下属性n n试验包含了n 个相同的试验n n每次试验只有两个可能的结果,即“成功”和“失败”n n出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p+q=1n n试验是相互独立的n n试验“成功”或“失败”可以计数第五张,PPT共八十八页,创作于2022年6月 在生物学研究中,我们经常碰到的一类离在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵散型随机变量,如入孵n n枚种蛋的出雏数、枚种蛋的出雏数、n n头头病畜治疗后的治愈数、病畜治疗后的治愈数、n n 尾鱼苗的成活数等,尾鱼苗的成活数等,可用贝努利试验来概括。可用贝努利试验来概括。在在n n重贝努利试验中,事件重贝努利试验中,事件 A A 可能发生可能发生0 0,1 1,2 2,n n次,现在我们来求事件次,现在我们来求事件 A A 恰好发恰好发生生k k(0(0k kn n)次的概率次的概率P Pn n n n(k)(k)。先取先取n n=4=4,k k=2=2来讨论。在来讨论。在4 4次试验中,事次试验中,事件件A A发生发生2 2次的方式有以下次的方式有以下 种:种:第六张,PPT共八十八页,创作于2022年6月 其中其中A Ak k k k(k k k k=1,2,3,4)=1,2,3,4)=1,2,3,4)=1,2,3,4)表示事件表示事件表示事件表示事件A A在第在第在第在第k k次试验发生;次试验发生;次试验发生;次试验发生;(k k k k=1,2,3,4)=1,2,3,4)=1,2,3,4)=1,2,3,4)表示事件表示事件表示事件表示事件A A A A在第在第在第在第k k k k次试验不发生。由于试验是独次试验不发生。由于试验是独立的,按立的,按概率的乘法法则概率的乘法法则,于是有,于是有 P P()=P P()=()=P()=P()P P()()P P()()P()=()=又由于以上各种方式中,任何二种方式都是互不相容的,又由于以上各种方式中,任何二种方式都是互不相容的,又由于以上各种方式中,任何二种方式都是互不相容的,又由于以上各种方式中,任何二种方式都是互不相容的,按按按按概率的加法法则概率的加法法则,在,在,在,在4 4 4 4 次试验中,事件次试验中,事件次试验中,事件次试验中,事件A A恰好发生恰好发生2 2次的次的概率为概率为 第七张,PPT共八十八页,创作于2022年6月 P P4 4(2)(2)=P()+()+P P()+()+P P()=()=一般,在一般,在一般,在一般,在n n重贝努利试验中,事件重贝努利试验中,事件重贝努利试验中,事件重贝努利试验中,事件A恰好发生恰好发生k k(0(0k kn)n)次次次次的概率为的概率为的概率为的概率为 K K=0,1,2=0,1,2,n (4-14)(4-14)若把若把(4-14)式与二项展开式式与二项展开式相比较就可以发现,在相比较就可以发现,在相比较就可以发现,在相比较就可以发现,在n n重贝努利试验中,事件重贝努利试验中,事件重贝努利试验中,事件重贝努利试验中,事件A A发生发生k k次的次的次的次的概率恰好等于概率恰好等于概率恰好等于概率恰好等于 展开式中的第展开式中的第展开式中的第展开式中的第k k+1+1项,所以作项,所以作项,所以作项,所以作二项概率函数二项概率函数二项概率函数二项概率函数 。第八张,PPT共八十八页,创作于2022年6月二项分布的意义及性质二项分布的意义及性质 二项分布定义如下:二项分布定义如下:设随机变量设随机变量x所有可能取的值为零和正整数:所有可能取的值为零和正整数:0,1,2,,n,且有,且有 =k=0,1,2,n 其中其中p0,q0,p+q=1,则称则称随机变量随机变量x服服从参数为从参数为n和和p的二项分布的二项分布(binomial distribution),记为记为 xB(n,p)。第九张,PPT共八十八页,创作于2022年6月 二项分布是一种离散型随机变量的概率二项分布是一种离散型随机变量的概率分布。参数分布。参数n n称为离散参数称为离散参数 ,只能取正整数;只能取正整数;p p 是连续参数,它能取是连续参数,它能取0 0与与1 1之间的任何数值之间的任何数值(q q由由p p确定,故不是另一个独立参数确定,故不是另一个独立参数)。容易验证,二项分布具有概率分布的一容易验证,二项分布具有概率分布的一切性质,即:切性质,即:1 1、P(x=k)P(x=k)=P Pn n(k)(k)(k=0,k=0,1 1,,n n)2 2、二项分布的概率之和等于、二项分布的概率之和等于1 1,即,即第十张,PPT共八十八页,创作于2022年6月3、(4-15)4、(4-16)5、(mm1 1mm2 2)(4-17)(4-17)二项分布由二项分布由n和和p两个参数决定:两个参数决定:1、当、当p值较小且值较小且n不大时不大时,分,分 布布 是偏倚的。是偏倚的。但随着但随着n的增大的增大,分布逐渐趋于对称。,分布逐渐趋于对称。第十一张,PPT共八十八页,创作于2022年6月 2、当、当 p 值值 趋趋 于于 0.5 时时,分,分 布布 趋于对称。趋于对称。3、对于固定的、对于固定的n及及p,当,当k增加时,增加时,Pn(k)先先随之增加并达到其极大值,以后又下降。随之增加并达到其极大值,以后又下降。此外此外,在,在n较大,较大,np、nq 较接近时较接近时,二项,二项分布接近于正态分布;当分布接近于正态分布;当n时,二项分布的时,二项分布的极限分布是正态分布。极限分布是正态分布。第十二张,PPT共八十八页,创作于2022年6月二项分布图二项分布图n n当n=20时,不同p值的曲线。第十三张,PPT共八十八页,创作于2022年6月二项分布的概率计算及应用条件二项分布的概率计算及应用条件 【例【例3.1】纯种白猪与纯种黑猪杂交,根据孟纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论德尔遗传理论,子二代中白猪与黑猪的比率为子二代中白猪与黑猪的比率为3 1。求窝产仔。求窝产仔10头,有头,有7头白猪的概率。头白猪的概率。根据题意,根据题意,n=10,p=34=0.75,q=14=0.25。设。设10头仔猪中白色的为头仔猪中白色的为x头,则头,则x为服从为服从二项分布二项分布B(10,0.75)的随机变量。于是窝产的随机变量。于是窝产10头头仔猪中有仔猪中有7头是白色的概率为:头是白色的概率为:第十四张,PPT共八十八页,创作于2022年6月 【例【例3.2】设在家畜中感染某种疾病的概率设在家畜中感染某种疾病的概率为为20,现有两种疫苗,用疫苗,现有两种疫苗,用疫苗A 注射了注射了15头家头家畜后无一感染,用疫苗畜后无一感染,用疫苗B 注射注射 15头家畜后有头家畜后有1头头感染。设各头家畜没有相互传染疾病的可能,感染。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗问:应该如何评价这两种疫苗?假设疫苗假设疫苗A完全无效,那么注射后的家畜感完全无效,那么注射后的家畜感染的概率仍为染的概率仍为20,则,则15 头家畜中染病头数头家畜中染病头数x=0的概率为的概率为 第十五张,PPT共八十八页,创作于2022年6月 同理,如果疫苗同理,如果疫苗B完全无效,则完全无效,则15头家畜中头家畜中最多有最多有1头感染的概率为头感染的概率为 由计算可知由计算可知,注射注射 A 疫苗无效的概率为疫苗无效的概率为0.0352,比,比B疫苗无效的概率疫苗无效的概率0.1671小得多。因此,小得多。因此,可以认为可以认为A疫苗是有效的,但不能认为疫苗是有效的,但不能认为B疫苗也疫苗也是有效的。是有效的。第十六张,PPT共八十八页,创作于2022年6月 【3.3】仔猪黄痢病在常规治疗下死亡率为仔猪黄痢病在常规治疗下死亡率为20,求求5 头病猪治疗后死亡头数各可能值相应的概率。头病猪治疗后死亡头数各可能值相应的概率。设设5头病猪中死亡头数为头病猪中死亡头数为x,则,则x服从二项分布服从二项分布B(5,0.2),其所有可能取值为,其所有可能取值为0,1,5,按,按(4-6)式计算概率,用分布列表示如下:式计算概率,用分布列表示如下:0 1 2 3 4 5 0.3277 0.4096 0.2048 0.0512 0.0064 0.00030.3277 0.4096 0.2048 0.0512 0.0064 0.0003第十七张,PPT共八十八页,创作于2022年6月 大豆子叶颜色由大豆子叶颜色由2 2对隐性重叠基因控制,在其对隐性重叠基因控制,在其F F2 2代黄子叶表现为代黄子叶表现为显性,黄和青以显性,黄和青以3:13:1比例分离。(以二粒荚为例来说明)。比例分离。(以二粒荚为例来说明)。全部可能的结果有四种:全部可能的结果有四种:两粒都是黄的(两粒都是黄的(YYYY)3/43/4=9/163/43/4=9/16 第一次是青的第二次是黄的(第一次是青的第二次是黄的(GYGY)1/43/4=3/161/43/4=3/16 第一次是黄的第二次是青的(第一次是黄的第二次是青的(YGYG)3/41/4=3/163/41/4=3/16 两粒都是青的(两粒都是青的(GGGG)1/41/4=1/161/41/4=1/16假设假设y(y(黄子叶粒数)为变量,黄色子叶的概率为黄子叶粒数)为变量,黄色子叶的概率为0.750.75,青色子叶的概率为,青色子叶的概率为0.250.25。那么其概率分别为(见上面)。那么其概率分别为(见上面)。第十八张,PPT共八十八页,创作于2022年6月 如果一粒豆荚中有三粒种子,那么就有如果一粒豆荚中有三粒种子,那么就有8 8种可能的情况。种可能的情况。全部是青子叶全部是青子叶 (GGGGGG)1/641/64 仅有一粒黄子叶种子(仅有一粒黄子叶种子(GGYGGY、GYGGYG、YGGYGG)9/649/64 具有两粒黄了叶种子(具有两粒黄了叶种子(YYGYYG、YGYYGY、GYYGYY)27/6427/64 全部是黄子叶种子全部是黄子叶种子 (YYYYYY)27/6427/64数学上的组合公式为数学上的组合公式为n n相当于豆荚内种子数,相当于豆荚内种子数,y y相当于黄子叶种子数。因此相当于黄子叶种子数。因此由此可以推知二项分布的概率函数为:由此可以推知二项分布的概率函数为:第十九张,PPT共八十八页,创作于2022年6月某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10头为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头以及全部愈好的概率为多少?按照上面的公式进行计算:7头愈好,3头死去的概率为:8头愈好,2头死去的概率为:9头愈好,1头死去的概率为:10头全部愈好的概率为:第二十张,PPT共八十八页,创作于2022年6月受害株数概率函数P(y)P(y)F(y)nP(y)P(0)0.11600.116046.40P(1)0.31240.4284124.96P(2)0.33640.7648134.56P(3)0.18110.954972.44P(4)0.04880.994719.52P(5)0.00531.00002.12如果每次抽5个单株,抽n=400次,则理论上我们能够得到y=2的次数应为:理论次数=400P(2)=4000.3364=134.56(次)对于任意y,其理论次数为:理论次数=nP(y)。第二十一张,PPT共八十八页,创作于2022年6月第二十二张,PPT共八十八页,创作于2022年6月 二项分布的应用条件有三:二项分布的应用条件有三:(1)各观察单位)各观察单位 只具有互相对立只具有互相对立 的一种结果,的一种结果,如阳性或阴性,如阳性或阴性,生存或死亡等,生存或死亡等,属于二项分类属于二项分类资料;资料;(2)已知发生某一结果)已知发生某一结果(如死亡如死亡)的概率为的概率为p,其对立结果的概率则为其对立结果的概率则为1-P=q,实际中要求,实际中要求p 是从是从大量观察中获得的比较稳定的数值;大量观察中获得的比较稳定的数值;(3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位个观察单位的观察结果不会影响到其它观察单位的观察结果。的观察结果。第二十三张,PPT共八十八页,创作于2022年6月三、二项式分布的形状和参数三、二项式分布的形状和参数 对于一个二项式总体,如果对于一个二项式总体,如果p=qp=q,二项式分布呈,二项式分布呈对称形状,如果对称形状,如果p p q,二项式分布则表现偏斜形状。但如果n时,即使时,即使p pq q,二项式总体分布的情况也,二项式总体分布的情况也趋于对称形状,所以二项分布的形状是由趋于对称形状,所以二项分布的形状是由n n和和p p两个参两个参数决定的。数决定的。二项总体的平均数、方差、方差 2 2和标准差和标准差 的公式的公式为:为:=np=np,2 2=npq,。例如上述棉田受害调查结果,n=5,p=0.35,所以可求得总体参数为:=np=50.35=1.75=np=50.35=1.75株,株,株。株。第二十四张,PPT共八十八页,创作于2022年6月3.1.2 二项分布的随机变量的特征数二项分布的随机变量的特征数 统计学证明,服从二项分布统计学证明,服从二项分布B(n,p)的随机变的随机变量之平均数量之平均数、标准差、标准差与参数与参数n、p有如下关系:有如下关系:当试验结果以事件当试验结果以事件A发生次数发生次数k表示时表示时 =np (4-18)=(4-19)第二十五张,PPT共八十八页,创作于2022年6月 【例【例3.4】求【例求【例3.3】平均死亡猪数】平均死亡猪数及死亡数的标准差。及死亡数的标准差。以以p=0.2,n=5代入代入(4-18)和和(4-19)式得:式得:平均死亡猪数平均死亡猪数=50.20=1.0(头头)标准差标准差 =0.894(头头)第二十六张,PPT共八十八页,创作于2022年6月 当试验结果以事件当试验结果以事件A发生的频率发生的频率kn表示时表示时 (4-20)(4-21)也称为总体百分数标准误,当也称为总体百分数标准误,当 p 未未 知时,知时,常以样本百分数常以样本百分数 来估计。此时来估计。此时(4-21)式改写式改写为:为:=(4-22)称为样本百分数标准误。称为样本百分数标准误。第二十七张,PPT共八十八页,创作于2022年6月第二节 泊松分布 泊松分布是一种泊松分布是一种 可以用来描述和分析随机地可以用来描述和分析随机地发生在单位空间或发生在单位空间或 时间里的时间里的稀有事件稀有事件的概率分的概率分布。要观察到这类事件,样本含量布。要观察到这类事件,样本含量 n 必须很大必须很大。在生物、医学研究中,服从泊松分布的随机在生物、医学研究中,服从泊松分布的随机变量是常见的。如,变量是常见的。如,一定畜群中某种患病率很一定畜群中某种患病率很低的非传染性疾病患病数或死亡数,低的非传染性疾病患病数或死亡数,畜群中遗畜群中遗传的畸形怪胎数,传的畸形怪胎数,每升饮水中大肠杆菌数,计每升饮水中大肠杆菌数,计数器小方格中血球数,数器小方格中血球数,单位空间中某些野生动单位空间中某些野生动物或昆虫数等,都是服从泊松分布的。物或昆虫数等,都是服从泊松分布的。第二十八张,PPT共八十八页,创作于2022年6月一、泊松分布的意义一、泊松分布的意义 若随机变量若随机变量x(x=k)只取零和正整数值只取零和正整数值0,1,2,且其概率分布为,且其概率分布为 ,k=0,1,(3-23)其中其中0;e=2.7182 是自然对数的底数,是自然对数的底数,则则 称称 x 服服 从从 参参 数数 为为 的的 泊泊 松分布松分布(Poissons distribution),记,记 为为 xP()。第二十九张,PPT共八十八页,创作于2022年6月 泊松分布重要的特征:泊松分布重要的特征:平均数和方差相等,都等于常数平均数和方差相等,都等于常数,即,即 =2=【例【例3.5】调查某种猪场闭锁育种群仔猪畸调查某种猪场闭锁育种群仔猪畸形数,共记录形数,共记录200窝,窝,畸形仔猪数的分布情况畸形仔猪数的分布情况如表如表4-3所示。试判断畸形仔猪数是否服从泊所示。试判断畸形仔猪数是否服从泊松分布。松分布。第三十张,PPT共八十八页,创作于2022年6月 表表3-1 畸形仔猪数统计分布畸形仔猪数统计分布 样本均数和方差样本均数和方差S2计算结果如下:计算结果如下:=fk/n =(1200+621 =(1200+621 +152+23+14)/200 +152+23+14)/200 =0.51 =0.51 第三十一张,PPT共八十八页,创作于2022年6月 =0.51,S2=0.52,这两个数是相当接近的这两个数是相当接近的,因此可以认为畸形仔猪数服从泊松分布。因此可以认为畸形仔猪数服从泊松分布。第三十二张,PPT共八十八页,创作于2022年6月 是泊松分布所依赖的唯一参数。是泊松分布所依赖的唯一参数。值愈值愈小分布愈偏倚,随着小分布愈偏倚,随着的增大的增大,分,分 布趋于对布趋于对称。当称。当=20时分布接近于正态分布;当时分布接近于正态分布;当=50时,时,可以认可以认 为泊松分布呈正态分布。为泊松分布呈正态分布。所以在实际工作中,当所以在实际工作中,当 20时就可以用正时就可以用正态分布来近似地处理泊松分布的问题。态分布来近似地处理泊松分布的问题。第三十三张,PPT共八十八页,创作于2022年6月 二、泊松分布的概率计算二、泊松分布的概率计算 由由(4-23)式可知,泊松分布的概率计算,依赖式可知,泊松分布的概率计算,依赖于参数于参数 的确定,只要参数的确定,只要参数确定了确定了,把,把k=0,1,2,代入代入(4-23)式即可求得各项的概率。式即可求得各项的概率。但是在但是在大多数服从泊松分布的实例中,分布参数大多数服从泊松分布的实例中,分布参数往往是往往是未知的,只能从所观察的随机样本中计算出相应未知的,只能从所观察的随机样本中计算出相应的样本平均数作为的样本平均数作为 的的 估计值,将其代替估计值,将其代替(4-23)式中的式中的,计算出,计算出 k=0,1,2,时的各项概率。时的各项概率。第三十四张,PPT共八十八页,创作于2022年6月 如【例如【例3.5】中已判断畸形仔猪数服从泊松分】中已判断畸形仔猪数服从泊松分布,并已算出样本平均数布,并已算出样本平均数=0.51。将。将0.51代替公式代替公式(4-23)中的)中的得:得:(K=0,1,2,)因为因为e-0.51=1.6653,所以畸形仔猪数各项的概,所以畸形仔猪数各项的概率为:率为:P(x=0)=0.510(0!1.6653)=0.6005P(x=1)=0.511(1!1.6653)=0.3063P(x=2)=0.512(2!1.6653)=0.0781 第三十五张,PPT共八十八页,创作于2022年6月P(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017 把上面各项概率乘以总观察窝数把上面各项概率乘以总观察窝数(n=200)即得即得各项按泊松分布的理论窝数。各项按泊松分布的理论窝数。第三十六张,PPT共八十八页,创作于2022年6月表表3-2 畸形仔猪数的泊松分布畸形仔猪数的泊松分布 将实际计算得的频率与根据将实际计算得的频率与根据=0.51的泊松分的泊松分布计算的概率相比较布计算的概率相比较,发现畸形仔猪的频率分,发现畸形仔猪的频率分布与布与=0.51 的的 泊松分布是吻合得很好的泊松分布是吻合得很好的。这进。这进一步说明了畸形仔猪数是服从泊松分布的。一步说明了畸形仔猪数是服从泊松分布的。第三十七张,PPT共八十八页,创作于2022年6月 【例【例3.6】为监测饮用水的污染情况,为监测饮用水的污染情况,现检验现检验某社区每毫升饮用水中细菌数某社区每毫升饮用水中细菌数,共得共得400个记录个记录如下:如下:试分析饮用水中细菌数的分布是否服从泊松试分析饮用水中细菌数的分布是否服从泊松分布。若服从,按泊松分布计算每毫升水中细菌分布。若服从,按泊松分布计算每毫升水中细菌数的概率及理论次数并将頻率分布与泊松分布作数的概率及理论次数并将頻率分布与泊松分布作直观比较。直观比较。第三十八张,PPT共八十八页,创作于2022年6月 经计算得每毫升水中平均细菌数经计算得每毫升水中平均细菌数 =0.500,方差方差S2=0.496。两者很接近,。两者很接近,故可故可认为每毫升水中细菌数服从泊松分布。以认为每毫升水中细菌数服从泊松分布。以 =0.500代替(代替(4-23)式中的)式中的,得,得 (k=0,1,2)计算结果如表计算结果如表3-3所示。所示。第三十九张,PPT共八十八页,创作于2022年6月表表3-3 细菌数的泊松分布细菌数的泊松分布 可见细菌数的频率分布与可见细菌数的频率分布与=0.5的泊松分布是的泊松分布是相当吻合的相当吻合的,进一步说明用泊松分布描述单位进一步说明用泊松分布描述单位容积容积(或面积或面积)中细菌数的分布是适宜的。中细菌数的分布是适宜的。第四十张,PPT共八十八页,创作于2022年6月 注意,二项分布的应用条件也是泊松分布注意,二项分布的应用条件也是泊松分布的应用条件。的应用条件。比如二项分布要求比如二项分布要求n 次试验是相互次试验是相互独立的,这也是泊松分布的要求。然而一些具独立的,这也是泊松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,之后可成为传染源,会影响到后续病例的发生,所以不符合泊松分布的应用条件。对于在单位所以不符合泊松分布的应用条件。对于在单位时间、单位面积或单位容积内,所观察的事物时间、单位面积或单位容积内,所观察的事物由于某些原因分布不随机时,如细菌在牛奶中由于某些原因分布不随机时,如细菌在牛奶中成集落存在时,亦不呈泊松分布。成集落存在时,亦不呈泊松分布。第四十一张,PPT共八十八页,创作于2022年6月超几何分布超几何分布第四十二张,PPT共八十八页,创作于2022年6月问题问题:假定一批供试验用小白鼠共:假定一批供试验用小白鼠共100只,其中只,其中有有5只不合格,随机取出的只不合格,随机取出的10只小白鼠中,不合只小白鼠中,不合格数格数X的概率分布如何?的概率分布如何?变式变式:随机的取出:随机的取出10件改为件改为3件,情况又如何件,情况又如何?问题问题:能否把这个结论推广到一般形式,:能否把这个结论推广到一般形式,建立一数学模型?建立一数学模型?第四十三张,PPT共八十八页,创作于2022年6月一般地,若一个随机变量一般地,若一个随机变量一般地,若一个随机变量一般地,若一个随机变量X X的分布列为的分布列为的分布列为的分布列为定义:定义:记为记为H(r;n,M,N)并称并称记记为为:xH(n,M,N),第四十四张,PPT共八十八页,创作于2022年6月问题推广:问题推广:第四十五张,PPT共八十八页,创作于2022年6月第四节 正态分布 正态分布是一种很重要的连续型随机变量的正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从或近概率分布。生物现象中有许多变量是服从或近似服从正态分布的。许多统计分析方法都是以似服从正态分布的。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量正态分布为基础的。此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中研究上还是实际应用中 ,均占有重要的地位。均占有重要的地位。第四十六张,PPT共八十八页,创作于2022年6月3.4.1 正态分布的密度函数、分布函数及其特征正态分布的密度函数、分布函数及其特征 (一)(一)正态分布的定义正态分布的定义 若连续型随机变量若连续型随机变量x的概率分布密度函数为的概率分布密度函数为 (4-6)其中其中为平均数,为平均数,2为方差,则称随机变量为方差,则称随机变量x服从正态分布服从正态分布(normal distribution),记为记为xN(,2)。相应的概率分布函数为。相应的概率分布函数为 (4-7)第四十七张,PPT共八十八页,创作于2022年6月 (二二)正态分布的特征正态分布的特征 1、正态分布密度曲线是单峰、对称的悬钟、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为形曲线,对称轴为x=;2、f(x)在在 x=处达处达 到到 极极 大大,极大值极大值 ;3、f(x)是非负函数,以是非负函数,以x轴为渐近线,分布轴为渐近线,分布从从-至至+;下一张下一张 主主 页页 退退 出出 上一张上一张 xf(x)CAB第四十八张,PPT共八十八页,创作于2022年6月 4、曲线在、曲线在x=处各有一个拐点,即曲线在处各有一个拐点,即曲线在(-,-)和和(+,+)区间上是下凸的,在区间上是下凸的,在-,+区间内是上凸的;区间内是上凸的;5、正态分布有两个参数,即平均数、正态分布有两个参数,即平均数和标准和标准差差。第四十九张,PPT共八十八页,创作于2022年6月 是位置参数,当是位置参数,当是位置参数,当是位置参数,当 恒定时,恒定时,恒定时,恒定时,越大,则曲线沿越大,则曲线沿越大,则曲线沿越大,则曲线沿x x轴愈向右;反之轴愈向右;反之轴愈向右;反之轴愈向右;反之曲线沿曲线沿曲线沿曲线沿x x轴越向左。轴越向左。轴越向左。轴越向左。是变异度参数,是变异度参数,是变异度参数,是变异度参数,当当当当 恒定时,恒定时,恒定时,恒定时,越大,表越大,表越大,表越大,表示示示示 x x 的取值越分散,的取值越分散,的取值越分散,的取值越分散,曲线越曲线越曲线越曲线越“胖胖胖胖”;越小,曲线越越小,曲线越越小,曲线越越小,曲线越“瘦瘦瘦瘦”。xf(x)CAB第五十张,PPT共八十八页,创作于2022年6月6、分布密度曲线与横轴所夹的面积为1,即:abxf(x)第五十一张,PPT共八十八页,创作于2022年6月 3.4.2 标准正态分布标准正态分布 由上述正态分布的特征可知由上述正态分布的特征可知 ,正态分布,正态分布是依赖于参数是依赖于参数和和2 (或或)的一簇的一簇 分布分布 ,正态曲线之位置及形态随正态曲线之位置及形态随和和2的不同而不的不同而不同同。这就给研究具体的正态总体带来困难,这就给研究具体的正态总体带来困难,需将一般的需将一般的N(,2)转转 换为换为=0,2=1的正的正态分布。态分布。第五十二张,PPT共八十八页,创作于2022年6月 我们称我们称=0,2=1的正态分布为标准正态分布的正态分布为标准正态分布(standard normal distribution)。标准正态分布的概率密度函数及分布函数分标准正态分布的概率密度函数及分布函数分别记作别记作(u)和和(u),由,由(4-6)及及(4-7)式得:式得:(4-8)(4-9)随机变量随机变量u服从标准正态分布,记作服从标准正态分布,记作uN(0,1)。第五十三张,PPT共八十八页,创作于2022年6月2.标准正态分布的概率密度函数1.1.任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布3.标准正态分布的分布函数第五十四张,PPT共八十八页,创作于2022年6月x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 1 1Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 第五十五张,PPT共八十八页,创作于2022年6月 对于任何一个服从正态分布对于任何一个服从正态分布N(,2)的随机变的随机变量量x,都可以通过标准化变换:,都可以通过标准化变换:u=(x-)(4-10)将将 其变换为服从标准正态分布的随机变量其变换为服从标准正态分布的随机变量u。u 称称 为为 标标 准准 正正 态变量或标准正态离差态变量或标准正态离差(standard normal deviate)。第五十六张,PPT共八十八页,创作于2022年6月三、正态分布的概率计算三、正态分布的概率计算 (一)标准正态分布的概率计算(一)标准正态分布的概率计算 设设u服从标准正态分布,则服从标准正态分布,则 u 在在u1,u2)内)内取值的概率为:取值的概率为:(u2)(u1)(4-11)而而(u1)与与(u2)可由附表可由附表1查得。查得。第五十七张,PPT共八十八页,创作于2022年6月 例如,例如,u=1.75,1.7放在第一列放在第一列0.05放在第一放在第一行行。在附表在附表1中中,1.7所在行与所在行与 0.05 所在列相交所在列相交处的数值为处的数值为0.95994,即,即 (1.75)=0.95994 有有 时时 会会 遇遇 到到 给给 定定 (u)值值,例例 如如(u)=0.284,反过来查反过来查u值。这只要在附表值。这只要在附表1中找中找到与到与 0.284 最接近的值最接近的值0.2843,对应行的第一列数,对应行的第一列数-0.5,对应列的第一行数对应列的第一行数 值值 0.07,即相应的,即相应的u值值为为 u=-0.57,即,即 (-0.57)=0.284 如果要求更精确的如果要求更精确的u值,可用线性插值法计算。值,可用线性插值法计算。第五十八张,PPT共八十八页,创作于2022年6月 由由(4-11)式及正态分布的对称性可推出下列式及正态分布的对称性可推出下列关系式,关系式,再借助附表再借助附表1,便能很方便地计算有便能很方便地计算有关概率:关概率:P(0uu1 1)(u1 1)-0.5 P(uu1 1)=(-u1 1)P(uu1 1)=2(-u1 1)(4-12)P(uu1 11-2(-u1 1)P(u1 1uu2 2)(u2 2)-(u1 1)第五十九张,PPT共八十八页,创作于2022年6月 【例【例4.6】已知已知uN(0,1),试求:,试求:(1)P(u-1.64)?(2)P(u2.58)=?(3)P(u2.56)=?(4)P(0.34u1.53)=?第六十张,PPT共八十八页,创作于2022年6月 利用利用利用利用(4-12)(4-12)式,查附表式,查附表式,查附表式,查附表1 1得:得:得:得:(1)P P(u u-1.64)=0.05050-1.64)=0.05050 (2)(2)P(u u2.58)=(-2.58)=0.024940 (3)(3)P P(u u2.56)2.56)=2(-2.56)=20.005234 =2(-2.56)=20.005234 =0.010468 =0.010468 (4)(4)P P(0.34(0.34u u1.53)=(1.53)-(0.34)=0.93669-0.6331=0.30389第六十一张,PPT共八十八页,创作于2022年6月 关于标准正态分布,以下几种概率应当熟记:关于标准正态分布,以下几种概率应当熟记:P(-1u1)=0.6826 P(-2u2)=0.9545 P(-3u3)=0.9973 P(-1.96u1.96)=0.95P(-2.58u2.58)=0.99 第六十二张,PPT共八十八页,创作于2022年6月标准正态分布的三个常用概率标准正态分布的三个常用概率99.74%65.26%95.46%第六十三张,PPT共八十八页,创作于2022年6月 u u变量在上述区间以外取值的概率分别为:变量在上述区间以外取值的概率分别为:变量在上述区间以外取值的概率分别为:变量在上述区间以外取值的概率分别为:P P(u u1)=2(-1)=1-P P(-1u u1)1)=1-0.6826=0.3174 =1-0.6826=0.3174 P(u u2)=2(-2)2)=2(-2)=1-=1-P P(-2-2u2 2)=1-0.9545=0.0455 P(u u3)=1-0.9973=0.00273)=1-0.9973=0.0027 P P(u u1.96)=1-0.95=0.051.96)=1-0.95=0.05 P(u u2.58)=1-0.99=0.01 2.58)=1-0.99=0.01 第六十四张,PPT共八十八页,创作于2022年6月 (二)一般正态分布的概率计算(二)一般正态分布的概率计算 正正 态态 分分 布布 密度曲线和横轴围成的一个区域,密度曲线和横轴围成的一个区域,其面积为其面积为1,这实际上表明了,这实际上表明了“随机变量随机变量x取值在取值在-与与+之间之间”是一个必然事件,其概率为是一个必然事件,其概率为1。若随机变量若随机变量 x服从正态分布服从正态分布N(,2),则,则x的取的取值落在任意区间值落在任意区间 x1,x2)的概率的概率,记作,记作P(x1 x x2),等于图中阴影部分曲边梯