第3章 几种常见的概率分布律.ppt
《第3章 几种常见的概率分布律.ppt》由会员分享,可在线阅读,更多相关《第3章 几种常见的概率分布律.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 几种常见的概率分布律第一节 二项式分布第二节 泊松分布第三节 另外几种离散型分布第四节 正态分布第五节 另外几种连续型分布第六节 中心极限定理第一节 二项分布3.1.1 3.1.1 贝努利试验及二项分布的概率函数贝努利试验及二项分布的概率函数 最早被研究的随机试验模型之一,只有两最早被研究的随机试验模型之一,只有两种可能的试验结果。如掷钱币可能正面,也可种可能的试验结果。如掷钱币可能正面,也可能反面;抽验一个产品可能合格,也可能不合能反面;抽验一个产品可能合格,也可能不合格等。它概括了最简单、也是最常用的一类随格等。它概括了最简单、也是最常用的一类随机现象。因瑞士数学家雅科布机现象。因
2、瑞士数学家雅科布贝努利首先研贝努利首先研究而得名。究而得名。这是一个生产数学家和物理学家的家属,Bernoulli 一家在欧洲享有盛誉,有一个传说,讲的是Daniel Bernoulli(他是John Bernoulli 的儿子)有一次正在做穿过欧洲的旅行,他与一个陌生人聊天,他很谦虚的自我介绍:“我是Daniel Bernoulli。”那个人当时就怒了,说:“我是还是Issac Newton(牛顿)呢。”Daniel 从此之后在很多的场合深情的回忆起这一次经历,把它当作自己曾经听过的最衷心的 赞扬。对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与 之一,在每次试验中出现A的概率是
3、常数p(0p1),因而出现对立事件 的概率是1-p=q,则 称 这一串重复的独立试验为n重贝努利试验,简称贝努利试验(Bernoulli trials)。贝努里试验具有如下属性n n 试验包含了n 个相同的试验n n 每次试验只有两个可能的结果,即“成功”和“失败”n n 出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p+q=1n n 试验是相互独立的n n 试验“成功”或“失败”可以计数 在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n枚种蛋的出雏数、n头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。在n重贝努利试验中,事件 A
4、可能发生0,1,2,n次,现在我们来求事件 A 恰好发生k(0kn)次的概率Pn n(k)。先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式有以下 种:其中其中AAkk(kk=1,2,3,4)=1,2,3,4)表示事件表示事件AA在第在第kk次试验发生;次试验发生;(kk=1,2,3,4)=1,2,3,4)表示事件表示事件AA在第在第kk次试验不发生。由于试验次试验不发生。由于试验是独立的,按是独立的,按概率的乘法法则概率的乘法法则,于是有,于是有 PP()=()=PP()=()=P P()=P P()()PP()()PP()()PP()=()=又由于以上各种方式中,任何二种方式都
5、是互又由于以上各种方式中,任何二种方式都是互不相容的,按不相容的,按概率的加法法则概率的加法法则,在,在4 4 次试验中,事件次试验中,事件AA恰好发生恰好发生22次的概率为次的概率为 PP44(2)(2)=P P()+()+PP()+()+P P()=()=一般,在一般,在nn重贝努利试验中,事件重贝努利试验中,事件AA恰好发生恰好发生kk(0(0kkn)n)次的概率为次的概率为 KK=0,1,2=0,1,2,nn(4-14)(4-14)若把若把(4-14)(4-14)式与二项展开式式与二项展开式相比较就可以发现,在相比较就可以发现,在nn重贝努利试验中,事件重贝努利试验中,事件AA发生发生
6、kk次的概率恰好等于次的概率恰好等于 展开式中的第展开式中的第kk+1+1项,所以作项,所以作二项二项概率函数概率函数。二项分布的意义及性质 二项分布定义如下:设随机变量x所有可能取的值为零和正整数:0,1,2,,n,且有=k=0,1,2,n 其中p 0,q 0,p+q=1,则称随机变量x服从参数为n 和p 的二项分布(binomial distribution),记为 xB(n,p)。二项分布是一种离散型随机变量的概率分布。参数n称为离散参数,只能取正整数;p 是连续参数,它能取0与1之间的任何数值(q由p确定,故不是另一个独立参数)。容易验证,二项分布具有概率分布的一切性质,即:1、P(x
7、=k)=Pn(k)(k=0,1,,n)2、二项分布的概率之和等于1,即3、(4-15)4、(4-16)5、(m m1 1m m2 2)(4-17)(4-17)二项分布由n 和p 两个参数决定:1、当p 值较小且n 不大时,分 布 是偏倚的。但随着n 的增大,分布逐渐趋于对称。2、当 p 值 趋 于 0.5 时,分 布 趋于对称。3、对于固定的n 及p,当k 增加时,Pn(k)先随之增加并达到其极大值,以后又下降。此外,在n 较大,np、nq 较接近时,二项分布接近于正态分布;当n 时,二项分布的极限分布是正态分布。二项分布图n 当n=20 时,不同p值的曲线。二项分布的概率计算及应用条件【例3
8、.1】纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3 1。求窝产仔10 头,有7 头白猪的概率。根据题意,n=10,p=3 4=0.75,q=1 4=0.25。设10 头仔猪中白色的为x头,则x为服从二项分布B(10,0.75)的随机变量。于是窝产10 头仔猪中有7 头是白色的概率为:【例3.2】设在家畜中感染某种疾病的概率为20,现有两种疫苗,用疫苗A 注射了15 头家畜后无一感染,用疫苗B 注射 15 头家畜后有1 头感染。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗?假设疫苗A 完全无效,那么注射后的家畜感染的概率仍为20,则15 头家畜中染病头
9、数x=0的概率为 同理,如果疫苗B 完全无效,则15 头家畜中最多有1 头感染的概率为 由计算可知,注射 A 疫苗无效的概率为0.0352,比B 疫苗无效的概率0.1671 小得多。因此,可以认为A 疫苗是有效的,但不能认为B 疫苗也是有效的。【3.3】仔猪黄痢病在常规治疗下死亡率为20,求5 头病猪治疗后死亡头数各可能值相应的概率。设5 头病猪中死亡头数为x,则x服从二项分布B(5,0.2),其所有可能取值为0,1,5,按(4-6)式计算概率,用分布列表示如下:0 1 2 3 4 5 0.3277 0.4096 0.2048 0.0512 0.0064 0.0003 0.3277 0.409
10、6 0.2048 0.0512 0.0064 0.0003 大豆子叶颜色由 大豆子叶颜色由2 2 对隐性重叠基因控制,在其 对隐性重叠基因控制,在其F F2 2代黄子叶 代黄子叶表现为显性,黄和青以 表现为显性,黄和青以3:1 3:1 比例分离。(以二粒荚为例来说 比例分离。(以二粒荚为例来说明)。明)。全部可能的结果有四种:全部可能的结果有四种:两粒都是黄的(两粒都是黄的(YY YY)3/43/4=9/16 3/43/4=9/16 第一次是青的第二次是黄的(第一次是青的第二次是黄的(GY GY)1/43/4=3/16 1/43/4=3/16 第一次是黄的第二次是青的(第一次是黄的第二次是青的
11、(YG YG)3/41/4=3/16 3/41/4=3/16 两粒都是青的(两粒都是青的(GG GG)1/41/4=1/16 1/41/4=1/16假设 假设y(y(黄子叶粒数)为变量,黄色子叶的概率为 黄子叶粒数)为变量,黄色子叶的概率为0.75 0.75,青色子,青色子叶的概率为 叶的概率为0.25 0.25。那么其概率分别为(见上面)。那么其概率分别为(见上面)。如果一粒豆荚中有三粒种子,那么就有 如果一粒豆荚中有三粒种子,那么就有8 8 种可能的情况。种可能的情况。全部是青子叶 全部是青子叶(GGG GGG)1/64 1/64 仅有一粒黄子叶种子(仅有一粒黄子叶种子(GGY GGY、G
12、YG GYG、YGG YGG)9/64 9/64 具有两粒黄了叶种子(具有两粒黄了叶种子(YYG YYG、YGY YGY、GYY GYY)27/64 27/64 全部是黄子叶种子 全部是黄子叶种子(YYY YYY)27/64 27/64数学上的组合公式为 数学上的组合公式为n n 相当于豆荚内种子数,相当于豆荚内种子数,y y 相当于黄子叶种子数。因此 相当于黄子叶种子数。因此由此可以推知二项分布的概率函数为:由此可以推知二项分布的概率函数为:某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10头为一组治疗。试问如新药无疗效,则在10头中死3头、2头
13、、1头以及全部愈好的概率为多少?按照上面的公式进行计算:7头愈好,3头死去的概率为:8头愈好,2头死去的概率为:9头愈好,1头死去的概率为:10头全部愈好的概率为:受害株数概率函数P(y)P(y)F(y)nP(y)P(0)0.1160 0.1160 46.40P(1)0.3124 0.4284 124.96P(2)0.3364 0.7648 134.56P(3)0.1811 0.9549 72.44P(4)0.0488 0.9947 19.52P(5)0.0053 1.0000 2.12如果每次抽5个单株,抽n=400次,则理论上我们能够得到y=2的次数应为:理论次数=400P(2)=4000
14、.3364=134.56(次)对于任意y,其理论次数为:理论次数=nP(y)。二项分布的应用条件有三:(1)各观察单位 只具有互相对立 的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料;(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值;(3)n 个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。三、二项式分布的形状和参数 对于一个二项式总体,如果对于一个二项式总体,如果p=qp=q,二项式分二项式分布呈对称形状,如果布呈对称形状,如果ppqq,二项式分布则表现偏二项式分布则
15、表现偏斜形状。但如果斜形状。但如果nn时,即使时,即使ppqq,二项式总二项式总体分布的情况也趋于对称形状,所以二项分布的体分布的情况也趋于对称形状,所以二项分布的形状是由形状是由nn和和pp两个参数决定的。两个参数决定的。二项总体的平均数二项总体的平均数、方差、方差22和标准差和标准差的的公式为:公式为:=npnp,22=npqnpq,。例如上述棉田例如上述棉田受害调查结果,受害调查结果,n=5,p=0.35n=5,p=0.35,所以可求得总体参所以可求得总体参数为:数为:=npnp=50.35=1.75=50.35=1.75株,株,株。株。3.1.2 二项分布的随机变量的特征数 统计学证明
16、,服从二项分布B(n,p)的随机变量之平均数、标准差 与参数n、p 有如下关系:当试验结果以事件A 发生次数k 表示时=np(4-18)=(4-19)【例3.4】求【例3.3】平均死亡猪数及死亡数的标准差。以p=0.2,n=5 代入(4-18)和(4-19)式得:平均死亡猪数=50.20=1.0(头)标准差=0.894(头)当试验结果以事件A 发生的频率k n 表示时(4-20)(4-21)也称为总体百分数标准误,当 p 未 知时,常以样本百分数 来估计。此时(4-21)式改写为:=(4-22)称为样本百分数标准误。第二节 泊松分布 泊松分布是一种 可以用来描述和分析随机地发生在单位空间或 时
17、间里的稀有事件的概率分布。要观察到这类事件,样本含量 n 必须很大。在生物、医学研究中,服从泊松分布的随机变量是常见的。如,一定畜群中某种患病率很低的非传染性疾病患病数或死亡数,畜群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数等,都是服从泊松分布的。一、泊松分布的意义 若随机变量x(x=k)只取零和正整数值0,1,2,且其概率分布为,k=0,1,(3-23)其中 0;e=2.7182 是自然对数的底数,则 称 x 服 从 参 数 为 的 泊 松分布(Poissons distribution),记 为 xP()。泊松分布重要的特征:平均数和方差
18、相等,都等于常数,即=2=【例3.5】调查某种猪场闭锁育种群仔猪畸形数,共记录200 窝,畸形仔猪数的分布情况如表4-3 所示。试判断畸形仔猪数是否服从泊松分布。表3-1 畸形仔猪数统计分布 样本均数和方差S2计算结果如下:=fk/nfk/n=(1200+621=(1200+621+152+23+14)/200+152+23+14)/200=0.51=0.51 =0.51,S2=0.52,这两个数是相当接近的,因此可以认为畸形仔猪数服从泊松分布。是泊松分布所依赖的唯一参数。值愈小分布愈偏倚,随着 的增大,分 布趋于对称。当=20 时分布接近于正态分布;当=50 时,可以认 为泊松分布呈正态分布
19、。所以在实际工作中,当 20 时就可以用正态分布来近似地处理泊松分布的问题。二、泊松分布的概率计算 由(4-23)式可知,泊松分布的概率计算,依赖于参数 的确定,只要参数 确定了,把k=0,1,2,代入(4-23)式即可求得各项的概率。但是在大多数服从泊松分布的实例中,分布参数往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为 的 估计值,将其代替(4-23)式中的,计算出 k=0,1,2,时的各项概率。如【例3.5】中已判断畸形仔猪数服从泊松分布,并已算出样本平均数=0.51。将0.51 代替公式(4-23)中的 得:(K=0,1,2,)因为e-0.51=1.6653,所以畸形
20、仔猪数各项的概率为:P(x=0)=0.510(0!1.6653)=0.6005P(x=1)=0.511(1!1.6653)=0.3063P(x=2)=0.512(2!1.6653)=0.0781 P(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017 把上面各项概率乘以总观察窝数(n=200)即得各项按泊松分布的理论窝数。表3-2 畸形仔猪数的泊松分布 将实际计算得的频率与根据=0.51 的泊松分布计算的概率相比较,发现畸形仔猪的频率分布与=0.51 的 泊松分布是吻合得很好的。这进一步说明了畸形仔猪数是服从泊松分布的。【例3.6】
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 几种常见的概率分布律 常见 概率 分布
限制150内