二项分布与分布讲稿.ppt
《二项分布与分布讲稿.ppt》由会员分享,可在线阅读,更多相关《二项分布与分布讲稿.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、二项分布与分布1第一页,讲稿共六十七页哦目的及要求目的及要求了解二项分布(了解二项分布(binomialdistribution)与)与Poisson分布(分布(Poissondistribution)的概念)的概念掌握二项分布的特点、均数与标准差的计算,掌握二项分布的特点、均数与标准差的计算,Poisson分布与二项分布和正态分布的关系;总分布与二项分布和正态分布的关系;总体均数可信区间的估计、假设检验及适用条件体均数可信区间的估计、假设检验及适用条件重点是二项分布的应用,难点是三种分布的区重点是二项分布的应用,难点是三种分布的区别与联系别与联系2第二页,讲稿共六十七页哦一一.概念:概念:为
2、率的抽样分布,各种情况的概率等于二项式展开为率的抽样分布,各种情况的概率等于二项式展开后的各项。后的各项。X=0.1.2X=0.1.2.n.nn例:设小鼠接受某种毒物一定剂量时,其死亡率为例:设小鼠接受某种毒物一定剂量时,其死亡率为80%80%,若随机用三只小鼠作试验,问出现各种死亡情况,若随机用三只小鼠作试验,问出现各种死亡情况的概率?的概率?二项分布二项分布3第三页,讲稿共六十七页哦小鼠存亡的组合方式小鼠存亡的组合方式排列方式排列方式每种排列的概率每种排列的概率每种组每种组合的概合的概率率生存数生存数(X)死亡数死亡数(n-X)甲甲乙乙丙丙30生生生生生生0.20.20.2=0.0080.
3、00821生生生生死死0.20.20.8=0.0320.096生生死死生生0.20.80.2=0.032死死生生生生0.80.20.2=0.03212生生死死死死0.20.80.8=0.1280.384死死生生死死0.80.20.8=0.128死死死死生生0.80.80.2=0.12803死死死死死死0.80.80.8=0.5120.5124第四页,讲稿共六十七页哦(0.8+0.2)3=(0.2)3+3(0.8)(0.2)2+3(0.8)2(0.2)+(0.8)3三生三生二生一死二生一死一生二死一生二死三死三死二二.应用条件:应用条件:BernoulliBernoulli试验:试验:在只有两种
4、可能结果(成功与失败)的随机试在只有两种可能结果(成功与失败)的随机试验,每次试验时出现成功的概率验,每次试验时出现成功的概率是恒定的,而且各次试验相互是恒定的,而且各次试验相互独立。这种试验在统计学上称之为贝努里试验(独立。这种试验在统计学上称之为贝努里试验(Bernoulli Bernoulli trial)trial)。5第五页,讲稿共六十七页哦(1)二项分类资料:结果为)二项分类资料:结果为A或非或非A(成功与失败)(成功与失败)。(2)每次试验的条件不变:每次试验)每次试验的条件不变:每次试验A的发生概率均为的发生概率均为。(3)各次试验独立:每个观察单位的观察结果不会影响到其)各次
5、试验独立:每个观察单位的观察结果不会影响到其他观察单位的结果。他观察单位的结果。在在BernoulliBernoulli试验中,取得成功的次数试验中,取得成功的次数X X(X=0X=0,1 1,2 2,n n)的)的概率呈二项分布。其概率计算式:概率呈二项分布。其概率计算式:所以二项分布的应用条件就是所以二项分布的应用条件就是BernoulliBernoulli试验的条件,即:试验的条件,即:式中:式中:n、为二项分布的参数。为二项分布的参数。若随机变量若随机变量X服从以服从以n、为参数的二项分布记为为参数的二项分布记为XB(n.)。)。6第六页,讲稿共六十七页哦(2)至少有)至少有k例阳性的
6、概率:例阳性的概率:(3)至多有)至多有k例阳性的概率:例阳性的概率:X=0,1,2,kn三三.概率的计算:概率的计算:(1)恰有)恰有k例阳性的概率:例阳性的概率:从一个阳性率为从一个阳性率为的总体中,随机抽取含量为的总体中,随机抽取含量为n的样本,则样本中的样本,则样本中阳性数阳性数X或阳性率或阳性率p服从二项分布服从二项分布B(n、)。)。7第七页,讲稿共六十七页哦例例:已知某地玉米的黄曲霉污染率近年为已知某地玉米的黄曲霉污染率近年为20%,若抽取若抽取10个样品作检查,求个样品作检查,求污染样品数为污染样品数为3个的概率。个的概率。污染样品数不超过一个的概率。污染样品数不超过一个的概率
7、。污染样品数在污染样品数在9个以上的概率。个以上的概率。8第八页,讲稿共六十七页哦污染样品数为污染样品数为3个的概率:个的概率:污染样品数不超过一个的概率:污染样品数不超过一个的概率:污染样品数在污染样品数在9个以上的概率:个以上的概率:9第九页,讲稿共六十七页哦例例5.2经统计,某省用经统计,某省用“中药阑尾炎合剂中药阑尾炎合剂”治疗急性阑尾炎性腹治疗急性阑尾炎性腹膜炎的有效率为膜炎的有效率为86%,试分别估计:,试分别估计:治疗治疗10例中至少例中至少9例有例有效的概率;效的概率;治疗治疗10例中至多例中至多7例有效的概率。例有效的概率。本例有效例数本例有效例数XB(10.0.86),依题
8、意,),依题意,10例患者中,例患者中,因因此此,10例例患患者者中中至至少少9例例有有效效的的概概率率为为0.581,至至多多7例例有有效效的的概概率率为为0.155。10第十页,讲稿共六十七页哦四四.二项分布的图形二项分布的图形11第十一页,讲稿共六十七页哦(1)离散型离散型(2)当)当=1-=0.5时,两边对称时,两边对称(3)当当 0.5时,呈偏态分布。当时,呈偏态分布。当 0.5时,呈左偏态分时,呈左偏态分布;当布;当 0.5时,呈右偏态分布。时,呈右偏态分布。(4)当)当n增大,二项分布逐渐逼近正态分布增大,二项分布逐渐逼近正态分布二项分布的特点:二项分布的特点:成功率成功率P=X
9、/n的概率分布图形与成功次数的概率分布图形是完全一的概率分布图形与成功次数的概率分布图形是完全一样的,只需要把横轴上的样的,只需要把横轴上的X变换成变换成X/n就行了。就行了。一般认为,一般认为,n 和和n(1-)5时时,可近似看作正态分布。可近似看作正态分布。12第十二页,讲稿共六十七页哦13第十三页,讲稿共六十七页哦14第十四页,讲稿共六十七页哦五五.二项分布的二项分布的均数与标准差均数与标准差2.若用率表示,则:若用率表示,则:p为率的标准误为率的标准误表示率的抽样误差表示率的抽样误差当当未知时,常以样本率未知时,常以样本率P来估计:来估计:1.若若XB(n,),),则则X的均数和标准差
10、为:的均数和标准差为:15第十五页,讲稿共六十七页哦nX的均数在这里可以理解为n次试验中结果A期望出现的次数,而X的标准差则是衡量结果A出现次数的变异程度。n例5.3求例5.1中平均死亡鼠数及其标准差。n根据死亡鼠数XB(3,0.8)得到n平均死亡鼠数只n标准差若用率表示,则若用率表示,则16第十六页,讲稿共六十七页哦n二项分布的应用二项分布的应用n二二项项分分布布是是一一种种常常用用的的离离散散型型分分布布,具具有有广广泛泛的的应应用用价价值值。在在实实际际问问题题中中特特别别要要注注意意判判定定一一个个变变量量是是否否服服从从二二项项分分布布。凡凡具具有有贝贝努努利利试试验验序序列列3个个
11、特特点点的的变变量量,一一般般可可认认为服从二项分布。为服从二项分布。n1)总体率的区间估计)总体率的区间估计n总总体体率率估估计计包包括括点点估估计计和和区区间间估估计计。点点估估计计是是直直接接用用样样本本率率来来估估计计总总体体率率。区区间间估估计计是是根根据据样样本本提提供供的的信信息息按按一一定定的的概概率率(即可信度)来估计总体率的可能范围。(即可信度)来估计总体率的可能范围。n总体率的可信区间根据总体率的可信区间根据n和和P的大小一般有两种估计方法。的大小一般有两种估计方法。17第十七页,讲稿共六十七页哦n na正态近似法正态近似法n当当n足足够够大大,P和和1-P均均不不太太小
12、小时时(可可通通过过nP与与n(1-P)均大于判断)均大于判断),n样样本本率率P近近似似正正态态分分布布,这这时时可可以以利利用用正正态态分分布布理理论论来来估估计总体率的可信区间。计总体率的可信区间。n 可信度为可信度为1-1-的可信区间:的可信区间:n18第十八页,讲稿共六十七页哦n例例:n某某医医院院用用复复方方当当归归注注射射液液静静脉脉滴滴注注治治疗疗脑脑动动脉脉硬硬化化症症188例例,其其中中显显效效83例例,试试估估计计等等量量齐齐观方当归注射液显效率的观方当归注射液显效率的95%和和99%可信区间。可信区间。n复方当归注射液静复方当归注射液静95%可信区可信区n(0.4415
13、1.960.036,0.44151.960.036)n=(0.3709,0.5121)=(37.09%,51.21%)19第十九页,讲稿共六十七页哦nB查表法查表法n 如果如果n,pn,p不符合上述要求,当不符合上述要求,当n50n50,特别是,特别是P P很接很接近近0 0或或1 1时,样本资料呈二项分布,可用二项分布法时,样本资料呈二项分布,可用二项分布法估计总体率的可信区间。该法计算繁杂,附表估计总体率的可信区间。该法计算繁杂,附表3 3列列出了总体率的出了总体率的95%95%和和99%99%可信区间,可信区间,n例例5.5从从某某学学校校随随机机抽抽取取26名名学学生生,发发现现有有4
14、名名感感染染沙眼,试求该校沙眼感染率沙眼,试求该校沙眼感染率95%可信区间。可信区间。n本本例例n=26,X=4,查查附附表表3的的可可信信度度为为95%的的可可信信区区间间为(为(0.04,0.35),即(),即(4%,35%)。)。20第二十页,讲稿共六十七页哦n注意注意:n附表附表3 3中中X X值只列出值只列出 时,时,n可可以以用用n-Xn-X查查表表,然然后后以以100%100%减减去去查查的的区区间间即即为为所所求的可信区间求的可信区间n例例5.6 5.6 某某县县抽抽查查了了1010名名人人员员的的乙乙型型肝肝炎炎表表面面抗抗原原(HBsAgHBsAg)携携带带情情况况,阴阴性
15、性者者8 8人人,求求该该县县人人群群HbsAgHbsAg阴性率的阴性率的95%95%可信区间为可信区间为 若若x n/2,则按,则按n-x查表得?,然后查表得?,然后100-?例:上题若例:上题若X=8,则,则n-x=10-8=2查表得:查表得:3%56%然后然后100-?得:?得:44%97%21第二十一页,讲稿共六十七页哦(2)样本率与总体率比较)样本率与总体率比较1)直接计算概率法)直接计算概率法H0:1=0=0.01H1:1 0=0.01单侧单侧=0.05P,按,按=0.05水准,不拒绝水准,不拒绝H0,故不能认为该地新生儿染色体异常率,故不能认为该地新生儿染色体异常率低于一般新生儿
16、。低于一般新生儿。22第二十二页,讲稿共六十七页哦n例例如如5.7一一种种鸭鸭通通常常感感染染某某种种传传染染病病的的概概率率是是0.2,现现将将一一种种药药物物注注射射到到25只只鸭鸭后后发发现现有有1只只鸭鸭发发生生感感染染,试试推推断断这这种种药对预防感染是否有效药对预防感染是否有效nHo:此药物对预防感染无效此药物对预防感染无效即即=0.2nH1:此药物对预防感染有效此药物对预防感染有效即即 0=0.2单侧单侧=0.0524第二十四页,讲稿共六十七页哦(3)两样本率比较(近似正态法)两样本率比较(近似正态法)n1p1、n1(1-p1)和)和n2p2、n2(1-p2)5时时例:为研究某地
17、男女学生的肺吸虫感染率是否存在差别,某例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研究者随机抽取该地研究者随机抽取该地80名男生和名男生和85名女生,查得感染人数男名女生,查得感染人数男生生23人,女生人,女生13人。请作统计分析。人。请作统计分析。H0:1=2H1:1 2=0.0525第二十五页,讲稿共六十七页哦PoissonPoisson分布分布一一.概念:概念:是二项分布的特例。当是二项分布的特例。当很小,而很小,而n很大时,则二项分布逼近很大时,则二项分布逼近Poisson分布。分布。例如:例如:每毫升水中大肠杆菌数的分布。每毫升水中大肠杆菌数的分布。粉尘在单位容积内计数的分布
18、。粉尘在单位容积内计数的分布。放射性物质在单位时间内放射出质点数的分布。放射性物质在单位时间内放射出质点数的分布。单位空间中某些野生动物或昆虫数的分布。单位空间中某些野生动物或昆虫数的分布。一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布。一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布。一般用于研究单位容积(或面积、时间)内某事件发生数。(小概率事一般用于研究单位容积(或面积、时间)内某事件发生数。(小概率事件出现的规律性)件出现的规律性)26第二十六页,讲稿共六十七页哦二二.Poisson分布的概率:分布的概率:=n为为Poisson分布的总体均数;分布的总体均数;X=
19、0,1,2,式中:式中:X为单位时间(或面积、容积等)某事件发生数;为单位时间(或面积、容积等)某事件发生数;e为自然对数的底,为自然对数的底,e2.71828从式中可知,从式中可知,为为Poisson分布的唯一参数。分布的唯一参数。X服从以服从以为参数的为参数的Poisson分布,可记为分布,可记为XP()。)。递推公式:递推公式:27第二十七页,讲稿共六十七页哦例例:据据以以往往经经验验,新新生生儿儿染染色色体体异异常常率率一一般般为为1%,试试分分别别用用二二项项分分布布及及Poisson分分布布原原理理,求求100名名新新生生儿儿中中发发生生X例例(X=0,1,2,)染色体异常的概率。
20、)染色体异常的概率。1.按二项分布原理求按二项分布原理求P(X)同理,可求得同理,可求得P(2),),P(3)等。)等。28第二十八页,讲稿共六十七页哦(2)按)按Poisson分布原理求分布原理求P(X):=n=1000.01=1同理,可求得同理,可求得P(4),),P(5)等。)等。(1)递推公式:递推公式:29第二十九页,讲稿共六十七页哦(2)公式:公式:30第三十页,讲稿共六十七页哦由表可见,对由表可见,对很小,很小,n很大的同一资料用二项很大的同一资料用二项布法与布法与Poisson分布法计算结果是很接近的。但分布法计算结果是很接近的。但Poisson分布的分布的P(X)的计算较为简
21、便。的计算较为简便。31第三十一页,讲稿共六十七页哦三三.Poisson分布的图形:分布的图形:根根据据,按按式式可可计计算算出出的的所所有有可可能能取取值值时时的的概概率率(),以以其其为为纵纵轴轴,可可绘绘制制出出poisson分分布布概概率率分分布布列列的的图图形形,可可见见,poisson分分布布图图形形形形状状完完全全取取决决于于的的大大小小。当当时时图图形形基基本本对对称称,随随的的增增大大,图图形形渐渐近近于于正正态态分布。分布。32第三十二页,讲稿共六十七页哦四四.Poisson分布的特性和应用条件:分布的特性和应用条件:1.离散型分布离散型分布.Poisson分布只有一个参数
22、,即参数分布只有一个参数,即参数;2.Poisson分布可看成二项分布的特例,其应用条件也就是二项分布的应分布可看成二项分布的特例,其应用条件也就是二项分布的应用条件。用条件。3.方差等于均数:即方差等于均数:即2=。为为Poisson分布的重要特征。分布的重要特征。4.Poisson分布在分布在不大时呈左偏态分布,随着不大时呈左偏态分布,随着的增大而逐渐趋于对称。的增大而逐渐趋于对称。当当20时,可认为近似正态分布时,可认为近似正态分布问题:问题:(1)具有传染性的罕见疾病的发生率能否用)具有传染性的罕见疾病的发生率能否用Poisson分布来分分布来分 析?析?(2)细菌在牛奶中呈集落状存在
23、能否用)细菌在牛奶中呈集落状存在能否用Poisson分布来分析?分布来分析?5.Poisson分布的可加性分布的可加性。33第三十三页,讲稿共六十七页哦若若X1,X2,Xk相互独立,且它们分别服从以相互独立,且它们分别服从以1,2,k为参数的为参数的Poisson分布,则分布,则T=X1+X2+Xk也服从也服从Poisson分布,分布,其参数为其参数为1+2+k。Poisson分布的可加性:分布的可加性:n例如例如:某放射物质每某放射物质每.s放射粒子数服从均数为放射粒子数服从均数为.的的poisson分布,分布,现随机取次观测结果进行研究,这次观测结果分别为每现随机取次观测结果进行研究,这次
24、观测结果分别为每.s反反射,及个粒子数,问每射,及个粒子数,问每.s放射粒子数为多少?并指出其服从于放射粒子数为多少?并指出其服从于均值为多少的均值为多少的poisson分布。分布。n本例本例X1=2,X2=3,X3=4,利用利用poisson分布的可加性原理得到分布的可加性原理得到nX1X2X3=2349个个n均值为均值为2.2+2.2+2.2=6.6n每每.s放射粒子数为个,每放射粒子数为个,每.s放射粒子数服从于均值为放射粒子数服从于均值为.的的poisson分布分布34第三十四页,讲稿共六十七页哦poisson分布与二项分布分布与二项分布 及正态分布的关系及正态分布的关系vpoisso
25、n分分布布可可视视为为二二项项分分布布的的特特例例若若某某种种现现象象的的发发生生率率甚甚小小,而而样样本本例例数数甚甚多多时时,则则二二项项分分布布逼逼近近poisson分布分布.poisson分分布布的的正正态态近近似似一一般般在在实实际际应应用用中中,当当时时,poisson分分布布近近似似正正态态分分布布,资资料料可可根根据据正态分布原理处理,从而简化计算正态分布原理处理,从而简化计算35第三十五页,讲稿共六十七页哦poissonpoisson分布的应用分布的应用poisson分布的应用条件分布的应用条件凡凡具具有有贝贝努努利利实实验验序序列列个个特特点点且且很很小小n大大时时,其其相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 二项分布 分布 讲稿
限制150内