二项分布与分布.ppt
《二项分布与分布.ppt》由会员分享,可在线阅读,更多相关《二项分布与分布.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、二项分布与分布1现在学习的是第1页,共67页了解二项分布(了解二项分布(binomial distribution)与)与Poisson分布(分布( Poisson distribution)的概)的概念念掌握二项分布的特点、均数与标准差的计算,掌握二项分布的特点、均数与标准差的计算,Poisson分布与二项分布和正态分布的关系;分布与二项分布和正态分布的关系;总体均数可信区间的估计、假设检验及适用总体均数可信区间的估计、假设检验及适用条件条件重点是二项分布的应用,难点是三种分布的区别重点是二项分布的应用,难点是三种分布的区别与联系与联系2现在学习的是第2页,共67页一一. .概念:概念: 为
2、率的抽样分布,各种情况的概率等于二项式展开为率的抽样分布,各种情况的概率等于二项式展开后的各项。后的各项。 X=0.1.2X=0.1.2.n.nn例:设小鼠接受某种毒物一定剂量时,其死亡率为例:设小鼠接受某种毒物一定剂量时,其死亡率为80%80%,若随机用三只小鼠作试验,问出现各种死亡情况的概,若随机用三只小鼠作试验,问出现各种死亡情况的概率?率? xnxnxxp1二项分布二项分布3现在学习的是第3页,共67页小鼠存亡的组合方式小鼠存亡的组合方式排列方式排列方式每种排列的概率每种排列的概率每种组每种组合的概合的概率率生存数生存数(X)死亡数死亡数(n-X)甲甲乙乙丙丙30生生生生生生0.20.
3、20.2=0.0080.00821生生生生死死0.20.20.8=0.0320.096生生死死生生0.20.80.2=0.032死死生生生生0.80.20.2=0.03212生生死死死死0.20.80.8=0.1280.384死死生生死死0.80.20.8=0.128死死死死生生0.80.80.2=0.12803死死死死死死0.80.80.8=0.5120.512 xxnnxxp,14现在学习的是第4页,共67页(0.8 + 0.2)3=(0.2)3 + 3(0.8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3 三生三生 二生一死二生一死 一生二死一生二死 三死三死 nXnXn
4、Xnnnnnn 1)( 1)(1)(1122211二二. 应用条件:应用条件:BernoulliBernoulli试验:试验: 在只有两种可能结果(成功与失败)的随机试在只有两种可能结果(成功与失败)的随机试验,每次试验时出现成功的概率验,每次试验时出现成功的概率是恒定的,而且各次试验相互是恒定的,而且各次试验相互独立。这种试验在统计学上称之为贝努里试验(独立。这种试验在统计学上称之为贝努里试验( Bernoulli trial)Bernoulli trial)。5现在学习的是第5页,共67页(1)二项分类资料:结果为)二项分类资料:结果为A或非或非A (成功与失败)(成功与失败) 。(2)每
5、次试验的条件不变:每次试验)每次试验的条件不变:每次试验A的发生概率均为的发生概率均为。(3)各次试验独立:每个观察单位的观察结果不会影响到其)各次试验独立:每个观察单位的观察结果不会影响到其 他观察单位的结果。他观察单位的结果。在在BernoulliBernoulli试验中,取得成功的次数试验中,取得成功的次数X X(X=0X=0,1 1,2 2,n n)的概率)的概率呈二项分布。其概率计算式:呈二项分布。其概率计算式:所以二项分布的应用条件就是所以二项分布的应用条件就是BernoulliBernoulli试验的条件,即:试验的条件,即: knknkkXP 1)()(式中:式中:n、为二项分
6、布的参数。为二项分布的参数。若随机变量若随机变量X服从以服从以n、为参数的二项分布记为为参数的二项分布记为XB( n.)。)。6现在学习的是第6页,共67页(2)至少有)至少有k例阳性的概率:例阳性的概率:(3)至多有)至多有k例阳性的概率:例阳性的概率: nKXPnPKPKPKPKXP)()()2()1()()( kXPkPPPPKXP0)()()2()1()0()(X= 0, 1, 2, kn三三. 概率的计算:概率的计算: knknkkXP 1)()()!( !)(knknnk (1)恰有)恰有k例阳性的概率:例阳性的概率:从一个阳性率为从一个阳性率为的总体中,随机抽取含量为的总体中,随
7、机抽取含量为n的样本,则样本中阳的样本,则样本中阳性数性数X或阳性率或阳性率p服从二项分布服从二项分布B ( n、)。)。7现在学习的是第7页,共67页 例例: 已知某地玉米的黄曲霉污染率近年为已知某地玉米的黄曲霉污染率近年为20%, 若抽取若抽取10个样品作检查,求个样品作检查,求污染样品数为污染样品数为3个的概率。个的概率。污染样品数不超过一个的概率。污染样品数不超过一个的概率。 污染样品数在污染样品数在9个以上的概率。个以上的概率。8现在学习的是第8页,共67页污染样品数为污染样品数为3个的概率:个的概率:2097.0008.0120201.08.02.0)()3(3103103XP污染
8、样品数不超过一个的概率:污染样品数不超过一个的概率:376. 08 . 02 . 0)(8 . 0)1()0()1(110110110 PPXP 污染样品数在污染样品数在9个以上的概率:个以上的概率:00000420. 02 . 08 . 02 . 0)()10()9()9(109109 PPXP9现在学习的是第9页,共67页 例例5.2 经统计,某省用经统计,某省用“中药阑尾炎合剂中药阑尾炎合剂”治疗急性阑尾炎性腹治疗急性阑尾炎性腹 膜炎的有效率为膜炎的有效率为86%,试分别估计:,试分别估计: 治疗治疗10例中至少例中至少9例有例有 效的概率;效的概率; 治疗治疗10例中至多例中至多7例有
9、效的概率。例有效的概率。 本例有效例数本例有效例数XB(10. 0.86),依题意,),依题意,10例患者中,例患者中,581. 0221. 0360. 086. 014. 086. 01099109910Cxpxpxp155. 058. 014. 086. 019)8(181728810Cxxpxpxp因此,因此,10例患者中至少例患者中至少9例有效的概率为例有效的概率为0.581,至多,至多7例有效的概率为例有效的概率为0.155。10现在学习的是第10页,共67页四四. 二项分布的图形二项分布的图形 308n11现在学习的是第11页,共67页(1)离散型)离散型(2)当当 =1- =0.
10、5时,两边对称时,两边对称(3)当当 0.5时,呈偏态分布。当时,呈偏态分布。当 0.5时,呈左偏态分时,呈左偏态分布;当布;当 0.5时,呈右偏态分布。时,呈右偏态分布。(4)当当n增大,二项分布逐渐逼近正态分布增大,二项分布逐渐逼近正态分布二项分布的特点:二项分布的特点:成功率成功率P=X/n的概率分布图形与成功次数的概率分布图形是完全一样的的概率分布图形与成功次数的概率分布图形是完全一样的,只需要把横轴上的,只需要把横轴上的X变换成变换成X/n就行了。就行了。一般认为,一般认为,n 和和 n( 1- ) 5时时, 可近似看作正态分布。可近似看作正态分布。12现在学习的是第12页,共67页
11、13现在学习的是第13页,共67页14现在学习的是第14页,共67页五五. 二项分布的二项分布的均数与标准差均数与标准差2.若用率表示,则:若用率表示,则: 1nnXX nPP 1p为率的标准误为率的标准误表示率的抽样误差表示率的抽样误差当当未知时,常以样本率未知时,常以样本率P来估计:来估计:nPPSP)1( 1.若若XB(n , ),),则则X 的均数和标准差为:的均数和标准差为:15现在学习的是第15页,共67页n X的均数在这里可以理解为n次试验中结果A期望出现的次数,而X的标准差则是衡量结果A出现次数的变异程度。n 例5.3 求例5.1中平均死亡鼠数及其标准差。n 根据死亡鼠数XB(
12、3,0.8)得到n 平均死亡鼠数 只n 标准差 4 . 28 . 03x69. 08 . 018 . 03只x23. 038 . 018 . 01nPP若用率表示,则若用率表示,则16现在学习的是第16页,共67页n二项分布的应用二项分布的应用n二项分布是一种常用的离散型分布,具有广泛的应用价二项分布是一种常用的离散型分布,具有广泛的应用价值。在实际问题中特别要注意判定一个变量是否服从二值。在实际问题中特别要注意判定一个变量是否服从二项分布。凡具有贝努利试验序列项分布。凡具有贝努利试验序列3个特点的变量,一般可认个特点的变量,一般可认为服从二项分布。为服从二项分布。n1)总体率的区间估计)总体
13、率的区间估计n总体率估计包括点估计和区间估计。点估计是直接用样本率总体率估计包括点估计和区间估计。点估计是直接用样本率来估计总体率。区间估计是根据样本提供的信息按一定的概来估计总体率。区间估计是根据样本提供的信息按一定的概率(即可信度)来估计总体率的可能范围。率(即可信度)来估计总体率的可能范围。n总体率的可信区间根据总体率的可信区间根据n和和P的大小一般有两种估计方法。的大小一般有两种估计方法。17现在学习的是第17页,共67页n 当当n足够大,足够大,P和和1-P均不太小时(可通过均不太小时(可通过nP与与n(1-P)均大于判断)均大于判断),n 样本率样本率P近似正态分布,这时可以利用正
14、态分布理论来估计总近似正态分布,这时可以利用正态分布理论来估计总体率的可信区间。体率的可信区间。n 可信度为可信度为1-1-的可信区间:的可信区间: n ppsupsup,18现在学习的是第18页,共67页n例例:n 某医院用复方当归注射液静脉滴注治疗脑动脉某医院用复方当归注射液静脉滴注治疗脑动脉硬化症硬化症188例,其中显效例,其中显效83例,试估计等量齐观例,试估计等量齐观方当归注射液显效率的方当归注射液显效率的95%和和99%可信区间。可信区间。n复方当归注射液静复方当归注射液静95%可信区可信区n(0.44151.960.036,0.44151.960.036) n =(0.3709,
15、0.5121)=(37.09% ,51.21%)036. 01885585. 04415. 01nppSp19现在学习的是第19页,共67页nB查表法查表法 n 如果如果n,pn,p不符合上述要求,当不符合上述要求,当n50n50,特别是,特别是P P很接近很接近0 0或或1 1时,样本资料呈二项分布,可用二项分布法估计时,样本资料呈二项分布,可用二项分布法估计总体率的可信区间。该法计算繁杂,附表总体率的可信区间。该法计算繁杂,附表3 3列出了总列出了总体率的体率的95%95%和和99%99%可信区间,可信区间,n例例5.5 从某学校随机抽取从某学校随机抽取26名学生,发现有名学生,发现有4名
16、感染沙眼,名感染沙眼,试求该校沙眼感染率试求该校沙眼感染率95%可信区间。可信区间。n本例本例n=26,X=4,查附表,查附表3的可信度为的可信度为95%的可信区间的可信区间为(为(0.04,0.35),即(),即(4%,35%)。)。20现在学习的是第20页,共67页n注意注意:n附表附表3 3中中X X值只列出值只列出 时,时,n可以用可以用n-Xn-X查表,然后以查表,然后以100%100%减去查的区间即为减去查的区间即为所求的可信区间所求的可信区间n例例5.6 5.6 某县抽查了某县抽查了1010名人员的乙型肝炎表面抗原名人员的乙型肝炎表面抗原(HBsAgHBsAg)携带情况,阴性者)
17、携带情况,阴性者8 8人,求该县人群人,求该县人群HbsAgHbsAg阴性率的阴性率的95%95%可信区间为可信区间为 若若x n/2 ,则按,则按n-x 查表得?,然后查表得?,然后100-?例:上题若例:上题若 X=8,则,则 n-x=10-8=2查表得:查表得:3% 56%然后然后100-?得:?得:44% 97%2nX 2nX 21现在学习的是第21页,共67页(2)样本率与总体率比较)样本率与总体率比较1)直接计算概率法)直接计算概率法例例:据据以以往往经经验验,新新生生儿儿染染色色体体异异常常率率一一般般为为 1%,某某医医院院观观察察了了当当地地 400 名名新新生生儿儿,只只有
18、有 1 例例染染色色体体异异常常,问问该该地地新新生生儿儿染染色色体体异异常常率率是是否否低低于于一一般般。 H0: 1 = 0 =0.01H1: 1 0 =0.01 单侧单侧 = 0.050905. 0)01. 0()99. 0()!1400( ! 1!400(0.99) )1()0()1(1400400 PPXPP,按,按=0.05水准,不拒绝水准,不拒绝H0,故不能认为该地新生儿染色体异常率低,故不能认为该地新生儿染色体异常率低于一般新生儿。于一般新生儿。22现在学习的是第22页,共67页n 例如例如5.7 一种鸭通常感染某种传染病的概率是一种鸭通常感染某种传染病的概率是0.2,现将一种
19、,现将一种药物注射到药物注射到25只鸭后发现有只鸭后发现有1只鸭发生感染,试推断这种只鸭发生感染,试推断这种药对预防感染是否有效药对预防感染是否有效nHo: 此药物对预防感染无效此药物对预防感染无效 即即=0.2 nH1: 此药物对预防感染有效此药物对预防感染有效 即即 0 =0.2 单侧单侧 = 0.05nPu)1( 06. 5304)2 . 01(2 . 020. 0316. 0 u24现在学习的是第24页,共67页(3)两样本率比较(近似正态法)两样本率比较(近似正态法) n1 p1、n1( 1-p1)和)和n2 p2、n2( 1-p2) 5时时)11)(1(2121nnppppucc
20、例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研究者随机抽取该地究者随机抽取该地80名男生和名男生和85名女生,查得感染人数男生名女生,查得感染人数男生23人,女生人,女生13人。请作统计分析。人。请作统计分析。H0: 1 = 2H1: 1 2 = 0.0509. 2)851801)(2182. 01(2182. 01529. 02875. 02182. 0)8580/()1323(1529. 085/13P 2875. 080/2321 uPPC25现在学习的是第25页,共67页PoissonPoisson分布分布一一.概念:概念:
21、 是二项分布的特例。当是二项分布的特例。当很小,而很小,而n很大时,则二项分布逼近很大时,则二项分布逼近Poisson分布。分布。例如:例如:每毫升水中大肠杆菌数的分布。每毫升水中大肠杆菌数的分布。粉尘在单位容积内计数的分布。粉尘在单位容积内计数的分布。放射性物质在单位时间内放射出质点数的分布。放射性物质在单位时间内放射出质点数的分布。单位空间中某些野生动物或昆虫数的分布。单位空间中某些野生动物或昆虫数的分布。一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布。一般用于研究单位容积(或面积、时间)内某事件发生数。(小概一般用于研
22、究单位容积(或面积、时间)内某事件发生数。(小概率事件出现的规律性)率事件出现的规律性)26现在学习的是第26页,共67页二二. Poisson分布的概率:分布的概率:= n为为Poisson分布的总体均数;分布的总体均数;!)(XeXPX X=0,1,2,式中:式中:X为单位时间(或面积、容积等)某事件发生数;为单位时间(或面积、容积等)某事件发生数;e为自然对数的底,为自然对数的底,e2.71828从式中可知,从式中可知,为为Poisson分布的唯一参数。分布的唯一参数。X服从以服从以为参数的为参数的Poisson分布,可记为分布,可记为XP()。)。递推公式:递推公式: eP)0(1)(
23、)1( XXpXP 27现在学习的是第27页,共67页例:据以往经验,新生儿染色体异常率一般为例:据以往经验,新生儿染色体异常率一般为1%,试分别用二项,试分别用二项分布及分布及Poisson分布原理,求分布原理,求100名新生儿中发生名新生儿中发生X例(例(X=0,1,2,)染色体异常的概率。)染色体异常的概率。 1.按二项分布原理求按二项分布原理求P(X) XXXXXP)01. 0()99. 0()!100( !100)(100 3660. 0)01. 0()99. 0(!100! 0!100)0(0100 P3697. 0)01. 0()99. 0()!1100( ! 1!100)1(1
24、1100 P同理,可求得同理,可求得P(2),),P(3)等。)等。28现在学习的是第28页,共67页(2)按)按Poisson分布原理求分布原理求P(X):=n=1000.01=1367880. 071828. 2)0(1 P 367880. 010/1367880. 010)1( PP同理,可求得同理,可求得P(4),),P(5)等。)等。18394.011/1367880.011)2( PP0613. 012/11839. 012)3( PP(1)递推公式:递推公式:29现在学习的是第29页,共67页!)(XeXPX 36788. 07183. 20.)0(1110eeXP36788.
25、07183. 21.1.) 1(1111eeXP18394. 036788. 05 . 07183. 2! 21! 2! 2.)2(121212eeXP0613. 07183. 21666. 0.! 3! 3.)3(11313eeXP(2)公式:公式:30现在学习的是第30页,共67页 由表可见,对由表可见,对很小,很小,n很大的同一资料用二项很大的同一资料用二项 布法与布法与Poisson分布法计算结果是很接近的。但分布法计算结果是很接近的。但 Poisson分布的分布的 P(X)的计算较为简便。的计算较为简便。二二项项分分布布及及 Poisson 分分布布概概率率计计算算结结果果 P(X)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 二项分布 分布
限制150内