离散型随机变量的分布精选PPT.ppt
关于离散型随机变量的分布第1页,讲稿共28张,创作于星期二第一节第一节 二项分布二项分布一、二项分布的定义一、二项分布的定义P98P98(Binomial Distribution)(Binomial Distribution)二项分布是从著名的二项分布是从著名的贝努里实验贝努里实验中推导出来中推导出来的。所谓贝努里实验是指只有两种可能结的。所谓贝努里实验是指只有两种可能结果的随机实验。果的随机实验。二项分布是一种应用非常广泛,也非常重二项分布是一种应用非常广泛,也非常重要的一种分布。要的一种分布。第2页,讲稿共28张,创作于星期二我们以投硬币为例,投一次硬币,只有两种结果,正面朝上或我们以投硬币为例,投一次硬币,只有两种结果,正面朝上或反面朝上,单次实验就形成一个二点分布;正面朝上的次数取反面朝上,单次实验就形成一个二点分布;正面朝上的次数取值只有两个,要么值只有两个,要么1 1次,要么次,要么0 0次;我们这样来表达:次;我们这样来表达:P(X=1)=pP(X=1)=p,P(X=0)=qP(X=0)=q接下来,我们来四次掷币,每次抛币都不会影响下一次抛币的结果,接下来,我们来四次掷币,每次抛币都不会影响下一次抛币的结果,所以是独立实验;所以是独立实验;正面朝上的次数正面朝上的次数这个这个随机变量的取值随机变量的取值就不会只就不会只是两个,而是会有是两个,而是会有4 41 1个取值。即:正面出现个取值。即:正面出现0 0次和次和1 1、2 2、3 3、4 4次。次。我们用小我们用小p p来表示正面朝上的概率,用来表示正面朝上的概率,用q q来表示反面朝上的概率,我来表示反面朝上的概率,我们把们把X X的取值相应写成:的取值相应写成:X=0,X=1,X=2,X=3,X=4 X=0,X=1,X=2,X=3,X=4,来求这个随机,来求这个随机变量变量X X的概率分布。的概率分布。第3页,讲稿共28张,创作于星期二(1 1)X=0X=0时,时,P(XP(X0)0)1/2*1/2*1/2*1/2=q*q*q*q=1/161/2*1/2*1/2*1/2=q*q*q*q=1/160.06250.0625(2 2)X=1 X=1时,时,P(X=1)=p*q*q*q*4=1/4P(X=1)=p*q*q*q*4=1/40.250.25(3 3)X=2 X=2时,时,P(X=2)=p*p*q*q*6=6/16P(X=2)=p*p*q*q*6=6/160.3750.375(4 4)X=3X=3时,时,P(X=3)=p*p*p*q*4=1/4P(X=3)=p*p*p*q*4=1/40.250.25(5 5)X=4 X=4时,时,P(X=4)=p*p*p*p=1/16P(X=4)=p*p*p*p=1/160.06250.0625第4页,讲稿共28张,创作于星期二我们推广到我们推广到n n次,则可以写出一般性的次,则可以写出一般性的二项分布二项分布的的概率分布概率分布公式:公式:(X (X共有共有n+1n+1个取值个取值)第5页,讲稿共28张,创作于星期二二项分布的定义如果在相同条件下进行如果在相同条件下进行n n次独立试验,每次试验只有次独立试验,每次试验只有2 2种可能的结果,事件种可能的结果,事件A A出现的概率出现的概率P(A)=p,P(A)=p,事件事件A A不出现的概率不出现的概率P()=q,P()=q,那么,那么,n n次试验中事件次试验中事件A A出出现次数(随机变量现次数(随机变量X X)的概率分布为:)的概率分布为:x=(0,1,2,.n)x=(0,1,2,.n),可以简写为:可以简写为:B(nB(n,p)(Binomial Distribution)p)(Binomial Distribution),其中其中n n为独立试验次数,为独立试验次数,p p为每次试验中为每次试验中A A出现的概出现的概率。率。第6页,讲稿共28张,创作于星期二由于由于p pq q1 1,所以只要知道了,所以只要知道了n n和和p p,该二项分布,该二项分布就已经被确定。我们可以不用计算,而是通过查表就已经被确定。我们可以不用计算,而是通过查表的方法非常方便的了解随机变量的概率分布的全貌。的方法非常方便的了解随机变量的概率分布的全貌。二项分布表的用法。二项分布表的用法。第7页,讲稿共28张,创作于星期二随机随机变量取值在某一区间内的概率:变量取值在某一区间内的概率:(1 1)事件)事件A A至多(最多)出现至多(最多)出现m m的概率:的概率:(2 2)事件)事件A A至少出现至少出现m m次概率:次概率:(3 3)事件)事件A A出现次数不少于出现次数不少于a a,不大于,不大于b b的概率为:的概率为:(4 4)事件)事件A A出现的全部概率之和:出现的全部概率之和:第8页,讲稿共28张,创作于星期二二、二项分布的讨论二、二项分布的讨论(1 1)二项分布是)二项分布是离散型随机变量离散型随机变量的分布。的分布。X X的取值有的取值有n+1n+1个。个。(2 2)二项分布的图形当)二项分布的图形当p=0.5p=0.5时是时是对称对称的;当的;当p p0.50.5时则是非对称的。时则是非对称的。但是当但是当n n越大的时候,越趋向于对称。越大的时候,越趋向于对称。(3 3)二项分布的特征值:)二项分布的特征值:(4 4)二项分布由概率)二项分布由概率p p和实验次数和实验次数n n两个参数决定,也可以简单记两个参数决定,也可以简单记为为B(nB(n,p)p)。(5 5)二项分布的概率值即可以通过公式计算,也可以通过查表求得。)二项分布的概率值即可以通过公式计算,也可以通过查表求得。(6 6)二项分布的特点是,已经知道两种结果发生的概率,实际)二项分布的特点是,已经知道两种结果发生的概率,实际上对总体的情况已经有所了解。这是求抽样时(任何样本量下)上对总体的情况已经有所了解。这是求抽样时(任何样本量下)每得到一个样本个体的概率。每得到一个样本个体的概率。第9页,讲稿共28张,创作于星期二【例】根据生命表,年龄为【例】根据生命表,年龄为6060岁的人,可望活到下年的概率是岁的人,可望活到下年的概率是0.950.95。设某单位年龄为。设某单位年龄为6060岁的人共有岁的人共有1010人,问:人,问:(1 1)其中)其中9 9人活到下年的概率为多少?人活到下年的概率为多少?(2 2)至少有)至少有9 9人活到下年的概率是多少?人活到下年的概率是多少?解:任选一人能否活到下一年与他人无关,因此是独立事件。因为只有解:任选一人能否活到下一年与他人无关,因此是独立事件。因为只有两种结果,所以符合二项分布。两种结果,所以符合二项分布。n=10n=10,p=0.95p=0.95第10页,讲稿共28张,创作于星期二【例例2 2】一场火星文的考试,共一场火星文的考试,共1010道单项选择题(五选一),你道单项选择题(五选一),你随机猜测答案。试问:随机猜测答案。试问:(1 1)能够及格的概率是多少?)能够及格的概率是多少?(2 2)一道也答不对的概率是多少?)一道也答不对的概率是多少?(3 3)答对)答对1 13 3道的概率是多少?道的概率是多少?(4 4)答对的期望值和方差。)答对的期望值和方差。解:由题意得,解:由题意得,p=0.2p=0.2,n=10 n=10,第11页,讲稿共28张,创作于星期二【练习【练习1 1】按照以往的经验,你在】按照以往的经验,你在5 5点半到点半到5 5点点4040这段晚高峰内这段晚高峰内等到公共汽车的概率是等到公共汽车的概率是9090。一个星期内。一个星期内(周一到周五)(周一到周五)你每你每天下班(天下班(5 5:3030)时等车都不会超过)时等车都不会超过1010分钟概率时多少?至少分钟概率时多少?至少有有2 2天等车会超过天等车会超过1010分钟的概率是多少?分钟的概率是多少?求求期望值和方差。期望值和方差。【练习【练习2 2】设离散型随机变量】设离散型随机变量 ,概率,概率 ,求:,求:(1 1)参数)参数p p值;值;(2 2)概率)概率P(X=2)P(X=2);(3 3)数学期望)数学期望 ;(;(4 4)方差)方差【例【例3 3】某人在每天上班途中要经过】某人在每天上班途中要经过3 3个设有红绿灯的十字路个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相互独立的,且红灯持口。设每个路口遇到红灯的事件是相互独立的,且红灯持续续2424秒而绿灯持续秒而绿灯持续3636秒。试求他途中遇到红灯的次数的概率秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。分布及其期望值和方差、标准差。第12页,讲稿共28张,创作于星期二【练习【练习1】按照以往的经验,你在】按照以往的经验,你在5点半到点半到5点点40这段晚高峰内这段晚高峰内等到公共汽车的概率是等到公共汽车的概率是90。一个星期内。一个星期内(周一到周五)(周一到周五)你每你每天下班(天下班(5:30)时等车都不会超过)时等车都不会超过10分钟概率时多少?至少分钟概率时多少?至少有有2天等车会超过天等车会超过10分钟的概率是多少?分钟的概率是多少?求求期望值和方差。期望值和方差。第13页,讲稿共28张,创作于星期二第14页,讲稿共28张,创作于星期二第二节第二节 超几何分布超几何分布(Hypergeometric distributionHypergeometric distribution)一、超几何分布一、超几何分布二项分布的适用有一个非常重要的条件,那就是独立实验,只有在大群体的情况下,这种独立实验的要求才能近似的得到满足。但如果研究对象不是社区、大群体,而是一个小群体,比如是一个班组或者一个科室等等,这时总体不大,一般最多只有几十个人。假定总体分为两类A和非A,如果这是从总体中抽取n名,那么每个抽取对象出现A类的概率将不再恒定,也就是不满足二项分布所要求的独立实验的条件。超几何分布将适合这类小群体研究小群体研究。第15页,讲稿共28张,创作于星期二【例【例1 1】设小组共有】设小组共有1010名成员,名成员,7 7男男3 3女。任抽女。任抽3 3名,问其中男性的名,问其中男性的概率分布。概率分布。【解】根据题意有【解】根据题意有N N10 10 男男7 7 女女3 n3 n3 3第16页,讲稿共28张,创作于星期二超几何分布定义定义:总体性质共分两类:定义:总体性质共分两类:A A类与非类与非A A类。总体总数为类。总体总数为N N,A A类类K K个,设从总体中任抽个,设从总体中任抽n n个个(nN-KnN-K),则),则n n中含有中含有A A类个数类个数X X的概率分布为:的概率分布为:注意:(注意:(1)为什么是)为什么是nN-K?(2)X的取值是的取值是n+1或者或者K1,取小的那个。,取小的那个。第17页,讲稿共28张,创作于星期二二、超几何分布的数学期望和方差:二、超几何分布的数学期望和方差:如果用如果用p=K/N q=1-pp=K/N q=1-p,则有:,则有:第18页,讲稿共28张,创作于星期二【例【例1 1】以随机方式自】以随机方式自5 5男男3 3女的小群体中选出女的小群体中选出5 5人组成一个委人组成一个委员会,求该委员会中女性人数的概率分布,期望值和变异员会,求该委员会中女性人数的概率分布,期望值和变异数。数。第19页,讲稿共28张,创作于星期二【练习【练习1 1】班里学生】班里学生3030名名,兄弟民族有兄弟民族有1313名名,问任抽问任抽5 5名名,抽中抽中兄弟民族人数的概率分布。兄弟民族人数的概率分布。解:解:由题意由题意得得:N=30 N=30,K=13K=13,n=5 n=5,X X有有6 6个取值,代入超几何分个取值,代入超几何分布公式:布公式:第20页,讲稿共28张,创作于星期二三、超几何分布与二项分布三、超几何分布与二项分布的关系的关系超几何分布适合小群体研究,但如果群体规模逐渐超几何分布适合小群体研究,但如果群体规模逐渐增大,以致抽样个体间的改变可以忽略不计,这时增大,以致抽样个体间的改变可以忽略不计,这时也可以采用二项分布来讨论。且两种分布计算的结也可以采用二项分布来讨论。且两种分布计算的结果应该是逐渐的接近。数学上也可以证明,当果应该是逐渐的接近。数学上也可以证明,当N N很大很大(N N)时超几何分布将趋向于二项分布。)时超几何分布将趋向于二项分布。第21页,讲稿共28张,创作于星期二第三节第三节 泊松分布泊松分布(Poisson DistributionPoisson Distribution)一、泊松分布一、泊松分布泊松分布是由法国数学家泊松泊松分布是由法国数学家泊松Simeon Simeon Denis PoissonDenis Poisson提出的,提出的,PoissonPoisson对于对于小概小概率事件率事件特别着迷,特别是许多情况下可能特别着迷,特别是许多情况下可能出现的事件。他研究了在那个骑兵仍旧骑出现的事件。他研究了在那个骑兵仍旧骑马而不是用坦克的时代里普鲁士士兵被马马而不是用坦克的时代里普鲁士士兵被马踢死的人数的数据。他的成果发表于踢死的人数的数据。他的成果发表于18371837年。年。第22页,讲稿共28张,创作于星期二泊松利用二项分布的公式推导出泊松分布的公式:泊松利用二项分布的公式推导出泊松分布的公式:x x0 0,1 1,2 2,。,。(e=2.718)(e=2.718)泊松分布只有一个参数泊松分布只有一个参数,确定了,确定了,就确定了泊,就确定了泊松分布。松分布。第23页,讲稿共28张,创作于星期二二、泊松分布的性质二、泊松分布的性质(1 1)泊松分布随机变量)泊松分布随机变量X X的取值为的取值为0 0和一切正整数。比如被马踢和一切正整数。比如被马踢死了几个人。死了几个人。(2 2)泊松分布图形是非对称的,但是随着)泊松分布图形是非对称的,但是随着的增大,图形将变得的增大,图形将变得接近对称。接近对称。(3 3)泊松分布的数学期望和方差:)泊松分布的数学期望和方差:E(X)=E(X)=D(X)=D(X)=泊松分布的这个性质很重要,在泊松分布的这个性质很重要,在N N较大,较大,p p较小的情况下,我们只较小的情况下,我们只要确定了要确定了X X的期望值(出现概率最大的那个值)实际上就是的期望值(出现概率最大的那个值)实际上就是,这时这时就可以确定这个随机变量的分布了。就可以确定这个随机变量的分布了。第24页,讲稿共28张,创作于星期二【例例】见张彦教材见张彦教材P131P131,发生在,发生在1875187518941894年普鲁士年普鲁士军队中,军队中,1010个师团被马踢死士兵的事故记录如下表。个师团被马踢死士兵的事故记录如下表。试与泊松理论分布相比较。试与泊松理论分布相比较。分析:分析:要了解泊松分布的理论分布,必须要知道参数要了解泊松分布的理论分布,必须要知道参数,根据泊松分布的根据泊松分布的非常重要的性质非常重要的性质=E(X)=D(X)=E(X)=D(X),如,如果我们知道了数学期望或者方差就可以知道果我们知道了数学期望或者方差就可以知道了。了。第25页,讲稿共28张,创作于星期二【例例】已知任抽一张卡片,上面的错字数服从泊松分已知任抽一张卡片,上面的错字数服从泊松分布。现在有布。现在有10001000张卡片,一共有错字张卡片,一共有错字300300个,求所抽个,求所抽卡片上错字数的概率分布。卡片上错字数的概率分布。【解】X一张卡片上的错字数,x=0,1,2,.300,=E(X),平均每张卡片上出现的错字数实际上是X的期望值,E(X)=0.3介绍表的查法,介绍表的查法,VERY TRICKYVERY TRICKY!这个表中的这个表中的X X实际上指的是实际上指的是“至少至少X”X”第26页,讲稿共28张,创作于星期二三、二项分布和泊松分布的三、二项分布和泊松分布的关系关系泊松发现,二项分布下,当泊松发现,二项分布下,当n n趋向无穷,趋向无穷,p p同时趋向于同时趋向于0 0时,二时,二项分布趋向于泊松分布。由此表明,当项分布趋向于泊松分布。由此表明,当n n很大,很大,p p很小的时候,我很小的时候,我们可以将二项分布当作泊松分布来计算,这时们可以将二项分布当作泊松分布来计算,这时npnp。如果。如果n n很大的话查二项分布的表就非常困难了,所以很大的话查二项分布的表就非常困难了,所以我们规定:我们规定:当当n20n20,p0.05p0.05时,就可近似采用泊松分布。时,就可近似采用泊松分布。教材规定:教材规定:n10n10,p0.1p0.1第27页,讲稿共28张,创作于星期二2022/10/14感感谢谢大大家家观观看看第28页,讲稿共28张,创作于星期二