《几种常见概率分布.ppt》由会员分享,可在线阅读,更多相关《几种常见概率分布.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现在学习的是第1页,共38页主要内容:第一节二项分布第一节二项分布第二节泊松分布第二节泊松分布第三节正态分布第三节正态分布现在学习的是第2页,共38页一、贝努利试验及其概率公式一、贝努利试验及其概率公式(一)独立试验和贝努利试验(一)独立试验和贝努利试验 对于n次独立的试验,如果每次试验结果出现且只出现对立事件 与 之一; 在每次试验中出现A的概率是常数p(0p0,q0,p+q=1),则称随机变量X服从参数为n和p的二项分布,记为( ),0,1,2.,xxn xnnP xp qxnC()( ),0,1,2.,xxn xnnnP XxP xp qxnC),(pnBx现在学习的是第4页,共38页现
2、在学习的是第5页,共38页现在学习的是第6页,共38页(二)二项分布的性质(二)二项分布的性质二项分布是一种离散型随机变量的概率分布,由n和p两个参数决定,参数n称为离散参数离散参数,只能取正整数;p是连连续参数续参数,取值为0与1之间的任何数值。 二项分布具有概率分布的一切性质,即: (x=0,1,2,n) 二项分布的概率之和等于1,即:()( )0nP XxP x0()1nxxn xnnxC p qqp现在学习的是第7页,共38页上面 是二项分布概率的基本性质; 是我们在运算中经常要根据题目要求运算时要应用到的,要注意理解。0()()mxxn xnnxP XmP xmC p q()()nx
3、xn xnnx mP XmP xmC p q21121212()()()mxxn xnnx mP mXmP mxmC p qmm现在学习的是第8页,共38页 三、二项分布的平均数与标准差三、二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变量之平均数、标准差与参数n、p有如下关系: npqnp现在学习的是第9页,共38页四、二项分布的概率计算及其应用条件四、二项分布的概率计算及其应用条件(一)概率计算(一)概率计算 二项分布的概率计算,可以直接利用二项概率公式进行。把时间A发生的次数k代入公式即可求得对应的概率。 例例 有一批种蛋,其孵化率为0.85,今在该批种蛋中任选6枚
4、进行孵化,试给出孵化出小鸡的各种可能情况的概率。 这个问题属于贝努里模型,其中 ,孵化6枚种蛋孵出的小鸡数x服从二项分布 .其中x的可能取值为0,1,2,3,4,5,6。85. 0, 6pn15. 085. 01q)85. 0 , 6(B现在学习的是第10页,共38页00001139.0)15.0()15.0()85.0()0(660066 CP00038728. 0)15. 0()85. 0( 6)15. 0()85. 0() 1 (51161166CP00548648. 0)15. 0()85. 0(15)15. 0()85. 0() 2(42262266CP04145344. 0)15.
5、 0()85. 0(20)15. 0()85. 0() 3 (33363366CP17617711. 0)15. 0()85. 0(15)15. 0()85. 0() 4(24464466CP39933478. 0)15. 0()85. 0(6)15. 0()85. 0()5(15565566CP37714952.0)85.0()15.0()85.0()6(6066666CP思考:求至少孵出3只小鸡的概率是多少?孵出的小鸡数在2-5只之间的概率是多大?其中:现在学习的是第11页,共38页应用条件:应用条件: n个观察单位的观察结果互相独立观察结果互相独立; 各观察单位只具有互相对立的一种结果只
6、具有互相对立的一种结果,如阳性或 阴性,生存或死亡等,属于二项分类资料。 已知发生某一结果已知发生某一结果(如死亡) 的概率为的概率为p p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值。现在学习的是第12页,共38页 泊松分布是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件稀有事件的分布。所谓稀有事件即为小概率事件。要观察到这类事件,样本含量n必须很大 。在生物、医学研究中,服从泊松分布的随机变量是常见的。 由于泊松分布是描述小概率事件的,二项分布中p很小,n很大时,可使用泊松分布现在学习的是第13页,共38页 泊松分布常用于描述在某一指定时
7、间内或在某一指定范围内,源源不断出现的稀有事件个数的分布。 例如,120急救中心每天接到要求服务的呼叫次数;每天到达机场的飞机数;在早上(7:00 8:00)交通高峰期间通过某一道口的机动车数;纺织品在单位面积上的疵点数等等。 现在学习的是第14页,共38页一、泊松分布的意义一、泊松分布的意义(一)定义(一)定义 若随机变量X(X=x)只取零和正整数值,且其概率分布为 其中x=0,1,;0;e=2.7182是自然对数的底数,则称X服从参数为的泊松分布记为X XP(P() )。(二)特征(二)特征 泊松分布作为一种离散型随机变量的概率分布有一个重要的特征。这就是它的平均数平均数和方差方差相等,都
8、等于常数都等于常数 ,即=2 2= = 。利用这一特征, 可以初步判断一个随机变量是否服从泊松分布()!xP Xxex现在学习的是第15页,共38页现在学习的是第16页,共38页二、泊松分布的概率计算二、泊松分布的概率计算 是是泊松分布所依赖的唯一参数所依赖的唯一参数。泊松分布的概率计算,只要参数确定了,问题就解决了。把x=0,1,2,代入公式即可求得各项的概率。但是在大多数服从泊松分布的实例中,分布参数往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数从所观察的随机样本中计算出相应的样本平均数作为作为的估计值的估计值。现在学习的是第17页,共38页 例例 我们调查了200个奶牛场,
9、统计各场某10年内出现的怪胎(如缺皮症,全身无毛等)的头数,然后以怪胎头数把200个奶牛场分类,统计每类中奶牛场数目,结果如下:试研究10年内母牛怪胎数的概率分布。1010年内母牛产怪胎次数年内母牛产怪胎次数(m m)0 01 12 23 34 4总总 计计奶牛场数(奶牛场数(f f)1091096565 2222 3 31 1200200现在学习的是第18页,共38页先假设假设母牛产怪胎数的概率分布为泊松分布。根据观察结果计算每一奶牛场10年内母牛产怪胎的平均数 ,根据加权法可得: 用 =0.61估计 ,代入 计算当m=0,1,2,3,4时的概率和理论次数怪胎数(怪胎数(m m)0 01 1
10、2 23 34 4总总 计计实际次数实际次数(f f)109109656522223 31 1200200概概 率(理论)率(理论)0.54340.54340.33140.33140.10110.10110.0200.0206 60.00310.00310.99960.9996理理 论论 次次 数数108.68108.6866.2866.2820.2220.224.124.120.620.62199.92199.92xx61. 020014332221650109nfxx()!xP Xxex现在学习的是第19页,共38页 下面我们再来证实我们所得的资料是否具有泊松分布的特征。 已经计算出 =0
11、.61,样本方差计算如下, 与很接近,这正是泊松分布所具有的特征611. 0199200/122413322216501091/)(222222222nnfmfmSxx2S现在学习的是第20页,共38页一、正态分布的定义及其特征一、正态分布的定义及其特征(一)定义(一)定义 若连续性随机变量若连续性随机变量X X的概率分布密度函数为:的概率分布密度函数为: 其中,其中,为平均数,为平均数,2 2 为方差,则称随机变量为方差,则称随机变量服从正态分布服从正态分布, ,记为记为N(N(, ,2 2).).相应的概率分布函数为相应的概率分布函数为0,21)(222)(xexfxxxexF222)(2
12、1)(现在学习的是第21页,共38页(二)特征(二)特征正态分布密度曲线是以= 为对称轴的单峰、对称单峰、对称的悬钟形;悬钟形;f(x)在=处达到极大值,极大值为f(x)是非负数,以x轴为渐进线;曲线在 处各有一个拐点;正态分布正态分布密度函数曲线密度函数曲线 21)(f现在学习的是第22页,共38页正态分布有两个参数,即平均数和标准差。是位置参数位置参数,是变异度参数变异度参数。分布密度曲线与横轴所夹的面积为1,即:正态分布正态分布密度函数曲线密度函数曲线 121)(222)(dxexPx现在学习的是第23页,共38页 相同而相同而不同的三个正态总体不同的三个正态总体 相同而相同而不同的三个
13、正态总体不同的三个正态总体现在学习的是第24页,共38页二、标准正态分布二、标准正态分布standard normal distribution(一)定义(一)定义 由于正态分布是依赖于参数 和(或)的一簇分布,造成研究具体正态总体时的不便。因此将一般的(,2)转换为=0, =0, 2 2=1=1的正态分布,则称=0, =0, 2 2=1=1的正态分布为标准正态分布标准正态分布。标准正态分布的概率密度函数及分布函数如下:若随机变量U U服从标准正态分布,记作U(0, 1)dee222221)(,21)(现在学习的是第25页,共38页现在学习的是第26页,共38页(二)标准化的方法(二)标准化的
14、方法 对于任何一个服从正态分布(,2)的随机变量X ,都可以通过标准化变换:u=(- )/ 即减平均数后再除以标准差减平均数后再除以标准差,将其变换为服从标准正态分布的随机变量。 对不同的u及P(Uu)值编成函数表,称为正态分布表,从中可以查到任意一个区间内曲线下的面积,即为概率。现在学习的是第27页,共38页现在学习的是第28页,共38页三、正态分布的概率计算三、正态分布的概率计算(一)标准正态分布的概率计算(一)标准正态分布的概率计算 设U服从标准正态分布,则u落在u1,u2内的概率dueuuuPuuu21222121)(duedueuuuu1222222121)()(12uu可由附表查得
15、与而)()(12uu现在学习的是第29页,共38页99. 0)58. 258. 2(95. 0)96. 196. 1(9973. 0) 33(9545. 0)22(6826. 0) 11(uPuPuPuPuP99. 0)58. 258. 2(95. 0)96. 196. 1(9973. 0)33(9545. 0)22(6826. 0)(uPuPuPuPuP应熟记的几种标准正态分布概率应熟记的几种标准正态分布概率现在学习的是第30页,共38页(二)一般正态分布的概率计算(二)一般正态分布的概率计算 将区间的上下限标准化将区间的上下限标准化,服从正态分布的随机变量落在1,2内的概率,等于服从标准正
16、态分布的随机变量落在 的概率。然后查标准正态分布的概率表查标准正态分布的概率表 例例 若服从=30.26,2 =5.102的正态分布,试求P(21.64x32.98)。 令u=(-30.26)/5.10,则u服从标准正态分布,故/,/21xx21.64 30.2630.2632.98 30.26(21.6432.98)()5.105.105.10( 1.600.53)(0.53)( 1.69)0.6564xPxPPu 现在学习的是第31页,共38页(三)双侧(两尾)概率与单侧(一尾)概率(三)双侧(两尾)概率与单侧(一尾)概率随机变量x落在平均数加减不同倍数标准差区间之外的概率称为双侧概率(两
17、尾概率)双侧概率(两尾概率),记作 对应于双侧概率可以求得随机变量x小于-k或大于+k的概率,称为单侧概率(一尾概率)单侧概率(一尾概率),记作/2 如x落在(-1.96,+1.96) 之外的双侧概率为0.05,而单侧概率为0.025。即025. 0)96. 1()96. 1(005. 0)58. 2()58. 2(xPxPxPxP)()(kxPkxP2/)()(kxPkxP现在学习的是第32页,共38页标准正态双侧分位数的查法:附表附表3 3 标准正态分布 ) 1 , 0( Nu2uuuu(双侧)表示 的上侧临界值表示 的下侧临界值或表示 的双侧临界值正态分布正态分布密度函数曲线密度函数曲线
18、 为双侧临界值为双侧概率,其中uuuuPuuP0)(1)(现在学习的是第33页,共38页 例例 假设 ,求下列概率: 1. ; 2. ; 3. ; 4. 。 解解 1. 2. 3. 4. 现在学习的是第34页,共38页 如果 ,则 于是,在正态分布与标准正态分布的概率密度f(x)和(u) 、分布函数F(x) 和(u) 之间存在下列关系式: 这就是说,计算任一正态分布随机变量的概率都能通过标准正态分布来实现。 现在学习的是第35页,共38页 正态分布在概率论和统计学的研究及应用中具有极其重要的作用,它在各种概率分布中居首要地位,是抽样和抽样分布的理论基础。这是因为: 1.客观世界的许多现象都可以
19、利用正态分布来近似地描述其统计规律性。例如,人的身高和体重等,都可以看作是具有“两头小,中间大”分布特征的随机变量,一般可以认为是近似服从正态分布的。 2.正态分布是许多重要分布的极限分布。例如可以用正态分布来近似二项分布。 3.正态分布在统计推断中有重要的应用。例如t分布,F分布和 分布都是服从正态分布的随机变量的函数。现在学习的是第36页,共38页四、三种重要的概率分布之间的关系四、三种重要的概率分布之间的关系 前面讨论的三个重要的概率分布中,前两个概率分布属离散型的,后一个属连续型的。三者间的关系综述如下: 对于二项分布,在n,p0,且np=(较小常数)情况下,二项分布趋于泊松分布。在这种场合,泊松分布中的参数用二项分布的np代之; 在n,p0.5时,二项分布趋于正态分布。在这种场合,正态分布中的、2用二项分布的np、npq代之。现在学习的是第37页,共38页二项分布泊松分布正态分布 p0.1 nP0.1 n在实际计算中,当p0.1且n很大时,二项分布可由泊松分布近似,当p0.1且n很大时,二项分布可由正态分布近似。现在学习的是第38页,共38页
限制150内