《几种重要的分布课件.pptx》由会员分享,可在线阅读,更多相关《几种重要的分布课件.pptx(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1在第一章介绍过独立试验概型在第一章介绍过独立试验概型knkknqpCkP 作作n次相互独立的试验次相互独立的试验, 每次试验事件每次试验事件A出现出现的概率为的概率为p, 不出现的概率为不出现的概率为q=1 p, n次试验次试验中事件中事件A出现的次数出现的次数 为一离散型随机变量为一离散型随机变量, 如假设第如假设第i次试验时事件次试验时事件A发生的次数为随发生的次数为随机变量机变量 i, 则则 i服从服从0-1分布分布,P i=1=p, P i=0=q=1 p, (i=1,2,.,n)因此有因此有 = 1+ 2+.+ n2 二项分布二项分布定义定义 4.1 如果随机变量有概率函数其中其中
2、0p1, q=1 p, 则称则称 服从参数为服从参数为n,p的二项的二项分布分布. 简记作简记作 B(n,p). 在这里在这里P =k的值恰好是二项式的值恰好是二项式(q+px)n展开展开式中第式中第k+1项项xk的系数的系数.如果如果 B(n,p), 则则 可看作是由可看作是由n个取个取1概率为概率为p的相互独立的的相互独立的0-1分布的随机变量分布的随机变量 i,i=1,2,.,n的和的和, = 1+ 2+.+ n), 1 , 0(nkqpCkPpknkknk3的分布函数为mlkknkknmkknkknxkknkknqpCmlPmlAqpCmPmAqpCxF0)(0的概率是不大于出现次数不
3、小于事件次的概率是至多出现事件4例1 某工厂每天用水量保持正常的概率为3/4, 求最近6天内用水量正常的天数的分布.解 设最近6天内用水量保持正常的天数为, 则B(6,0.75), 因此178. 04360044. 0414310002. 041045166PCPP5其分布表如下表所示0123456P0.0002 0.0044 0.033 0.1318 0.2966 0.3560.178分布图:0.0000.0000.0500.0500.1000.1000.1500.1500.2000.2000.2500.2500.3000.3000.3500.3500.4000.4000 01 12 23
4、34 45 56 6P P6例2 10部机器各自独立工作, 因修理调整的原因, 每部机器停车的概率为0.2. 求同时停车数目的分布.解 B(10,0.2), 用贝努里公式计算pk如下表所示012345678910P0.110.270.30.20.090.030.010.00.00.00.07概率分布图如下图所示0.000.000.050.050.100.100.150.150.200.200.250.250.300.300 01 12 23 34 45 56 67 78 89 910108 二项分布的最可能值二项分布的最可能值使概率使概率P =k取最大值的取最大值的k0称为二项分布的称为二项分
5、布的最可能值最可能值, 如图示意如图示意由上图可知P(=k0)P(=k0+1)且P(=k0)P(=k01)k0k0+1 k0+2k01k02.9pnpkpnpkpnpqkpknqpCqpCkpnpkpnqkpknqpCqpCkknnknkknknCCknkknknkknknkknknkknknkn0000111000011111,11) 1()(,) 1(1) 1(1!)!1()!1()!( !000000000000即再由得由因10所以二项分布的最可能值所以二项分布的最可能值 10非整数时当pnppnppnppnpk11例例3 一批产品的废品率一批产品的废品率p=0.03, 进行进行20次次
6、重复抽样重复抽样(每次抽一个每次抽一个, 观察后放回去再抽观察后放回去再抽下一个下一个), 求出现废品的频率为求出现废品的频率为0.1的概率的概率.解解 令令 表示表示20次重复抽取中废品出现的次次重复抽取中废品出现的次数数, B(20, 0.03)0988. 097. 003. 0)2(1 . 020182220CPP12二项分布的期望和方差如B(n,p), 则可看作n个相互独立的0-1分布的随机变量1,2,.,n之和,=1+2+.+n而且我们知道0-1分布的期望为p, 方差为pq,因此易得E=E1+E2+.+En=npD=D1+D2+.+Dn=npq即npqnpqDnpE,13一些例子如果
7、是反复地掷硬币试验掷了100次, 则B(100, 0.5), 最可能值是1000.5+0.5=50+0.5=50如果B(1000,0.3), 则最可能值是10000.3+0.3=300在实际应用中, np+p正好是整数的情况几乎不存在. 14例4 某批产品有80%的一等品, 对它们进行重复抽样检验, 共取出4个样品, 求其中一等品数的最可能值k0, 并用贝努里公式验证.解 B(4, 0.8), 因np+p=40.8+0.8=4是整数, 所以k0=4和k0=3时P=k为最大, 即3和4为最可能值.01234P0.0016 0.0256 0.1536 0.4096 0.409615一般说来, 在n
8、很大时, 不等式.,111000最大即频率为概率的可能性故近似等于零和中即pnknpnpnppnknpppnpkpnp16 超几何分布超几何分布例例1. 某班有学生某班有学生23名名, 其中有其中有5名女同学名女同学, 今从班上任选今从班上任选4名学生去参观展览名学生去参观展览, 被选到被选到的女同学数的女同学数 是一个随机变量是一个随机变量, 求求 的分布的分布.解:解: 可取可取0,1,2,3,4,5这这5个值个值, 相应概率为相应概率为)4 , 3 , 2 , 1 , 0()(4204155kCCCkPkk17概率分布表为01234P0.2817 0.4696 0.2167 0.0310
9、 0.0310概率分布图为:18定义: 设N个元素分为两类, 有N1个元素属于第一类, N2个元素属于第二类(N1+N2=N). 从中按不重复抽样取n个, 令表示这n个中第一(或二)类元素的个数, 则的分布称为超几何分布. 其概率函数为:0,), 1 , 0()(21rnnNmnNmNCrnnmCCCmP则如果规定19根据概率分布的性质, 必有nNNnmmnNmNnmnNmnNmNnmCCCCCCmP212121000, 1, 1)(即20和二项分布相比, 二项分布是放回抽样, 而超几何分布是不放回抽样.当在不放回抽样时, 超几何分布中的N1/N相当于二项分布中的参数p, N2/N相当于二项分
10、布中的q=1p.超几何分布也可以和二项分布一样看作是n个0-1分布的随机变量i的和, i=1,2,.,n, i表示第i次抽样抽到第一类元素的事件的次数, 根据抽签原理P(i=1)=N1/N, 但如果ij, i与j相互之间是不独立的.21计算超几何分布的数学期望因为可看作n个相互并不独立但仍然服从同样的0-1分布的随机变量1,2,.,n的和,=1+2+.+n, 其中NNnnpEEEniNNpEniiniii1111, 2 , 1,因此可以认为超几何分布的数学期望与二项分布的一样22计算的方差因i服从0-1分布, 则i2也服从同样的0-1分布, 则Ei2=N1/N, 当ij时, ij也服从0-1分
11、布, )()() 1() 1() 1(21222121211121211nnnnnnnjijiEEEENNNNP而23因此11) 1() 1()()() 1() 1()(212212112122211212NnNnpqNnNNNNNnNNnNNNNnnNNnEEDNNNNnnNNnE24 也可以直接用定义来计算E和DNNnCCNCCCNEmkCmNmNCNCmNmNmCCCCmmmPEnNnNknNnkkNnNnmmnNnNnmmnNnNnmnNmnNmNnm1111110111111111002122211)!()!1()!1()!( !1)(则令25 计算D必须要先计算E(1) 1() 1
12、() 1() 1() 1()!()!2()!2() 1()!()!2(!1) 1()() 1()1(11221120)2(21122111121120212221NNnnNNCCNNCCCNNCmNmNCNNCmNmNCCCCmmmPmmEnNnNnkknNkNnNmknmmnNnNnmmnNnNnmnNmnNmNnm26 因此NnNNNnnNNEEE1112) 1() 1() 1()1(11) 1() 1() 1()(21221211122NnNnpqNnNNNNNnNNnNnNNNnnNNEED27 在实际应用中元素的个数N是相当大的, 例如, 从中国人民中任抽几千个人观察, 从一个工厂的
13、几十万件产品中任抽几千件观察, 等等.而在N非常大的情况下, 放回抽样和不放回抽样的结果几乎是相同的.因此有, 当N很大的时候, 超几何分布可用二项分布来近似.或者换句话说, 当N趋于无穷时, 超几何分布的极限是二项分布.28 为证明这一点, 首先给出一个近似公式!)11 ()21)(11 (!) 1()2)(1(!mnnmnnmnmmnnnnCmnCmnmnmmnmmn 这是因为保持不变的时候很大而当29因此, 如果服从超几何分布, 则当抽样数n保持不变且远小于样本数N即也小于N1和N2时mnmmnmnmnmnmnNmnNmNqpCNNNNmnmnnNmnNmNCCCmP2121)!( !)
14、!(!)(21这正是二项分布的概率函数表达式当N趋于无穷时, 上面的约等于就成为等于30例3 一大批种子的发芽率为90%, 今从中任取10粒, 求播种后, (1) 恰有8粒发芽的概率; (2) 不少于8粒发芽的概率.解 设10粒种子中发芽的数目为. 因10粒种子是由一大批种子中抽取的, 这是一个N很大, n相对于N很小的情况下的超几何分布问题, 可用二项分布近似计算.其中n=10, p=90%, q=10%, k=89298. 09 . 01 . 09 . 091937. 08)2(1937. 01 . 09 . 08) 1 (10928810PCP31 第第14次课次课:重要分布重要分布普哇
15、松分布普哇松分布指数分布指数分布-分布分布熟记其数字特征熟记其数字特征用普哇松分布对二项分布进行近似计算,用普哇松分布对二项分布进行近似计算,完成课后作业习题四(完成课后作业习题四(14-18)。)。32 普哇松普哇松(Poisson)分布分布 普哇松分布常见于所谓稠密性的问题中普哇松分布常见于所谓稠密性的问题中, 如一如一段时间内段时间内, 电话用户对电话台的呼唤次数电话用户对电话台的呼唤次数, 候车候车的旅客数的旅客数, 原子放射粒子数原子放射粒子数, 织机上断头的次数织机上断头的次数, 以及零件铸造表面上一定大小的面积内砂眼的以及零件铸造表面上一定大小的面积内砂眼的个数等等个数等等.0)
16、, 2 , 1 , 0( !)()(memmPmPm33普哇松分布的数学期望eekeEmkmeemmEkkmmmm0110!, 1)!1(!则令34普哇松分布的方差DDEEEDEEmeemmmEmmmm,)()!2(!) 1()1(222222222220则35 通常在通常在n比较大比较大, p很小时很小时, 用普哇松用普哇松分布近似代替二项分布的公式分布近似代替二项分布的公式, 其中其中 =np. 普哇松分布的方便之处在于有现成的分普哇松分布的方便之处在于有现成的分布表可查布表可查(见附表见附表1) 例例1 服从普哇松分布服从普哇松分布, E =5, 查表求查表求P( =2), P( =5)
17、, P( =20)解解 因普哇松分布的参数因普哇松分布的参数 就是它的期望值就是它的期望值, 故故 =5, 查书后附表一查书后附表一, 有有P5(2)=0.084224, P5(5)=0.175467,P5(20)=036例例2 一大批产品的废品率为一大批产品的废品率为p=0.015, 求任取一箱求任取一箱(有有100个产品个产品), 求箱中恰有一个废品的概率求箱中恰有一个废品的概率.解:解: 所取一箱中的废品个数所取一箱中的废品个数 服从超几何分布服从超几何分布, 由于产品数量由于产品数量N很大很大, 可按二项分布公式计算可按二项分布公式计算, 其中其中n=100, p=0.015.3359
18、53. 0985. 0015. 0) 1(991100CP但由于但由于n较大而较大而p很小很小, 可用普哇松分布公式近似可用普哇松分布公式近似代替二项分布公式计算代替二项分布公式计算. 其中其中 =np=1.5, 查表得查表得:P1.5(1)=0.334695误差不超过误差不超过1%.37例3 检查了100个零件上的疵点数, 结果如下表:疵点数0123456频数14272620733试用普哇松分布公式计算疵点数的分布, 并与实际检查结果比较.解:2)63127014(100138 计算出来的图表如下所示:疵点数0123456频数14272620733频率0.140.270.260.20 0.0
19、70.030.03概率0.135 0.271 0.271 0.18 0.09 0.036 0.0139 指数分布指数分布定义定义 如随机变量如随机变量 的概率密度为的概率密度为xj(x)的指数分布服从参数为则称其中其它当j, 000)(xexx40 指数分布的分布函数时当时当因此时当时当0100)(1)(,00)(,0,)()(|00 xexxFeedtexFxxFxdttxFxxxtxtxj41对任何实数a,b(0a1000)=1P(1000)=1F(1000)=e1各元件寿命相互独立, 因此3个这样的元件使用1000小时都未损坏的概率为e3(约为0.05).43 G G-分布分布定义4.5
20、 如果连续型随机变量具有概率密度),(, 0, 0000)()(1rrxxexrxxrrGGGj记作分布服从则称其中函数被称为GG01)(dxexrxr44 G-函数的一个重要性质是G(r+1)=rG(r), )( ) 1(:010000|rrxdxerxdeexdexdxexrrxrxxrxrxrGG证45 G-分布的数学期望GGGGGGGjrrrrrrdtetrxdexrdxexrdxxxEtrxrxr)()() 1()(1)(1)()()(1)()(1)(00046 G-分布的方差2222222222012012) 1()() 1()()() 1()() 1() 1()()2()(1)(
21、GGGGGGGGrrrrEEDrrrrrrrrrrrdtetrdxexrEtrxrr47当r=1时, 000)(xxexxj阶爱尔朗分布这是排队论中常用到的rxxexrxxrr000)!1()(1j这是指数分布,当r为正整数时,48当r=n/2(n是正整数), =1/2时, 000)2(21)(2122xxexnxxnnGj这是具有n个自由度的2-分布(简记作2(n), 它是数理统计中最重要的几个常用统计量的分布之一.如果2(n), 则E=n, D=2n.49定理:如果定理:如果 1, 2,., n相互独立相互独立, 且且 iG G( ,ri), (i=1,2,.,n),则则 1+ 2+.+
22、nG G( , r1+r2+.+rn)推论推论(需要记住需要记住):如果:如果 1, 2,., m相互独相互独立立, 且且 i 2 2(ni), (i=1,2,.,m),则则 1+ 2+.+ m 2 2(n1+n2+.+nm)50第第15次课次课:重要分布重要分布 正态分布的实际背景和数学模型正态分布的实际背景和数学模型 正态分布的数字特征正态分布的数字特征 标准正态分布与正态分布的关系标准正态分布与正态分布的关系 正态分布与正态分布与-分布的关系。分布的关系。 完成课后作业习题四(完成课后作业习题四(20,22-28) 51 引理:普阿松积分公式 |00220022222222,sin,co
23、s,:,rrryxtedrerdrdeIrdrdryrxdydxeIdteI则积分元为令作极坐标变换证52 定义 如果连续型随机变量的概率密度为222)(21)(jxex其中,为常数, 并且0, 则称服从正态分布, 简记作N(,2).利用引理可以验证E=, D=2特别地, 当=0, =1时, 称其为标准正态分布, 其概率密度记为j0(x), 这时N(0,1).20221)(xexj53 验证E=duedueuEdudxuxxudxexEuux222)(222221)(21,2则令54 验证D=22222222222)(2222222|222,2)(dueueudedueuDdudxuxxudx
24、exDuuuux则令55 j0(x)的图形20221)(xexjxj0(x)01156j0(x)除一般概率密度的性质外, 还有下列性质(1) j0(x)有各阶导数(2) j0(x)=j0(x), 偶函数(3) 在(,0)内严格上升,在(0,)严格下降.在x=0 处达到最大值:3989. 021)0(0j(4) 在x=1处有两个拐点;(5) x轴是j0(x)的水平渐近线0)(lim0 xxj57可用书后附表二查出j0(x)的各个值例1 N(0,1), 求j0(1.81), j0(1), j0(0.57), j0(6.4), j0(0).解 查书后附表二可得j0(1.81)=0.07754j0(1
25、)=j0(1)=0.2420j0(0.57)=0.3391j0(6.4)=0j0(0)=0.398958一般正态分布与标准正态分布的关系定理4.2 如果N(,2), hN(0,1), 其概率密度分布记为j(x)和j0(x), 分布函数分别记为F(x)及F0(x), 则FFjjxxxx00)()2(1)() 1 (59证FjFjjFjjxdyyxtydtxdttxxeexxxxxx0000212)()()(,1)()()2(121121)() 1 (222令60定理 4.3 如果N(,2), 而h=()/, 则hN(0,1)证 为证明hN(0,1), 只要证明h的概率密度为j0(x)或分布函数为
26、F0(x)即可.Fh(x)=P(hx)=P()/x)=P(x+)=F(x+)=F0(x)可以证明, 服从正态分布的随机变量, 它的线性函数k+b(k0)仍服从正态分布.61标准正态分布函数表如果N(0,1), 则对于大于零的实数x, F0(x)的值可以由附表三直接查到. 而对于小于零的x则可通过对称性来求得.j0(x)0uF0(u)x62例2 N(0,1), 求P(1.96), P(1.96), P(|1.96), P(12), P(5.9).解 P(1.96)=0.975=F0(1.96)P(1.96)=P(1.96)=1P(1.96)=10.975=0.025=1F0(1.96)P(|1.
27、96)=P(1.961.96)=F0(1.96)F0(1.96)=2F0(1.96)1=0.95P(12)=F0(2)F0(1)=F0(2)1F0(1)=0.81855P(5.9)=F0(5.9)=163概括起来, 如果N(0,1), 则0)(,5, 0)(,5)()()()0(1)(2)|(|0)(105 . 00)()(0000000 xxxxabbaPxxxPxxxxxxPFFFFFFF时而当时当时当64例3 N(8,0.52), 求P(|8|1)及P(10)解 因为N(8,0.52), 所以(8)/0.5N(0,1)99996833. 068339 . 099996833. 0)4(5
28、 . 0810)10()10(9545. 01)2(225 . 08) 1|8(|4000表示附表中FFFFPPP65例4 N(,2), P(5)=0.045, P(3)=0.618, 求及4, 8 . 13 . 037 . 15618. 03)3(955. 0551045. 05)5(0000 FFFF解得查表可得解PP66 正态分布与G-分布的关系 定理4.4 如N(0,1), 则22(1)21212221212)()()(0; 0)(,0)(,21)(),1 , 0(2xxxekxexxxxxxxxxexNjjjjjhjhhh时当时则当其概率密度为令证 67推论推论:如果如果 1, 2,
29、., m相互独立相互独立, 且且 iN(0,1), (i=1,2,.,m),则则 12 2+ 22 2+.+ m2 2 2 2(m )事实上:推论推论(需要记住需要记住):如果:如果 1, 2,., m相互独立相互独立, 且且 i 2 2(ni), (i=1,2,.,m),则则 1+ 2+.+ m 2 2(n1+n2+.+nm)68定义 4.9 若连续型随机变量的概率密度j(x)为).,(,0001)(212122112211nnFFnnxxxnnkxxnnn简记为分布的个自由度为第二为服从具有第一个自由度称j69 1994年经济类研究生试题_2,210102)(YPXXYxxxfX则出现的次
30、数事件的三次独立重复观察中表示以其它的概率密度为设随机变量1x27064943161343412)41, 3(4122112232102210|CYPBYxxdxXP因此解:由题意可知711995年经济类研究生试题_0101011)(,DXxxxxxfX则方差其它其概率密度为是一个随机变量设x1117261122)4131(2)4131(2)(2)1 (2)(2,)(0,)(|1043103210202222xxdxxxdxxxdxxfxDXxdxxfxEXDXEXxf因此也是偶函数则为偶函数解:由图可知73 1997年经济类研究生试题27192781321011,31,321 ,94)1 (
31、0_1,951), 3(), 2(32YPYPpppXPYPXPpBYpBX解则若设随机变量74 1999年经济类研究生试题设随机变量X服从参数为的泊松分布, 且已知E(X1)(X2)=1, 则=_解 已知EX=DX=, 且EX2=(EX)2+DX=2+,而E(X1)(X2)=E(X23X+2)=EX23EX+2=1得2+3+2=1, 即22+1=0有=175 1999年经济类研究生试题设随机变量Xij(i,j=1,2,.,n;n2)独立同分布, EXij=2, 则行列式_212222111211EYXXXXXXXXXYnnnnnn的数学期望76解 因多个随机变量之和的数学期望是各个数学期望之
32、和, 而多个相互独立的随机变量之积的数学期望也是各个随机变量的数学期望之积, 而行列式无非是各个随机变量相互乘积再相加得到的随机变量.因此有0222222222212222111211nnnnnnEXEXEXEXEXEXEXEXEXEY772000年经济类研究生考研题设随机变量X在区间1,2上服从均匀分布; 随机变量_0, 10, 00, 1DYXXXY则方差12x7898311)(131) 1(3213131) 1(321311, 00,321222222EYEYDYEYEYYPYPYP则解:如图不难算出791998年经济类研究生试题设一次试验成功的概率为p, 进行100次独立重复试验, 当
33、p=_时, 成功次数的标准差的值最大, 其最大值为_解 设成功次数为X, 则XB(100,p), DX=100p(1p)=100p100p2, 对p求导并令其为0, 得100200p=0, 得p=0.5时成功的标准差的值最大, 其最大值为55 . 05 . 0100npq8029. iN(0,1)(i=1,2,3), 并且1,2,3相互独立,3231321)2()(313131)(),cov()31, 0(,3131, 0).,cov(,),cov(,)(,331222211311131131232131hhhiiiiiiiiiiiEEEEENDDEE则解求81 因此0),cov(,)(,)(, 03131)()(),cov(),32, 0(, 2323)(31222312hhh因此独立必互不相关而相互也相互独立与则独立也相互与则相互独立与因此而它们都是正态分布互不相关与即而因iiiiiiiiiiiEEENEE82 30. (,h)有联合概率密度.21,00021)(),2(),1 (),1 (,),1 , 0(),1 , 0(,.,21),(21222222222)(2122的指数分布服从参数为即的概率密度为则则因此相互独立与由联合概率密度看出解的概率密度求jhhhhhjxxexNNeyxxyx
限制150内