第5章概率与概率分布.pptx
正态分布在北京市场上的精制盐很多是一公斤袋装,上面标有“净含量1kg”的字样。但当你用稍微精确一些的天平称那些袋装盐的重量时,会发现有些可能会重些,有些可能会轻些;但都是在1kg左右。多数离1kg不远,离1kg越近就越可能出现,离1kg越远就越不可能。一般认为这种重量分布近似地服从最常用的正态分布(normal distribution,又叫高斯分布,Gaussian distribution)。第1页/共36页正态分布近似地服从正态分布的变量很常见,象测量误差、商品的重量或尺寸、某年龄人群的身高和体重等等。在一定条件下,许多不是正态分布的样本均值在样本量很大时,也可用正态分布来近似。第2页/共36页正态分布(normal distribution)1.描述连续型随机变量的最重要的分布2.可用于近似离散型随机变量的分布例如:二项分布3.经典统计推断的基础x xf f(x x)第3页/共36页正态分布正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。一个正态分布用N(m m,)表示;其中m m为均值,而 为标准差。也常用N(m m,)来表示,这里 为方差(标准差的平方)。第4页/共36页正态分布标准差为1的正态分布N(0,1)称为标准正态分布(standard normal distribution)。任何具有正态分布N(m m,)的随机变量X都可以用简单的变换(减去其均值m m,再除以标准差):Z=(X-m)/m)/,而成为标准正态随机变量。这种变换和标准分数的意义类似。第5页/共36页两条正态分布的密度曲线。左边是N(-2,0.5)分布,右边是N(0,1)分布 第6页/共36页 和 对正态曲线的影响xf(x)CAB第7页/共36页概率密度函数f(x)=随机变量 X 的频数 =总体方差 =3.14159;e=2.71828x=随机变量的取值(-x 02.正态曲线的最高点在均值,它也是分布的中位数和众数3.正态分布是一个分布族,每一特定正态分布通过均值 的标准差 来区分。决定曲线的高度,决定曲线的平缓程度,即宽度第9页/共36页正态分布函数的性质4.曲线f(x)相对于均值 对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交5.正态曲线下的总面积等于16.随机变量的概率由曲线下的面积给出第10页/共36页正态分布当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。比如,标准正态分布变量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。很容易得到这个面积等于0.24682;也就是说,标准正态变量在区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f f(x),那么这个面积为积分第11页/共36页标准正态变量在区间(0.51,1.57)中的概率第12页/共36页 正态分布我们有必要引进总体的下侧分位数、上侧分位数以及相应的尾概率的概念。对于连续型随机变量X,a a下侧分位数(又称为a a分位数,a a-quantile)定义为数xa a,它满足关系这里的a又称为下(左)侧尾概率(lower/left tail probability)第13页/共36页正态分布而a a上侧分位数(又称a a上分位数,a a-upper quantile)定义为数xa a,它满足关系这里的a也称为上(右)侧尾概率(upper/right tail probability)。第14页/共36页正态分布对于非连续型的分布,分位数的定义稍微复杂一些;显然,对于连续分布,a a上侧分位数等于(1a)a)下侧分位数,而(1a)a)下侧分位数等于a a上侧分位数。第15页/共36页正态分布通常用za a表示标准正态分布的a a上侧分位数,即对于标准正态分布变量Z,有P(Zza a)=a a。图 4.64.6表 示 了 0.050.05上 侧 分 位 数za a=z0.050.05及 相 应 的 尾 概 率(a=0.05a=0.05)。第16页/共36页N(0,1)分布右侧尾概率P(zza)=a的示意图第17页/共36页正态分布的概率概率是曲线下的概率是曲线下的面积面积!a ab bx xf f(x x)第18页/共36页标准正态分布(standardize the normal distribution)1.一般的正态分布取决于均值 和标准差 2.计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的3.若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表第19页/共36页标准正态分布函数2.标准正态分布标准正态分布的概率密度函数的概率密度函数1.任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布3.标准正态分布标准正态分布的分布函数的分布函数第20页/共36页标准正态分布xms一般正态分布一般正态分布一般正态分布=1Z标准正态分布标准正态分布标准正态分布 第21页/共36页标准正态分布表的使用1.将一个一般的转换为标准正态分布2.计算概率时,查标准正态概率分布表3.对于负的 x,可由(-x)x得到4.对于标准正态分布,即XN(0,1),有P(a X b)b aP(|X|a)2 a 15.对于一般正态分布,即XN(,),有第22页/共36页标准化的例子 P(5 X 6.2)x=5=10一般正态分布一般正态分布一般正态分布6.2=1Z标准正态分布标准正态分布标准正态分布 0 0.120.04780.04780.0478第23页/共36页标准化的例子P(2.9 X 7.1)一般正态分布一般正态分布0.16640.16640.1664.0832.0832.0832.0832标准正态分布标准正态分布标准正态分布第24页/共36页正态分布(例题分析)【例例5.215.21】设设X X N N(0(0,1)1),求以下概率:,求以下概率:(1)(1)P P(X X 1.5)2)2);(3)(3)P P(-1(-1X X 3)3);(4)(4)P P(|(|X X|2)2)解解:(1)(1)P P(X X 1.5)=2)=1-2)=1-P P(X X 2 2)=1-0.9972=0.0228)=1-0.9972=0.0228 (3)(3)P P(-1(-1X X 3)=3)=P P(X X 3)-3)-P P(X X-1)-1)=(3)-(3)-(-1)=(-1)=(3)1-(3)1-(1)(1)=0.9987-(1-0.8413)=0.84 =0.9987-(1-0.8413)=0.84 (4)(4)P P(|(|X X|2)=2)=P P(-2(-2 X X|2)=2)=(2)-(2)-(-2)(-2)=(2)-1-(2)-1-(2)=2(2)=2(2)-1=0.9545(2)-1=0.9545第25页/共36页正态分布(例题分析)【例例5.225.22】设设X X N N(5(5,3 32 2),求以下概率,求以下概率 (1)(1)P P(X X 10)10);(2)(2)P P(2(2X X 1010)解解:(1)(1)(2)(2)第26页/共36页用Excel计算正态分布的概率值1.标准正态分布:函数NormsDist(z)2.正态分布:函数NormDist(x,0或1)第27页/共36页正态分布(例题分析)【例例5.235.23】已已知知X X N N(10(10,0.20.22 2),求求以以下下概概率率:(1)(1)P P(X X 9.4)9.4);(2)(2)P P(9.5(9.5X X 10.5 3的概率(=0.0027)很少,因此可以认为X的值几乎落在区间(X 3)内。(因为小概率事件是不可能发生的)3.3准则在质量控制中有着广泛的应用:如剔除异常值,控制图第29页/共36页二项分布的正态近似第30页/共36页二项分布的正态近似1.根据德莫佛拉普拉斯定理,当n 很大时,二项随机变量X近似服从正态分布:Nnp,np(1-p)2.对于一个二项随机变量X,当n很大时,求 P(x1Xx2)时可用正态分布近似为第31页/共36页为什么概率是近似的.0.1.2.30246810 xP(x)正态曲线增加的概率正态曲线增加的概率 正态曲线减少的概率正态曲线减少的概率 二项概率:矩形的面积二项概率:矩形的面积正态概率:曲线下正态概率:曲线下从从3.53.5到到4.54.5的面积的面积增加的部分与减少增加的部分与减少增加的部分与减少的部分不一定相等的部分不一定相等的部分不一定相等第32页/共36页二项分布的正态近似(实例)【例例5.245.24】100100台台机机床床彼彼此此独独立立地地工工作作,每每台台机机床床的的实实际际工工作作时时间间占占全全部部工工作作时时间间的的80%80%。求。求 (1)(1)任一时刻有任一时刻有70708080台机床在工作的概率台机床在工作的概率 (2)(2)任一时刻有任一时刻有8080台以上机床在工作的概率台以上机床在工作的概率 解解:设设X X表表示示100100机机床床中中工工作作着着的的机机床床数数,则则X X B B(100,0.8)(100,0.8)。现现用用正正态态分分布布近近似似计计算,算,=npnp=8080,2 2=npqnpq=1616,=4 4 (1)(1)(2)(2)第33页/共36页本章小结1.随机事件及其概率2.概率的性质与运算法则3.离散型随机变量的分布4.连续型随机变量的分布第34页/共36页结 束第35页/共36页感谢您的观看!第36页/共36页