连续性随机变量及其分布.ppt
1.定义定义 对于随机变量对于随机变量X,若存在非负函数若存在非负函数f(x)(-x+),使对任意实数使对任意实数x,都有都有则称则称X为连续型随机变量为连续型随机变量,f(x)为为X的的概率密度函数概率密度函数,简称简称概概率密度率密度或或密度函数密度函数(probability density function or probability density)。一、一、概率密度概率密度注:连续型随机变量的分布函数是连续函数。注:连续型随机变量的分布函数是连续函数。(1)非负性非负性 f(x)0,(-x);(2)归一性归一性设随机变量设随机变量X的概率密度为的概率密度为求常数a。答答:2.密度函数的性质密度函数的性质这两条性质是这两条性质是密度函数的密度函数的充要性质充要性质(3)若若x是是f(x)的连续点,则的连续点,则 设随机变量设随机变量X的分布函数为的分布函数为:求求f(x)。故故 X的密度的密度 f(x)在在 x 这一点的值,恰好是这一点的值,恰好是X落在区间落在区间 上的概率与区间长度之比的极限。上的概率与区间长度之比的极限。对对 f(x)的进一步理解的进一步理解:若若x是是 f(x)的连续点,则的连续点,则:f(x)=若不计高阶无穷小,有:若不计高阶无穷小,有:它表示随机变量它表示随机变量 X 取值于取值于(x,x+x的概率近似等的概率近似等于于 f(x)x。f(x)x在连续型理论中所起的作用与在连续型理论中所起的作用与PX=xk 在离散型理论中所起的作用相类似。在离散型理论中所起的作用相类似。(4)对任意实数对任意实数a,若若连续型连续型 随机变量随机变量X具有概率具有概率密度密度 f(x)(-x),则则 PX=a0。于是。于是可见可见,由由P(A)=0,不能推出不能推出 ,由由P(B)=1,不能推出不能推出 B=S。令令 x0,由于,由于X是是连续连续型,所以它的分布函数型,所以它的分布函数连续连续,从而,从而PX=a=0。推导推导密度函数的密度函数的几何意义几何意义为为例例 已知随机变量已知随机变量X的概率密度为的概率密度为1)确定常数确定常数k。2)求求X的分布函数的分布函数F(x)。3)求求PX(0.5,1.5)。解解:1)2)所以所以,k=13)PX(0.5,1.5)=或或=F(1.5)-F(0.5)=。若若.X的概率密度为:的概率密度为:则称则称X在区间在区间(a,b)上服从均匀分布,上服从均匀分布,记作:记作:X U(a,b)1.均匀分布(均匀分布(Uniform distribution)三种常见连续型随机变量均匀分布常见于下列情形:均匀分布常见于下列情形:如在数值计算中,由于四舍五如在数值计算中,由于四舍五 入,小数点后某一入,小数点后某一位小数引入的误差,例如对小数点后第一位进行位小数引入的误差,例如对小数点后第一位进行四舍五四舍五 入时,那么一般认为误差服从()上的均入时,那么一般认为误差服从()上的均匀分布。匀分布。若若X U(a,b),则对于满足,则对于满足ac0)的的指数分布。指数分布。若若 X其分布函数为其分布函数为三种常见连续型随机变量例例 电子元件的寿命电子元件的寿命X(年年)服从参数为)服从参数为3的指数分的指数分布。布。(1)求该电子元件寿命超过)求该电子元件寿命超过2年的概率。年的概率。(2)已知该电子元件已使用了年,求它还能使用)已知该电子元件已使用了年,求它还能使用至少两年的概率为多少?至少两年的概率为多少?解:解:指数分布常用于可靠性统计研究中,如元件的寿指数分布常用于可靠性统计研究中,如元件的寿命命。正态分布是应用最广泛的一种连正态分布是应用最广泛的一种连续型分布。续型分布。正态分布在十九世纪前叶由高斯正态分布在十九世纪前叶由高斯(Gauss)加以推广,所以通常称)加以推广,所以通常称为高斯分布。为高斯分布。德莫佛德莫佛德莫佛(德莫佛(De Moivre)最早发现了二)最早发现了二项分布的一个近似公式,这一公式项分布的一个近似公式,这一公式被认为是正态分布的首次露面。被认为是正态分布的首次露面。3.正态分布(正态分布(Normal distribution)三种常见连续型随机变量高斯高斯(I).正态分布的定义正态分布的定义若若.X 的的概率密度为概率密度为记作记作 f(x)所确定的曲线叫作所确定的曲线叫作正态曲线。正态曲线。其中其中m m和和 都是常数都是常数,m m任意任意,0,则称则称X服从参服从参数为数为 m m和和 的正态分布的正态分布。(II).正态分布正态分布N(,2 2)的图形特点的图形特点图形关于直线图形关于直线x=对称对称:f(+x)=f(-x)。在在 x=时时,f(x)取得最大值取得最大值 。在在 x=时时,曲线曲线 y=f(x)在对应的点处有拐在对应的点处有拐点。点。曲线曲线 y=f(x)以以x轴为渐近线轴为渐近线。曲线曲线 y=f(x)的图形呈单峰状。的图形呈单峰状。-6-5-4-3-2-10.050.10.150.20.250.3f(x)的两个参数:的两个参数:位置参数位置参数即固定即固定 ,对于不同的对于不同的 ,对应的对应的 f(x)的形状不的形状不变化,只是位置不同。变化,只是位置不同。形状参数形状参数固定固定 ,对于不同的对于不同的 ,f(x)的形状不同。的形状不同。q 由于由于 f()所以所以 越小,越小,f(x)变得越尖,变得越尖,而而X落在落在 附近的概率越大附近的概率越大。下面是我们用某大学大学生的身高的数据画下面是我们用某大学大学生的身高的数据画出的频率直方图。出的频率直方图。红线红线是拟是拟合的正态合的正态密度曲线密度曲线可见,某大学大学生的身高应服从正态分布。可见,某大学大学生的身高应服从正态分布。人人的的身身高高高高低低不不等等,但但中中等等身身材材的的占占大大多多数数,特特高高和和特特矮矮的的只只是是少少数数,而而且且较较高高和和较较矮矮的的人人数数大大致致相相近近,这这从从一一个个方方面面反反映映了了服服从从正正态态分分布布的的随随机变量的特点。机变量的特点。除了我们在前面遇到过的年降雨量和身高外,在除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标,如零件的尺寸;正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布。信号噪声等等,都服从或近似服从正态分布。应用场合应用场合若随机变量若随机变量 X 受到众多相互独立的随机因素的影受到众多相互独立的随机因素的影响响,而每一个别因素的影响都是微小的而每一个别因素的影响都是微小的,且这些影且这些影响可以叠加响可以叠加,则则 X 服从正态分布。服从正态分布。可用正态变量描述的实例非常之多:可用正态变量描述的实例非常之多:各种测量的误差;各种测量的误差;人的生理特征;人的生理特征;工厂产品的尺寸;工厂产品的尺寸;农作物的收获量;农作物的收获量;海洋波浪的高度;海洋波浪的高度;金属线的抗拉强度;金属线的抗拉强度;热噪声电流强度;热噪声电流强度;学生们的考试成绩;学生们的考试成绩;(III).设设X ,X的分布函数是的分布函数是(IV).标准正态分布标准正态分布的正态分布称为标准正态分布。的正态分布称为标准正态分布。其密度函数和分布函数常用其密度函数和分布函数常用 j j(x)和和 F F(x)表示表示:它的依据是下面的定理:它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。态分布都可以通过线性变换转化为标准正态分布。根据定理根据定理1,只要将标准正态分布的分布函数制成,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。表,就可以解决一般正态分布的概率计算问题。,则则 N(0,1)设设定理定理1书末附有标准正态分布函数数值表,有了它,可书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表。以解决一般正态分布的概率计算查表。(V).正态分布表正态分布表表中给的是表中给的是x0时时,(x)的值的值。当当-x3|3 的值。的值。如在质量控制中,常用标准指标值如在质量控制中,常用标准指标值m m33 作两条线,作两条线,当生产过程的指标观察值落在两线之外时发出警当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常。报,表明生产出现异常。例例 已知已知XN(d2),问问d至少至少为为多少多少时时,解:解:由由题题意,意,d需需满满足足因为因为所以所以例例 一种一种电电子元件的使用寿命子元件的使用寿命(小小时时)服从正服从正态态分布分布(100,152),某,某仪仪器上装有器上装有3个个这这种元件,三个元件种元件,三个元件损损坏与否是相互独立的。求:使用的最初坏与否是相互独立的。求:使用的最初90小小时时内内无一元件无一元件损损坏的概率。坏的概率。解:解:设设A为为使用的最初使用的最初90小小时时内元件内元件损损坏;坏;Y为为A发发生的元件数。生的元件数。故故则则Yb(3,p),其中其中例例 (1)假设某地区成年男性的身高)假设某地区成年男性的身高(单位:单位:cm)XN2),求该地区成年男性的身高超过,求该地区成年男性的身高超过175cm的的概率。概率。解解:(1)根据假设)根据假设XN2),则,则故事件故事件X175的概率为的概率为P X175=解解:(2)设车门高度为)设车门高度为h cm,按设计要求,按设计要求PX h或或 PX h,下面我们来求满足上式的最小的下面我们来求满足上式的最小的h。(2 2)公共汽车车门的高度是按成年男性与车门顶公共汽车车门的高度是按成年男性与车门顶头碰头机会在以下来设计的,问车门高度应如何确头碰头机会在以下来设计的,问车门高度应如何确定定?因为因为XN(170,2),),故故 PX h=查表得查表得F F()=()=所以所以 =2.33,即即 h188设计车门高度为设计车门高度为188厘米时,可使厘米时,可使男子与车门碰头男子与车门碰头机会不超过机会不超过PX h 求满足求满足的最小的的最小的h。(VII).标准正态分布的上标准正态分布的上 分位点分位点z 设设 X N(0,1),0 1,称满足称满足的点的点 z 为为X的上的上 分位点分位点。常用的几个数据常用的几个数据z 0.10.20.30.4z1-=-z 一、问题的提出一、问题的提出 在实际中,人们常常对随机变量的函数更感兴趣。在实际中,人们常常对随机变量的函数更感兴趣。求截面面积求截面面积 A=pd2/4的分布的分布。例如例如,已知圆轴截面直径,已知圆轴截面直径 d 的分布,的分布,又如:已知又如:已知t=t0 时刻噪声电压时刻噪声电压 V的分布,的分布,求功率求功率 W=V2/R (R为电阻)的分布等。为电阻)的分布等。一般地、设随机变量一般地、设随机变量X 的分布已知的分布已知,Y=g(X)(设设g是连续函数是连续函数),如何由如何由 X 的分布求出的分布求出 Y 的分布?的分布?这个问题无论在实践中还是在理论上都是重要这个问题无论在实践中还是在理论上都是重要的的。二、离散型随机变量二、离散型随机变量函数的分布函数的分布例例 已知已知XPk-1 0 1求求:Y=X2的分布律。的分布律。YPk0 1 解:解:Y的所有可能取的所有可能取值为值为0,1。由。由PY=0=PX2=0=PX=0=1/3PY=1=PX2=1=PX=1+PX=-1=1/3+1/3=2/3得得Y的分布律的分布律为为如果如果g(xk)中有一些是相同的,把它们作适当并项中有一些是相同的,把它们作适当并项即可。即可。一般,若一般,若X是离散型是离散型 ,X的分布律为的分布律为X 则则 Y=g(X)三、连续型随机变量函数的分布三、连续型随机变量函数的分布解:解:设设X、Y的分布函数为的分布函数为FX(x)、FY(y),则则例例设设 X 求求 Y=2X+8 的概率密度。的概率密度。FY(y)=PYy=P2X+8 y 将将FY(y)关于关于y求导数求导数,可得可得Y=2X+8的密度函数的密度函数故故知当知当即即8 y 0 时时,注意到注意到 Y=X2 0,故当故当 y0时时,解解:设设Y和和X的分布函数分别为的分布函数分别为FY(y)和和FX(x),若若则则 Y=X2 的概率密度为的概率密度为:称称Y服从自由度为服从自由度为1的的c c2 2分布。分布。从上述两例中可以看到,在求从上述两例中可以看到,在求PYy 的过程中,的过程中,关键的一步是设法从关键的一步是设法从 g(X)y 中解出中解出X,从而,从而得到与得到与 g(X)y 等价的等价的X的不等式的不等式。例如,用例如,用 X 代替代替 2X+8 y 用用 代替代替 X2 y 这样做是为了利用已知的这样做是为了利用已知的 X的分布,从而求出相的分布,从而求出相应的概率应的概率。这种方法叫这种方法叫分布函数法,分布函数法,是求的函数的分布的一是求的函数的分布的一种常用方法。种常用方法。下面给出一个定理,在满足定理条下面给出一个定理,在满足定理条件时可直接用它求出随机变量函数件时可直接用它求出随机变量函数的概率密度。的概率密度。定理定理 设设 X具有概率密度具有概率密度 fX(x),-x0或恒有或恒有 g (x)0 或或 g(x)0,且有反函数且有反函数由前述定理得由前述定理得注意注意取绝对值取绝对值已知已知X在在(0,1)上服从均匀分布上服从均匀分布,代入代入 fY(y)的表达式中的表达式中得得即即Y服从参数为服从参数为2的指数分布的指数分布。对于连续型随机变量,在求对于连续型随机变量,在求Y=g(X)的分布时,关的分布时,关键的一步是把事件键的一步是把事件 g(X)y 转化为转化为X在一定范围在一定范围内取值的形式,从而可以利用内取值的形式,从而可以利用 X 的分布来求的分布来求 P g(X)y。这一讲我们介绍了随机变量函数的分布。这一讲我们介绍了随机变量函数的分布。1、不论是离散型的或非离散型的随机变量、不论是离散型的或非离散型的随机变量X,都可都可以借助分布函数以借助分布函数 F(x)=PXy,-x 来描述。来描述。若已知若已知X的分布函数的分布函数,就能知道就能知道X落在任一区间落在任一区间(a,b上的概率:上的概率:PaXb=F(b)-F(a),这样这样分布函数可以分布函数可以完整地描述随机变量取值的统计规律性。完整地描述随机变量取值的统计规律性。2、对于离散型随机变量,需要掌握的是它可能取、对于离散型随机变量,需要掌握的是它可能取那些值及以怎样的概率取这些值。因而对离散型随那些值及以怎样的概率取这些值。因而对离散型随机变量机变量用分布律用分布律PX=xk=pk,k=1,2,来描述它的取来描述它的取值的统计规律性更为直观和简洁。值的统计规律性更为直观和简洁。分布律和分布函数有以下关系:分布律和分布函数有以下关系:F(x)=PXx=3、对于连续型随机变量、对于连续型随机变量,给定给定X的概率密度的概率密度f(x),就就能确定能确定F(x)。反之,由于。反之,由于f(x)位于积分号之内位于积分号之内,故改故改变变f(x)在个别点的值在个别点的值,并不改变并不改变F(x)的值的值.因此改变因此改变f(x)在个别点的值无关紧要。在个别点的值无关紧要。对连续型随机变量对连续型随机变量,在实用和理论上使用概率密度在实用和理论上使用概率密度f(x)来描述较为方便。来描述较为方便。概率密度和分布函数有以下关系:概率密度和分布函数有以下关系:F(x)=PXx=4、连续型随机变量、连续型随机变量X 的分布函数是连续的,它取的分布函数是连续的,它取任一指定常数任一指定常数a的概率为的概率为0。这两点是离散型变量不具备的。这两点是离散型变量不具备的。5、已知、已知X的概率密度的概率密度fX(x),求求Y=g(x)的概率密度的概率密度fX(x)在在a,b以外取值为以外取值为0,且当,且当xa,b时,时,y=g(x)(a,b)。(2)y=g(x)在在a,b上无单调性。上无单调性。那么当那么当ya时时,FY(y)=0;当;当yb时时,FY(y)=1;当当ay0(或或0(或或0),则由公式,则由公式(2)y=g(x)在在(-,)上无单调性。上无单调性。那么当那么当ya时时,FY(y)=0;当;当yb时时,FY(y)=1;当当ayb时时,FY(y)=PY y=Pg(X)yfX(x)定义在定义在(-,),且当且当x(-,)时时,y=g(x)(a,b)。例例 设随机变量设随机变量X的概率密度为的概率密度为求求Y=sinX的概率密度的概率密度。当当 y0时时,当当 y1时时,当当时时故故解:解:注意到注意到,因为因为,FY(y)=PYy=PsinXy=P0Xarcsiny+Pp p-arcsiny Xp p 当当0y1,G(y)=1;对对y0,G(y)=0;由于由于对对0y1,G(y)=PY y=PF(X)y=PX (y)=F(y)=y即即Y的分布函数是的分布函数是求导得求导得Y的密度函数的密度函数可见可见,Y 服从服从0,1上的均匀分布。上的均匀分布。