第二章随机变量及其分布.ppt
第二章第二章第二章第二章随机变量及其分布随机变量及其分布随机变量及其分布随机变量及其分布第一节第一节 随机变量随机变量设 是试验E的样本空间,若则称 X()为 上的 随机变量r.v.一般用大写字母 X,Y,Z,或小写希腊字母,表示.定义定义随机变量(random variable)按一定法则简记 r.v.X.随机变量随机变量X是上的映射,此映射具有如下特点 定义域定义域 事件域事件域 随机性随机性 r.v.X 的可能取值不止一个的可能取值不止一个,概率特性概率特性 X 以一定的概率取某个值 试验前只能预知它的可能的取值,但不试验前只能预知它的可能的取值,但不能预知取哪个值能预知取哪个值引入r.v.后,可用r.v.的等式或不等式表达随机事件,例如 表示“某天9:00 10:00为事件A 的示性变量 r.v.的函数一般也是r.v.可根据随机事件定义 r.v.接到电话次数超过接到电话次数超过100100次次”这一事件这一事件设 A 为随机事件,则称例例1袋中有袋中有3个黑球,个黑球,2个白球,从中任意取出个白球,从中任意取出3个球,个球,观察取出的观察取出的3个球中黑球的个数个球中黑球的个数.我们将我们将3个黑球分别记作个黑球分别记作1,2,3号,号,2个白球分别记作个白球分别记作4,5号,则该试验的样本号,则该试验的样本空间为空间为若记取出的黑球数为若记取出的黑球数为X,则,则X 的可能取值为的可能取值为1,2,3.如下表表示:如下表表示:样本点样本点黑球数黑球数X X样本点样本点黑球数黑球数X X(1,2,3)(1,2,3)(1,2,4)(1,2,4)(1,2,5)(1,2,5)(1,3,4)(1,3,4)(1,3,5)(1,3,5)3 32 22 22 22 2(1,4,5)(1,4,5)(2,3,4)(2,3,4)(2,3,5)(2,3,5)(2,4,5)(2,4,5)(3,4,5)(3,4,5)1 12 22 21 11 1 在同一个样本空间可以同时定义多个 r.v.,例如=儿童的发育情况 X()身高,Y()体重,Z()头围.各 r.v.之间可能有一定的关系,也可能没有关系 即 相互独立离散型离散型非离散型非离散型r.v.分类分类 其中一种重要的类型为 连续性连续性r.v.引入引入r.v.重要意义重要意义任何随机现象可任何随机现象可被被r.v.描述描述借助微积分方法借助微积分方法将讨论进行到底将讨论进行到底2.2离散型随机离散型随机变变量及其分布律量及其分布律分布律常用表格分布律常用表格形式表示如下:形式表示如下:X x1x2xkpkp1p2pk如果随机变量所有的可能取值为有限个或可列无如果随机变量所有的可能取值为有限个或可列无限多个,则称这种随机变量为限多个,则称这种随机变量为离散型随机变量离散型随机变量。设离散型随机变量设离散型随机变量X的可能取值为的可能取值为xk(k=1,2,),事事件件发生的概率为发生的概率为pk,即即称为称为随机变量随机变量X的概率或分布律的概率或分布律。分布律的两条分布律的两条基本性质基本性质:确定常数确定常数a的值的值.因此因此解:()由分布律的性质知解:()由分布律的性质知pa例例2从从110这这10个数字中随机取出个数字中随机取出5个数字,个数字,X表示取表示取出的出的5个数字中的最大值个数字中的最大值.试求试求X 的分布律的分布律.解解X 的所有可能的取值为的所有可能的取值为5,6,7,8,9,10.并且由古典概型的计算公式易得并且由古典概型的计算公式易得列表,得分布律如下:列表,得分布律如下:X X5 56 67 78 89 91010解解 例例3 3 设汽车在开往甲地途中需经 过 4 盏信号灯,每盏信号灯独立地 以概率 p 允许汽车通过.出发地出发地甲地甲地首次停下时已通过的信号灯盏数,求 X 的概率分布(取 p=0.4).令 X 表示kpk 0 1 2 3 40.6 0.24 0.0960.0384 0.0256代入例例4 4 一门大炮对目标进行轰击,假定此目标必须被击中r 次才能被摧毁.若每次击中目标的概率为p(0 p 1),且各次轰击相互独立,一次次地轰击直到摧毁目标为止.求所需轰击次数 X 的概率分布.解解P(X=k)=P(前 k 1次击中 r 1次,第 k 次击中目标)帕斯卡分 布注利用幂级数在收敛域内可逐项求导的性质当归纳地令(1)01分布分布是否超标等等.常见离散常见离散r.v.的分布的分布凡试验只有两个结果,常用0 1分布描述,如产品是否合格、人口性别统计、系统是否正常、电力消耗X=xk 1 0Pk p 1-p0 p 1应用场合或(2)二项分布二项分布n 重Bernoulli 试验中,X 是事件A 在 n 次试验中发生的次数,P(A)=p,若则称 X 服从参数为n,p 的二项分布,记作01 分布是 n=1 的二项分布二项分布的取值情况二项分布的取值情况设.039 .156 .273 .273 .179 .068 .017 .0024 .00000 1 2 3 4 5 6 7 8 0.273由图表可见,当 时,分布取得最大值此时的 称为最可能成功次数xP01234567824680.050.10.150.20.25设.01 .06.14 .21 .22 .18 .11 .06 .02 .01 .002 0是常数(是常数(与与n无关且与每小块的位置无关)。无关且与每小块的位置无关)。(2)各小块是否放出粒子各小块是否放出粒子,是相互独立的。是相互独立的。在这两条假定下,在这两条假定下,1秒内这一放射性物质放出秒内这一放射性物质放出k个粒子个粒子这一事件,可近似看作该物质的这一事件,可近似看作该物质的n个独立的小块中,个独立的小块中,恰有恰有k小块放出粒子。小块放出粒子。其中其中PX=k是随是随n而变的,它是一个近似式。而变的,它是一个近似式。放出放出k个粒子的概率:个粒子的概率:把物质无限细分,把物质无限细分,得到得到PX=k的精的精确式,即确式,即由泊松定理知由泊松定理知其中其中例例6 6 设一只昆虫所生虫卵数为随机变量 X,已知X (),且每个虫卵发育发育成幼虫是相互独立的.求一昆虫所成幼虫的概率为 p.设各个虫卵是否能生的虫卵发育成幼虫数 Y 的概率分布.解解 昆虫X 个虫卵Y 个幼虫已知由全概率公式故解解(1)设 需要配备 N 个维修工人,设 X 为90 台设备中发生故障的台数,则 X B(90,0.01)设同类型设备90台,每台工作相互独立,每台设备发生故障的概率都是 0.01.在通常 情况下,一台设备发生故障可由一个人独立 维修,每人同时也只能维修一台设备.(1)问至少要配备多少维修工人,才能保证当设(2)备发生故障时不能及时维修的概率小于0.01?(3)(2)问3个人共同负责90台还是3个人各自独立负(4)责30台设备发生故障不能及时维修的概率低?附例附例令则查附表得 N=4(2)三个人共同负责90台设备发生故障不能(3)及时维修的概率为设30台设备中发生故障的台数为 Y B(30,0.01)设每个人独立负责30台设备,第 i 个人负责的 30台设备发生故障不能及时维修为事件 Ai 则三个人各独立负责30台设备发生故障不能及时维修为事件故 三个人共同负责90 台设备比各自负责好!Blaise Pascal 1623-1662帕斯卡法国数学家物理学家 思想家 帕斯卡四岁丧母,在父亲精心培养下,16岁时发现帕斯卡六边形定理,写成圆锥曲线论,由此定理导出400余条推论,这是古希腊阿波罗尼奥斯以来圆锥曲线论的最大进步.帕斯卡简介 1642年发明世界上第一台机械加法计算机帕斯卡计算器.他应用此方法解决了摆线问题.1654年研究二项系数性质,写出论算术三角形一文,还深入讨论不可分原理,这实际上相当于已知道 1647年他发现了流体静力学的帕斯卡原理.三十岁时他曾研究过赌博问题三十岁时他曾研究过赌博问题,对早期概率论的发展颇有影响对早期概率论的发展颇有影响.1658年完成了摆线论,这给 G.W.莱布尼茨以很大启发,促使了微 积分的建立.在离散型随机变量的分布中有个在离散型随机变量的分布中有个以帕斯卡名字命名的分布,它应用于以帕斯卡名字命名的分布,它应用于重复独立试验中,事件发生重复独立试验中,事件发生 次的场次的场 帕斯卡还写过不少文学著作.1654年他进入修道院,献身于哲合合.而有名的几何分布正是其而有名的几何分布正是其 时时的特例的特例.学和宗教.第三节第三节 连续随机变量及其分布连续随机变量及其分布(4)若)若x为为f(x)的连续点,则有的连续点,则有概率密度概率密度f(x)具有以下具有以下性质性质:定义定义3:设随机变量设随机变量X的分布函数为的分布函数为F(x),若存在非负若存在非负函数函数f(t),使得对于任意实数使得对于任意实数x,有有则称则称X为连续型随机变量,称为连续型随机变量,称f(t)为为X的概率密度函数,的概率密度函数,简称概率密度或分布密度。简称概率密度或分布密度。由性质(由性质(2)知:)知:介于曲线介于曲线y=f(x)与与Ox轴之间的面积等于轴之间的面积等于1(见图(见图1)。)。由性质(由性质(3)知:)知:X落在区间(落在区间(x1,x2)的概率等于区间(的概率等于区间(x1,x2)上曲线上曲线y=f(x)之下的曲边梯形的面积(见图之下的曲边梯形的面积(见图2)。)。由性质(由性质(4)知:)知:若已知连续型随机变量若已知连续型随机变量X的分布函数的分布函数F(x)求导得概率密求导得概率密度度f(x)。图图图图(1)若若X为具有概率密度为具有概率密度f(x)的连续型随机变量。的连续型随机变量。则有则有如果如果x0为为f(x)的连续点,有的连续点,有f(x)在在x0处的函数值处的函数值f(x0)反映了概率在反映了概率在x0点处的点处的“密密集程度集程度”,而不表示,而不表示X在在x0处的概率。设想一条极细处的概率。设想一条极细的无穷长的金属杆,总质量为的无穷长的金属杆,总质量为1,概率密度相当于各,概率密度相当于各点的质量密度。点的质量密度。(2)若)若X为连续型随机变量,由定义知为连续型随机变量,由定义知X的分布函数的分布函数F(x)为连续函数(注意:反之不然)。为连续函数(注意:反之不然)。X取一个点取一个点a的的概率概率为零,事实上为零,事实上两点说明两点说明在计算连续型随机变量在计算连续型随机变量X落在某一区间的概率时,可落在某一区间的概率时,可以不必区分该区间是开区间或闭区间或半开半闭区间,以不必区分该区间是开区间或闭区间或半开半闭区间,即有即有事件事件X=a并非不可能事件并非不可能事件概率为零的事件不一定是不可能事件;概率为零的事件不一定是不可能事件;概率为概率为1的事件不一定是必然事件。的事件不一定是必然事件。求:(求:(1)常数)常数a;(;(2)(3)X的分布函数的分布函数F(x)(1)由概率密度的性质可知)由概率密度的性质可知所以所以a1/2例例1:设随机变量:设随机变量X具有概率密度具有概率密度解:解:则称则称X在区间在区间(a,b)上服从均匀分布,记为上服从均匀分布,记为XU(a,b),均匀分布均匀分布设连续型随机变量设连续型随机变量X的概率密度函数为的概率密度函数为X的分布函数为的分布函数为:概率密度函数概率密度函数f(x)与分布函数与分布函数F(x)的图形可用图示的图形可用图示设连续型随机变量设连续型随机变量X具有概率密度具有概率密度则称则称X服从参数为服从参数为 的指数分布。的指数分布。指数分布指数分布X的分布函数为的分布函数为f(x)和和F(x)可用图形表示可用图形表示利用利用可以证明可以证明,正态分布正态分布设随机变量设随机变量X的概率密度为的概率密度为其中其中,(0)为常数为常数,则称则称X服从参数为服从参数为,的正态分的正态分布或高斯分布布或高斯分布,记为记为XN(,2).X的分布函数为的分布函数为(1)最大值在最大值在x=处,最大值为处,最大值为;(3)曲线)曲线y=f(x)在在处有拐点;处有拐点;正态分布的密度函数正态分布的密度函数f(x)的几何特征:的几何特征:(2)曲线曲线y=f(x)关于直线关于直线x=对称,于是对于任对称,于是对于任意意h0,有有(4)当)当时,曲线时,曲线y=f(x)以以x轴为渐近线轴为渐近线当当 固定,改变固定,改变 的值,的值,y=f(x)的图形沿的图形沿Ox轴平移而不轴平移而不改变形状,故改变形状,故又称为位置参数。若又称为位置参数。若 固定,改变固定,改变 的值,的值,y=f(x)的图形的形状随的图形的形状随 的增大而变得平坦。的增大而变得平坦。越小,越小,X落在落在 附近的概率越大。附近的概率越大。参数参数 =0,=1的正态分布称为标准正态分布,记为的正态分布称为标准正态分布,记为XN(0,1)。其概率密度函数和分布函数分别用其概率密度函数和分布函数分别用和和表示,即表示,即和和的图形如图所示。的图形如图所示。由正态密度函数的几何特性易知由正态密度函数的几何特性易知一般的正态分布,其分布函数一般的正态分布,其分布函数F(x)可用标准正态分布可用标准正态分布的分布函数表达。若的分布函数表达。若X,X的分布函数的分布函数F(x)为为因此,对于任意的实数因此,对于任意的实数a,b(ab),有有函数函数写不出它的解析表达式,人们已编制了它写不出它的解析表达式,人们已编制了它的函数表,可供查用。的函数表,可供查用。例例2:设设X(0,1),求求P1X2,P.例例3:某仪器需安装一个电子元件,要求电子元件的某仪器需安装一个电子元件,要求电子元件的使用寿命不低于使用寿命不低于1000小时即可。现有甲乙两厂的电子小时即可。现有甲乙两厂的电子元件可供选择,甲厂生产的电子元件的寿命服从正态元件可供选择,甲厂生产的电子元件的寿命服从正态分布分布N(1100,502),乙厂生产的电子元件的寿命分布服从乙厂生产的电子元件的寿命分布服从正态分布正态分布N(1150,802)。问应选择哪个厂生产的产品呢问应选择哪个厂生产的产品呢?若要求元件的寿命不低于?若要求元件的寿命不低于1050小时,又如何?小时,又如何?比较两个概率的大小就知应选乙厂的产品。比较两个概率的大小就知应选乙厂的产品。解解:设甲、乙两厂的电子元件的寿命分别为:设甲、乙两厂的电子元件的寿命分别为X和和Y,则则X N(1100,502),Y N(1150,802),依题意要比较概率依题意要比较概率的大小。的大小。两个概率如下:两个概率如下:第四节第四节 随机变量函数的分布随机变量函数的分布设设X是离散型随机变量,是离散型随机变量,Y是是X的函数的函数Y=g(X)。那么那么Y也是离散型随机变量。也是离散型随机变量。设设y=g(x)为一个通常的连续函数,为一个通常的连续函数,X为定义在概率为定义在概率空间上的随机变量,令空间上的随机变量,令Y=g(X),那么那么Y也是一个定义在也是一个定义在概率空间上的随机变量。概率空间上的随机变量。(2)Y=-2X2分布律为分布律为Y-18-8-20P0.30.30.30.1例例1:设离散型随机变量设离散型随机变量X的分布律为的分布律为X -1 0 1 2 3P 0.2 0.1 0.1 0.3 0.3求:(求:(1)Y=X-1;(2)Y=-2X2的分布律。的分布律。P 0.2 0.1 0.1 0.3 0.3 X -1 0 1 2 3 X-1 -2 -1 0 1 2-2X2 -2 0 -2 -8 -18解:由解:由X的分的分布律可得布律可得由上表易得由上表易得Y的的分布律分布律(1)Y=X-1的分布律为的分布律为Y-2-1012P0.20.10.10.30.3对此类问题,先由对此类问题,先由X的取值的取值xk,(,(k=1,2)求出求出Y=g(X)的取值的取值yk=g(xk),(,(k=1,2););本例(本例(2)中,)中,X的两个取值的两个取值-1和和1都对应都对应Y的一个值的一个值-2,这样:这样:PY=-2=PX=-1或或X=1 =PX=-1+PX=1=0.2+0.1=03如果诸如果诸yk各不相同,各不相同,则由则由X的分布律的分布律PX=xk=pk,k=1,2,便可得便可得y的分布律:的分布律:PY=yk=pk,k=1,2。如诸如诸yk中有些值相同,则应把相同的值合并并将对应中有些值相同,则应把相同的值合并并将对应的概率加在一起。的概率加在一起。设设X为连续型随机变量,具有概率密度为连续型随机变量,具有概率密度fX(x)。又又Y=g(X),在大部分情况下在大部分情况下Y也是连续型随机变量。为也是连续型随机变量。为了求出了求出Y的概率密度的概率密度fY(y),可以先求出可以先求出Y的分布函数的分布函数FY(y)由由FY(y)便可求出便可求出Y的概率密度的概率密度fY(y)=FY(y)。计算的关键计算的关键是给出上式的积分区间。即将事件是给出上式的积分区间。即将事件转化为用转化为用X表表示的事件示的事件。其中。其中。这种方法称之为这种方法称之为分布函数法分布函数法。例例2:设连续型随机变量设连续型随机变量X具有概率密度具有概率密度求求Y=2X+1的概率密度的概率密度fY(y)。解解:先求出先求出Y的分布函数的分布函数FY(y)从而从而Y的概率密度为的概率密度为例例3:设随机变量设随机变量XN(0,1),求求Y=X2的概率密度的概率密度fY(y)。当当y0时,时,FY(y)=PX2y解解:X的概率密度为的概率密度为记记Y的分布函数为的分布函数为FY(y),那么那么FY(y)=PYy=PX2y当当y0时,时,FY(y)=0Y的概率密度为的概率密度为定理定理设随机变量设随机变量X具有概率密度具有概率密度fX(x)。函数函数g(x)为为(-,+)内的严格单调的可导函数,则)内的严格单调的可导函数,则Y=g(X)也也是一个连续型随机变量,且是一个连续型随机变量,且Y的概率密度函数为的概率密度函数为当函数当函数y=g(x)可导且为严格单调函数时,有:可导且为严格单调函数时,有:其中其中x=h(y)是是y=g(x)的反函数,的反函数,=min(g(-),g(+)),=max(g(-),g(+))。证明证明:若若y=g(x)严格单调增加,则其反函数严格单调增加,则其反函数x=h(y)存在存在且也严格单调增加。且也严格单调增加。Y=g(X)在区间在区间(,)内取值,内取值,若若y=g(x)严格单调下降,同样可以证明严格单调下降,同样可以证明:Y的概率密度为的概率密度为综上所述得综上所述得:FY(y)=PYy=Pg(X)y =P Xh(y)=当当 时时FY(y)=0,当当时,时,FY(y)=1;当当时时例例4:设随机变量设随机变量XN(),求求Y=aX+b(a0)的的概率密度概率密度fY(y)。y=ax+b为严格单调且可导的函数,其反函数为:为严格单调且可导的函数,其反函数为:由上述定理得由上述定理得Y=aX+b的概率密度为的概率密度为解解:X的概率密度为:的概率密度为:即有即有取取,得,得