概率论课件-第二章 一维随机变量及其分布.ppt
第二章第二章 一维随机变量及其分布一维随机变量及其分布 2.1 2.1 随机变量的概念及其分布函数随机变量的概念及其分布函数 2.2 2.2 一维离散型随机变量一维离散型随机变量 2.3 2.3 一维连续型随机变量一维连续型随机变量 2.4 2.4 一维随机变量函数的分布一维随机变量函数的分布2.1 随机变量的概念及其分布函数随机变量的概念及其分布函数 为什么要研究随机变量?样本空间太任意,难以把握,需要将其数量化,从而便于处理。要求问题涉及的随机事件与变量相关(即用一个变量来描述一个事件),这样可以将概率和函数建立联系(可以用概率去度量变量随机事件的概率可用随机变量分布函数的值表达)。正如随机事件是“其发生与否随机会而定”的事件;随机变量就是“其值随机会而定”的变量。其机会表现为试验结果,一个随机试验有许多可能的结果,到底出现哪一个要看机会,即有一定的概率。如掷骰子,掷出的点数X是一个随机变量,它可以取1,6这6个值中的1个,到底是哪一个,要等掷了骰子后才知道。因此,随机变量是试验结果的函数(每一试验结果对应于样本空间中的一个基本事件,故随机变量是基本事件的函数)。随机变量的取值由随机试验的结果(基本事件)来确定 把握这个概念的关键在于试验前后之分:在试验前,无法预知随机变量将取何值,这要凭机会(有一定的概率),“随机”的意思就在这里;一旦试验完成后,随机变量的取值就确定了。随机变量与普通函数有本质差异。定定义义(随随机机变变量量)设(,F,P)为概率空间,称映射X:R为随机变量,如果对任意xR,有|X()xF 或者,如对任意实数x,集合|X()x 都是一随机事件,则称定义在样本空间上的单值实函数X=X(),是随机变量。说明:说明:设X=X(),X是定义在概率空间(,F,P)上的单值实函数,对于任一给定实数x所限定的基本事件的集合|X()x都是一事件域F中的随机事件,则称X=X()为随机变量。对于随机事件AF,若定义 则X为两值随机变量(X描述的随机事件对应于n重伯努利试验的结果),且P(A)=P(X=1),P()=P(X=0)。随机变量X=X()是基本事件的函数,是自变量,在 不 必 强 调 时,简 记 X()为 X,而 的 集 合|X()x 所表示的事件简记为Xx。定义中要求对任一实数x,Xx都是事件,表明 Xx是所讨论问题的概率空间(,F,P)上一个适当确定的事件域F中的事件。通常用X,Y,来表示随机变量,用x,y,表示其取值。例例 某厂从其产品中随机抽出100个,其中所含废品数X是随机变量。全 部 可 能 结 果 为 i=“100个 产 品 中 有 i个 废 品”(i=0,1,100)故样本空间=0,1,2,100 随机变量是可能结果的函数:X=X(i)i X=X(0)=0,X=X(1)=1,X=X(2)=2,X=X(100)=100 所以,X=0,1,2,100事件“废品数少于50”=|X()50=0,1,49 =X50事件30X50=30,31,49 例例 若定义映射X:1R为X(i)=i,i=1,2,6,1=1,2,6,A=1,3,5,B=2,4,6,F3=1,A,B,则i1|X(i)2=1,2F3,从而X不是(1,F3,P)上的随机变量。随机事件这个概念包含在随机变量这个更广的概念之内。随机事件从静态的观点研究随机现象;随机变量则是从动态的观点去研究。概率论的基础概念是随机变量。2.1.2 随机变量的分布函数随机变量的分布函数定定义义(随随机机变变量量的的分分布布函函数数)设(,F,P)为概率空间,X为随机变量,X的分布函数分布函数FX定义为 FX=P(|X()x),xR说说明明:若X是一个随机变量,对任给实数x,确定随机事件概率的函数P|X()x称为随随机机变变量量X的的分分布布函函数数,记作FX(x)或F(x)=P|X()x。根据随机变量X的定义,对于每一个实数x,都有一个确定的随机事件|X()x与x对应,因此,分布函数P|X()x是x的函数。X 的分布函数也常简记为FX(x)=PXx。随机事件可以用随机变量来描述。随机事件的概率可以用随机变量的分布函数值表达。由分布函数的定义,有 P(X=a)=FX(a)-FX(a-0),aR P(Xa)=FX(a),aR P(Xa)=1-FX(a-0),aR P(Xa)=1-FX(a),aR P(aXb)=FX(b)-FX(a),abR P(aXb)=FX(b)-FX(a-0),abR P(aXb)=FX(b-0)-FX(a-0),abR P(aXb)=FX(b-0)-FX(a),abR(*)由上述 结果可知,若确定了X 的分布函数,就可以知道X落在任一区间(x1,x2上的概率,由此可说分布函数完整地描述了随机变量的统计规律性。若将X看成数轴随机点的坐标,则分布函数F(x)在x处的函数值就表示X落在区间(-,x上的概率(累积概率)。分布函数的性质分布函数的性质 任一随机变量X的分布函数F(x),x(-,),具有下列性质:(1)单调不减性。若x1,x2 R,x1 x2,则F(x1)F(x2)。证证 若x1 x2,则有X x1Xx2,由概率的性质,得 PX x1PXx2 即 F(x1)F(x2)。(2)0F(x)1,且 对上两式的几何说明:将区间端点x沿数轴无限向左移动(x-),则“随机点X落在点x左边”这一事件趋于不可能事件,其概率趋于0,即有F(-)=0;又若将点x无限右移(x+),则“随机点X落在点x左边”这一事件趋于必然事件,其概率趋于1,即有F(+)=1。(3)F(x+0)=F(x),即F(x)右连续,反之,如某实函数具有上述3个性质,则它可作为某随机变量的分布函数。2.2 一维离散型随机变量一维离散型随机变量 称取有限个不同的值或可列无穷个不同的值的这类随机变量为离散型随机变量离散型随机变量。对于离散型随机变量,除了关心它全部的可能值之外,还要知道它以怎样的概率取这些值。设离散型随机变量X的全部取值为x1,x2,xn,,且已知 P(X=xi)=pi,i=1,2,称上式或p1,p2,为X的概率分布概率分布(律律),简称分布律分布律。记 或称为X的概率分布列概率分布列,简称分布列分布列。离散型随机变量的概率分布律p1,p2,pn,满足的两个性质:(1)pi0,i=1,2,3,(非负性)(2)(规范性|归一化)离散型随机变量的分布函数为其图形为右连续阶梯(阶跃)函数,在各x=xi点处提高pi,点x1,x2,xn都是F(x)的第二类间断点。注意:注意:对于 ,这里的求和是对一切xix进行的(如果这样的xi不存在,便规定F(x)=0)。分布函数F(x)的值等于X取小于等于x的所有xi的概率之和或累积,因此分布函数也叫累积概率。例例 已知离散型随机变量X的概率分布列为试求出常数a。解解 由于 例例 离散随机变量的一种简单分布离散型均匀分布离散型均匀分布 均匀分布的离散随机变量X的分布列为抛均质硬币试验:抛均质六面体骰子试验:2.2.1二项分布二项分布定义定义 在1次试验中事件A出现的概率是p(0p1),则n重伯努利试验中,事件A出现的次数X的分布律为称随机变量X服从二项分布二项分布,记为XB(n,p)。两项分布列是:如果n=1,则X只取0和1两个值,这时称X服从两两点点分分布布(两值分布两值分布)。如果X取常数C的概率为1,则称X服从单单点点分分布布(退退化化分布分布)。两两点点分分布布(0-1分分布布):若随机变量X只能取两个值0和1,其分布列为:单点分布单点分布(退化分布退化分布):若随机变量X只取常数值C,即 实际上这时X并不是随机变量,为了方便和统一起见,将其看作随机变量。因为P(X=k)0,且由二项式定理有可知两项分布确实是概率分布。正是因为 是二项式(1-p)+pxn展开中xk的系数,故称 给出的X分布为二项分布。n重重贝贝努努里里试试验验的的结结果果服服从从两两项项分分布布。设每次试验“成功”的概率为p,X为n次试验中成功的次数,则XB(n,p),且P(X=k)=b(k;n,p)。定理定理1 当XB(n,p)时,a3)=1-P(X3)几何分布的几何分布的“无记忆无记忆”性特征:性特征:如果试验第k次还未成功,从k+1次起,首次成功出现在哪一次与k无关,即若XG(p),则有证明证明同样,也可证 2.3 一维连续型随机变量一维连续型随机变量 当随机变量X在整个实数轴上取值或在实数轴上的一个区间取值,而X的分布函数可写为一个非负可积函数的变上限积分时,X为一维连续型随机变量。定定义义 设(,F,P)为概率空间,X为其上的随机变量,FX(x)为X的分布函数。如果存在非负函数fX(x)和任意实数x,使称X为连续型随机变量,称为fX(x)为X的概概率率密密度度函函数数,简称密度函数密度函数。可以证明,连续型随机变量的分布函数是连续函数。密度函数与分布函数的性质:密度函数与分布函数的性质:(3)而分布函数F(x)的导函数(在连续点上)就是其密度函 数,即 (5)密度函数f(x)并不直接表示概率值的大小。但在区间很小时,f(x)的数值还是能反映出随机变量在x附近取值的概率大小的。上式表明,在小区间x-x,x内的概率值大大约约为为密度值与区间长度x的乘积。因此,密度函数fX(x)在某点x处取值较大,则随机变量X取x附近值的概率也较大。(6)可见,连续型随机变量X取一个固定实数值c的概率为0。对P(X=c)=0也可作如下证明:设X的分布函数为F(x),x0,则由X=cc-xXc得 0PX=cPc-xXc=F(c)-Fc-x令x0,并注意到X为连续型随机变量,其分布函数F(x)是连续的,即得 PX=c=0 由此知,计算随机变量落在某一区间的概率时,可以不必区分该区间是开区间或闭区间或半开区间。对任意类型的连续随机变量均成立证明证明 (1)由定义知,显然f(x)0。(2)分布函数性质知,由广义积分概念与分布函数的定义知,利用性质(1)和(2)可检验一个函数能否可作为连续型随机变量的概率密度函数。例例 设随机变量X的分布函数为()求常数、;()判断X是否是连续型随机变量;()求 P(-1X1/2)解解(1)由分布函数性质得(2)因为 所以F(x)不是连续函数,从而X不是连续型随机变量。例例 设已知连续型随机变量X的密度函数是(1)确定a的值;(2)求X的分布函数F(x);(3)求概率P(X21)。解解 (1)根据概率密度的性质,有a0以及 称该随机变量X服从标准柯西(Cauchy)分布。(2)求X的分布函数F(x):(3)求概率P(X21):例例 向半径为R的圆形靶射击,假定不会发生脱靶的情况,弹着点落在以靶心O为中心,r为半径(rR)的圆形区域的概率与该区域的面积成正比。设随机变量X表示弹着点与靶心的距离,试求X的分布函数F(x)及其密度函数f(x)。解解 因为不会发生脱靶,所以X的一切可能值是0,R,当x0时,F(x)=P(Xx)=P()=0,当0 xR时,F(x)=P(Xx)=kx2,由于F(R)=P(XR)=1,kR2=1 当xR时,F(x)=P(Xx)=P(必然事件)=1 由于 所以,密度函数为:2.3.1 均匀分布均匀分布 最简单的连续型随机变量X是密度函数在某有限区间取正的常数值,其余皆取零的随机变量,称为服从均匀分布的随机变量。定定义义 设a和b为有限数,且ab,若随机变量的密度函数f(x)为 其分布函数F(x)为:说明说明 均匀分布的概率密度函数fX在a,b上取常数,对任意满足ac0且1,满足分布函数的性质;又因密度函数fX是a,b上的常数(线密度),故称这类分布为均匀分布。均匀分布的应用举例:对几何概型,若投点落入区间a,b,设X为落点坐标,则XU(a,b)。数值计算中的误差量服从均匀分布。如要求计算精度保留在小数点后第5位,可假定数值的近似值例例 随机地向区间(-1,1)投掷点,X为其横坐标,试求关于t的二次方程 t2+3Xt+1=0 有实根的概率。解解 X在(-1,1)上服从均匀分布,其密度函数为方程t2+3Xt+1=0 有实根的的充要条件是9X2-4 0则方程有实根的概率为例例 某公共汽车站每隔5分钟有一辆汽车通过,乘客到达汽车站的任一时刻的可能性是相同的,求(1)乘客候车时间不超过3分钟的概率;(2)若甲、乙、丙分别独立等候1、2、3路汽车时,三人中至少有两个人等车时间不超过2分钟的概率。解解(1)设X为乘客候车时间,。(2)设Y=候车时间不超过2分钟的人数,A、B、C分别代表甲、乙、丙代表三人。2.3.2 指数分布指数分布 若一个连续型随机变量X具有概率密度函数:则称X为带参数a(a0)的指数分布随机变量指数分布随机变量,记作XE(a)。其分布函数为 “稀有事件”(在有限时间内只发生有限次,在极短时间内只发生一次)发生的事件间隔服从指数分布。电器元件的寿命也可认为服从指数分布。指数分布的密度函数与分布函数图像例例2.3.2 设某服务窗口接待顾客的时间T服从参数为1/10的 指数分布(单位:分钟),则其概率密度为 假设一次服务时间超过15分钟,顾客即评价为“不满意”,试求:(1)10位顾客中恰有两位评价为不满意的概率。(2)10位顾客中最多有两位评价为不满意的概率 (3)10位顾客中至少有两位评价为不满意的概率。解解 首先求出一位顾客评价为“不满意”的概率。设每位顾客的服务时间相互独立且服从相同参数1/10的指数分布,所以10为顾客中不满意的顾客数YB(10,0.2231)(1)10位顾客中恰有两位评价为不满意的概率 (2)10位顾客中最多有两位评价为不满意的概率(3)10位顾客中至少有两位评价为不满意的概率。自测题自测题 设随机变量X具有分布密度试确定,并求P(X0.1)。答案答案:=3 P(X0.1)=0.259指数分布的无记忆性指数分布的无记忆性:指数分布与几何分布一样有无记忆性,若XE(),对任意t0,s0,有 指数分布是连续随机变量中唯一具有无记忆性的概率分布(也被称作“永远年轻”的分布)。2.3.3 2.3.3 正态分布正态分布 称概率密度为 的随机变量X服从正正态态分分布布(高高斯斯分分布布),记作XN(,2),其中(-+)与(0)是常数。正态分布的分布函数是 说说明:明:在在理理论论上上可可以以证证明明,若若X是是某某一一随随机机试试验验的的随随机机变变量量,若若试试验验结结果果由由大大量量偶偶然然因因素素的的总总和和决决定定,各各个个偶偶然然因因素素之之间间近近乎乎相相互互独独立立,并并且且每每个个偶偶然然因因素素的的单单独独作作用用相相对对于于作作用用的的总总和来和来说说均匀地小,那么均匀地小,那么X就近似服从正就近似服从正态态分布。分布。正态分布(高斯Gauss)分布是最重要的连续型分布,在概率论中占有极其重要的地位。由于许多随机变量都服从或近似服从正态分布,正态分布有着十分广泛的实际应用。如测量误差;产品的质量指标(零件的尺寸、材料的强度、电子管的寿命);生物学中同一群体的某种特征(某种动物的身长、体重;某种植物的株高、单位面积产量,)等等。特别地称N(0,1)为标准正态分布,其概率密度常记为 其分布函数记为 一般正态分布的概率可由标准正态分布计算。一般正态分布的概率可由标准正态分布计算。若 X N(2),作 标 准 变 换(线 性 变 换):,则新的随机变量X*N(0 1)。由于 的原函数无显式表达,故标准正态分布被制成表格,供正反查用。若 XN(2),则当a-且b +时,F(x)=(+)-(-)=1。证证 ax=2 1-(x)证明例例 设XN(0,1),借助于标准正态分布的分布函数(x)的表计算:(1)PX-1.24 (2)P|X|1.54例例 设XN(0,1),求使P(|X|x)=0.1的x。例例2.3.3 设XN(-1 4),试求P(-5X1),P(-2 X2),P(|X|1),P(|X|3/2)解解 由题设知,=-1,2=4,=2 分别查标准正态分布表 查标准正态分布表查标准正态分布表 分别查标准正态分布表3法法则则:尽管正态分布的随机变量X的取值范围是(-,+),但X的值落在(-3,+3)内几乎是肯定的事。例例 设已知测量误差XN(0,102),现独立重复进行100次测量,求误差绝对值超过19.6的次数不少于3的概率。解解 这个问题既涉及正态分布,又涉及二项分布。第一步:以A表示一次测量中“误差绝对值超过19.6”的事件,则有 第二步:以Y表示100次独立重复测量中事件A发生的次数,则YB(100,0.05)。误差绝对值超过19.6的次数不少于3的概率为 P(Y3)=1-P(Y2)=)=0.8817第三步:由于n=100较大而p=0.05很小,故二项分布可用=np=5的泊松分布近似代替,得 例例2.3.5 公共汽车车门的高度是按男子与车门顶碰头的机会在0.01以下来设计的。设男子身高X服从=170cm,=6cm的正态分布,即XN(170,62),试确定车门的高度。解解 设车门的高度为hcm,根据设计要求应有 P(Xh)0.01,则 1-P(Xh)0.01 即 P(Xh)0.99 由于XN(170,62),例例2.3.6 (估计股价变化幅度)设某支股票的初始价格为S0=40元,预期收益率为每年16%,波动率为每年20%。在Black-Scholes模型下(Black和Scholes为1997年诺贝尔经济学奖得主),股票在每个时刻t的价格St为随机变量,且其中 试估计六个月后这支股票的价格范围(允许出错的概率为5%)解解 六个月即t=0.5年,所以由题设有例例 从南郊某地乘车前往北区火车站搭火车有两条路线可走,第一条穿过市区,路程较短,但交通拥挤,所需时间(单位为分钟)服从正态分布N(50,100),第二条沿环城公路走,路线较长,但意外堵塞较少,所需时间(单位为分钟)服从正态分布N(60,16)。(1)如有70分钟可用,问应走哪一条路线?(2)如只有65分钟可用,问应走哪一条路线?解解2.4 一一维维随机随机变变量函数的分布量函数的分布 在许多情形下,当随机变量X的分布律或密度函数fX(x)已知时,需要求出X的函数Y=f(X)的分布律或密度函数fX(x)的函数 fY(y)。为了使Y有分布,要求Y是随机变量,因此对函数Y=f(X)也必须有一定的要求。为简单起见,只讨论f(X)是连续、分段连续或单调的情形,在这些情形下,如果X是随机变量,则Yf(X)也是随机变量。在一些具体的分布中,可以了解解决这类问题的基本方法将与Y有关的事件转化成X的事件。离散型随机变量函数的分布离散型随机变量函数的分布 设随机变量 X 的分布律为 由已知函数g(x)可求出随机变量Y的所有可能取值,则Y 的概率分布律为即yi的每个概率值为X的函数值等于yi的那些概率值pk的和。或Y的概率分布列为(若某些f(xi)相等,同值项概率相加)为例例 设X的分布列为试求函数YX2,Z2X-1,W|X|+1 的分布列。解解 对于YX2,Y可取4,1,0,且对于Z2X-1,Z可取-5,-3,-1,1,3,且对于W|X|+1,W可取3,2,1,且上例可用表格表示:P0.15 0.20.20.20.25X-2-1012Y=X241014Z=2X-1-5-3-113W=|X|+132123合并函数值相同项的概率值,得Y=X20 14P 0.20.40.4 Z=2X-1-5-3-113P 0.150.20.20.20.25 W=|X|+11 23P 0.20.40.4 已知 X 的密度函数 f(x)或分布函数,求 Y=g(X)的密度函数方法:(1)从分布函数着手,先求出f(X)的分布函数,再对分布函数求导,得到f(X)的密度函数。(2)用公式直接求密度函数。连续性随机变量函数的分布连续性随机变量函数的分布例例 设随机变量X具有概率密度fX(x),(-x+),求Y=X2的概率密度。解解 分别记X、Y的分布函数为FX(x)FY(y)。先求Y=X2的分布函数FY(y)。因为Y=X20,故当y0时,FY(y)=P(Y=X2y)=0,例例 设连续型随机变量X的密度函数为fXx,试求Y=aX+b的密度函数fY(y),其中a,b是常数,且a0。解解 设Y的分布函数为FY(y),Y的密度函数为fY(y)。当a0时,有当a0时,有例例 设随机变量XN(,2),求 的密度函数Y(y)。解解 由于XN(,2)的密度函数是利用上例结果,得可见,当可见,当XN(,2)时,则时,则 ,表明服表明服从任一正态分布的随机变量必定可以标准化从任一正态分布的随机变量必定可以标准化(服从一般正态分布的随机变量经标准变换后服从标准正态分布)。书面作业书面作业 P48P50 2.1 2.14 2.5 2.15 2.6 2.17 2.7 2.18 2.8 2.20 2.10 2.21 2.13