条件概率与随机变量的独立性.ppt
3.2 条件概率与随机变量的独立性条件概率与随机变量的独立性一、条件分布的概念一、条件分布的概念 在第一章中,曾介绍了条件概率的概念,那是对随机事件在第一章中,曾介绍了条件概率的概念,那是对随机事件而说的。本节要从事件的条件概率引入随机变量的条件概率分而说的。本节要从事件的条件概率引入随机变量的条件概率分布的概念布的概念。引例引例 考虑某大学的全体学生,从中随机抽取一个学生,分考虑某大学的全体学生,从中随机抽取一个学生,分别以别以X和和Y表示其体重和身高,则表示其体重和身高,则X和和Y都是随机变量,它们都有都是随机变量,它们都有一定的概率分布。现在若限制一定的概率分布。现在若限制1.7Y1/2 的条件下的条件分布函数。的条件下的条件分布函数。解解因为因为X在在0,1上服从均匀分布,其分布函数为上服从均匀分布,其分布函数为由于由于X在在0,1上服从均匀分布,故上服从均匀分布,故当当 时,时,当当 时,时,由条件分布函数的定义,有由条件分布函数的定义,有从而从而二、二、随机变量的独立性随机变量的独立性 设设A是随机变量是随机变量Y所生成的事件所生成的事件:A=Yy,且,且则有则有 一般地一般地,由于随机变量由于随机变量X,Y之间存在相互联系之间存在相互联系,因而一个因而一个随机变量的取值可能会影响另一个随机变量的取值统计规律性。随机变量的取值可能会影响另一个随机变量的取值统计规律性。在何种情况下在何种情况下,随机变量随机变量X,Y之间没有上述影响之间没有上述影响,而具有所谓而具有所谓的的“独立性独立性”,我们引入如下定义。我们引入如下定义。定义定义1 设随机变量设随机变量(X,Y)的联合分布函数为的联合分布函数为F(x,y),边缘边缘分布函数为分布函数为FX(x),FY(y),若对任意实数若对任意实数x,y,有有即即则称则称随机变量随机变量X和和Y相互独立相互独立。注:注:若随机变若随机变量量X和和Y相互独相互独立,则联合分立,则联合分布由边缘分布布由边缘分布惟一确定。惟一确定。定理定理1 随机变量随机变量X与与Y相互独立的充要条件是相互独立的充要条件是X所生成的任所生成的任何事件与何事件与Y生成的任何事件独立生成的任何事件独立,即即,对任意实数集对任意实数集A,B,有有 定理定理2 如果随机变量如果随机变量X与与Y相互独立相互独立,则对任意函数则对任意函数 ,均有,均有 和和 相互独立。相互独立。证证令令对任意对任意x,y,记,记则由定理则由定理1,有,有从而,由定义知从而,由定义知 和和 相互独立。相互独立。关于两个随关于两个随机变量的独机变量的独立性的概念立性的概念可以推广到可以推广到n个随机变个随机变量的情形量的情形三、离散型随机变量的条件分布与独立性三、离散型随机变量的条件分布与独立性设设(X,Y)是二维离散型随机变量,其概率分布为是二维离散型随机变量,其概率分布为由条件概率公式,当由条件概率公式,当 时,有时,有称其为称其为在在 的条件下随机变量的条件下随机变量X的条件概率分布的条件概率分布。类似地,定义类似地,定义在在 的条件下随机变量的条件下随机变量Y的条件概率函数:的条件概率函数:条件分布是一种概率分布,它具有概率分布的一切性质。条件分布是一种概率分布,它具有概率分布的一切性质。定义定义2 若对若对(X,Y)的据有可能取值的据有可能取值(xi,yj),有,有即即则称则称X和和Y相互独立。相互独立。例例2 设设X和和Y的联合分布律为的联合分布律为 -1 0 20.1 0.2 00.3 0.05 0.10.15 0 0.1012(1)求求Y=0时,时,X的条件概率分布;的条件概率分布;(2)判断判断X与是否相互独立?与是否相互独立?解解(1)在在Y=0时,时,X的条件概率分布为的条件概率分布为 -1 0 20.1 0.2 00.3 0.05 0.10.15 0 0.1012即即X 0 1 2PX=xi|Y=0 0.8 0.2 0同理同理故故X=0时,时,Y的条件概率分布为的条件概率分布为(2)因为因为所以所以X与与Y不相互独立。不相互独立。而而 ,可见,可见即即Y -1 0 2PY=yi|X=0 1/3 2/3 0 例例3 设随机变量设随机变量X与与Y相互独立相互独立,下表列出了二维随机变下表列出了二维随机变量联合分布律及关于量联合分布律及关于X和关于和关于Y的边缘分布律中的部分数值的边缘分布律中的部分数值,试将其余数值填入表中的空白处试将其余数值填入表中的空白处.解解由于由于又因为又因为X与与Y相互独立,有相互独立,有又设又设则则由独立性,有由独立性,有解得解得或或于是于是四、连续型随机变量的条件密度与独立性四、连续型随机变量的条件密度与独立性设设(X,Y)是二维离散型随机变量,由于对任意的是二维离散型随机变量,由于对任意的x,y所以不能直接用条件概率公式引入所以不能直接用条件概率公式引入“条件分布函数条件分布函数”。定义定义3 设二维离散型随机变量设二维离散型随机变量(X,Y)的概率密度为的概率密度为f(x,y),边缘密度为边缘密度为fX(x),fY(y),则对一切使,则对一切使fX(x)0的的x,定义在,定义在X=x的条件下的条件下Y的条件概率密度为的条件概率密度为 类似地,类似地,对一切使对一切使fY(y)0的的y,定义在,定义在Y=y的条件下的条件下X的条件的条件概率密度为概率密度为关于定义内涵的解释:以关于定义内涵的解释:以 为例为例也就是说,对很小的也就是说,对很小的dx和和dy,fX|Y(x|y)表示已知表示已知Y取值于取值于y和和y+dy之间的条件下,之间的条件下,X取值于取值于x和和x+dx之间的条件概率之间的条件概率。运用条件概率密度,可以在已知某一随机变量值的条件下,运用条件概率密度,可以在已知某一随机变量值的条件下,定义与另一随机变量有关的事件的条件概率。即若定义与另一随机变量有关的事件的条件概率。即若(X,Y)是连续是连续型随机变量,则对任一集合型随机变量,则对任一集合A,特别地,取特别地,取A=(-,+),定义在已知,定义在已知Y=y的条件下的条件下X的条件分布的条件分布函数为函数为二维连续型随机变量的独立性二维连续型随机变量的独立性 定义定义4 设设(X,Y)为二维连续型随机变量,为二维连续型随机变量,f(x,y)为其联为其联合概率密度,合概率密度,fX(x),fY(y)分别为分别为X与与Y的边缘密度,的边缘密度,若任意若任意的的x,y,有有几乎处处成立,则称几乎处处成立,则称X,Y相互独立相互独立。注:注:“几乎处处成立几乎处处成立”的含义是:在平面上除去面积为的含义是:在平面上除去面积为0的的集合外,处处成立。集合外,处处成立。例例4 设设(X,Y)的概率密度为的概率密度为问问X和和Y是否独立?是否独立?解解当当x0时,时,所以所以同样,有同样,有当当x0时,时,而对一切而对一切x,y均有均有故故X与与Y相互独立。相互独立。例例5 甲乙两人约定中午甲乙两人约定中午12时时30分在某地会面分在某地会面.如果甲来到的如果甲来到的时间在时间在12:15到到12:45之间是均匀分布之间是均匀分布.乙独立地到达乙独立地到达,而且到达而且到达时间在时间在12:00到到13:00之间是均匀分布之间是均匀分布.试求先到的人等待另一人试求先到的人等待另一人到达的时间不超过到达的时间不超过5分钟的概率分钟的概率.又甲先到的概率是多少又甲先到的概率是多少?解解 设设X为甲到达时刻为甲到达时刻,Y为乙到达时刻为乙到达时刻,以以12时为起点时为起点,以分为单位以分为单位,依题意依题意,即有即有 由由X,Y独立性知独立性知先到的人等待另一人到达的时间不超过先到的人等待另一人到达的时间不超过5分钟的概率为分钟的概率为,甲先到的,甲先到的概率为概率为例例6 设设(1)求求 和和(2)证明证明X与与Y相互独立的充要条件是相互独立的充要条件是解解故在故在Y=y的条件下,的条件下,X服从正态分布:服从正态分布:对称地,在对称地,在X=x的条件下,的条件下,Y服从正态分布:服从正态分布:(2)比较比较 与与 和和 的密度的密度(3)函数函数:f(x,y),fX(x),fY(y)可知,当且仅当可知,当且仅当 时,时,即,当且仅当即,当且仅当 时,时,X与与Y 相互独立。相互独立。例例7 设随机变量设随机变量(X,Y)的概率密度为的概率密度为(2)求在求在Y=y的条件下,的条件下,X的条件概率密度。的条件概率密度。(1)求求X与与Y的边缘概率密度,并判断的边缘概率密度,并判断X与与Y相互独立相互独立。解解(1)由由 当当x0时,时,当当x0时,时,所以所以类似得类似得(2)求在求在Y=y的条件下,的条件下,X的条件概率密度。的条件概率密度。由由(1)知,当知,当y0时,时,fY(y)0的条件下,所以在的条件下,所以在Y=y的条件下,的条件下,X的条的条件概率密度为件概率密度为3.3 二维随机变量函数的分布二维随机变量函数的分布 在实际应用中,有些随机变量往往是两个或两个以上随机在实际应用中,有些随机变量往往是两个或两个以上随机变量的函数。变量的函数。例如,考虑全国年龄在例如,考虑全国年龄在40岁以上的人群,用岁以上的人群,用X和和Y分别表示一个人的年龄和体重,分别表示一个人的年龄和体重,Z表示这个人的血压,并且已表示这个人的血压,并且已知知Z与与X,Y的函数关系式的函数关系式现希望通过现希望通过(X,Y)的分布来确定的分布来确定Z的分布。此类问题就是我们的分布。此类问题就是我们将要讨论的将要讨论的两个随机向量函数的分布两个随机向量函数的分布问题问题.本节我们重点讨论两种特殊的函数本节我们重点讨论两种特殊的函数(1)Z=X+Y(2)Z=max(X,Y)和和Z=min(X,Y),其中,其中X和和Y相互独立。相互独立。注注:应该指出的是,将两个随机变量函数的分布问题推广:应该指出的是,将两个随机变量函数的分布问题推广到到n n个随机变量函数的分布问题只是表述和计算繁杂程度提高,个随机变量函数的分布问题只是表述和计算繁杂程度提高,并没有本质性的差异。并没有本质性的差异。一、离散型随机向量的函数分布一、离散型随机向量的函数分布 设设(X,Y)是二维随机向量,是二维随机向量,g(x,y)是二元函数,则是二元函数,则g(X,Y)作作为为(X,Y)的函数是一个随机变量。如果的函数是一个随机变量。如果(X,Y)的概率分布为:的概率分布为:设设Z=g(X,Y)的据有可能取值为的据有可能取值为zk,k=1,2,则则Z的概率分布的概率分布为为例如,若例如,若X,Y相互独立,且相互独立,且则则Z=X+Y的概率分布为的概率分布为即即这个公式称为这个公式称为离散型卷积公式离散型卷积公式例例1 设随机向量设随机向量(X,Y)的概率分布如下表的概率分布如下表-1 0 1 20.2 0.15 0.1 0.30.1 0 0.1 0.05-12求随机向量求随机向量(X,Y)的函数的函数Z的分布。的分布。(1)Z=X+Y(2)Z=XY解解由由(X,Y)的概率分布可得的概率分布可得 0.2 0.15 0.1 0.3 0.1 0 0.1 0.05 (-1,-1)(-1,0)(-1,1)(-1,2)(2,-1)(2,0)(2,1)(2,2)-2 -1 0 1 1 2 3 4 1 0 -1 -2 -2 0 2 4 0.2 0.15 0.1 0.3 0.1 0 0.1 0.05 (-1,-1)(-1,0)(-1,1)(-1,2)(2,-1)(2,0)(2,1)(2,2)-2 -1 0 1 1 2 3 4 1 0 -1 -2 -2 0 2 4 与一元离散型随机变量函数的分布的求法相同,与一元离散型随机变量函数的分布的求法相同,把把Z值相值相同项对应的概率值合并同项对应的概率值合并得得 0.2 0.15 0.1 0.4 0 0.1 0.05 -2 -1 0 1 2 3 4 -2 -1 0 1 2 4 0.4 0.1 0.15 0.2 0.1 0.05 (1)Z=X+Y的概率分布为的概率分布为(2)Z=XY的概率分布为的概率分布为 例例2 若若X和和Y相互独立相互独立,它们分别服从参数为它们分别服从参数为 ,的泊松的泊松分布分布,证明证明Z=X+Y服从参数为服从参数为 的泊松分布的泊松分布 解解依题意依题意由离散型卷积公式由离散型卷积公式即即Z=X+Y服从参数为服从参数为 的泊松分布的泊松分布 二、连续型随机向量的函数分布二、连续型随机向量的函数分布 设设(X,Y)是二维连续型随机向量,其概率密度为是二维连续型随机向量,其概率密度为f(x,y),令,令g(x,y)为一个二元函数,则为一个二元函数,则g(X,Y)j(X,Y)的函数。的函数。求求Z=g(X,Y)分布的一般方法:分布的一般方法:(1)求分布函数求分布函数FZ(z),其中其中DZ=(x,y)|g(x,y)z(2)求其概率密度求其概率密度fZ(z),对几乎据有的,对几乎据有的z,有,有 在求随机向量在求随机向量(X,Y)的函数的函数g(X,Y)的分布时,关键是的分布时,关键是设法设法将其转化为将其转化为(X,Y)在一定范围内取值的形式在一定范围内取值的形式,从而利用已知从而利用已知(X,Y)的分布求出的分布求出Z=g(X,Y)的分布的分布。例例3 设随机变量设随机变量X与与Y相互独立相互独立,且同服从且同服从0,1上的均匀上的均匀分布分布,试求试求 的分布函数与密度函数的分布函数与密度函数.解解依题意,先如右的草图,先求依题意,先如右的草图,先求FZ(z)当当z0时,因为时,因为|X-Y|0,所以所以当当0z0,则,则z-x0时时,若若x0,则,则fX(x)=0;若若z-x0,即,即zx,则则 fY(z-x)=0,故故 因此,当因此,当 0 xz时,时,综合得综合得2.及及 的分布的分布设随机变量设随机变量X,Y相互独立,其分布函数分别为相互独立,其分布函数分别为 和和由于由于 不大于不大于z等价于等价于X和和Y都大于都大于z,故有,故有类似地,可得类似地,可得 的分布函数为的分布函数为 关于关于M=maxX,Y和和N=minX,Y分布的结论可以推广分布的结论可以推广到到n个相互独立的随机变量的情形:个相互独立的随机变量的情形:设设X1,X2,Xn是是n个相互独立的随机变量,其分布函数个相互独立的随机变量,其分布函数分别为:分别为:(),则则 的分布函数为的分布函数为的分布函数为的分布函数为 例例6 设随机变量设随机变量X1,X2相互独立,并有相同的几何分布:相互独立,并有相同的几何分布:求求 的分布的分布解解方法一方法一因为因为所以所以方法二方法二