《条件概率的性质及其应用.doc》由会员分享,可在线阅读,更多相关《条件概率的性质及其应用.doc(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、条件概率及其应用摘 要概率论与数理统计就是研究随机现象的统计规律的一门学科,由于在生产生活等等各个方面随机现象具有普遍性,使得概率论与数理统计具有极其广阔的应用。概率论是对随机事物的现象进行统计规律演绎的研究,而数理统计又是对随机事物现象进行统计规律归纳的研究。并且条件概率这个概念有是概率论与数理统计的一个重要的内容和一个基本的工具。本文从条件概率的定义、性质、定理、应用这四个方面来解释、探讨、分析条件概率。近年来,由于一方面它为科学技术、工农业的生产等的现代化作出了极其重要的贡献;另一方面,广泛的应用也促进概率论与数理统计有了非常大的发展。本文从条件概率的定义、性质、定理这三个方面来解释、探
2、讨、分析条件概率。并从应用的角度对条件概率进行系统全面的阐述,把目前应用和后继发展进行兼顾考虑,随着科学技术、工农业的生产等的现代化的发展,该课题还存在大量的后续研究工作。关键词:条件概率;全概率公式;贝叶斯公式;应用引言或绪论等(内容略)第一章条件概率的定义和性质条件概率是概率论中的一个基本工具,在中产生活中有着重要作用。在现实的世界里很少存在单一的不受别的事件影响的情况,由于事件的概率经常会由于其他时间的影响而发生改变,所以这里我们引入条件概率这一概念。这样我们就能了解在事件B已经发生的情况下时间A发生的概率,这样也就解决了无条件概率不能解决的问题例1、设在N只鸡的总体中,有条是白鸡而且有
3、条是母鸡的。若事件A及事件B表示随机选取一条是白鸡及是母鸡,则P(A)= P(B)= 现在,以所有母鸡组成的子总体代替总体的位置,我们来计算从母鸡中随机选出的一只鸡是白鸡的概率。这概率就是/ ,其中是白色母鸡的数目。在研究某个特定的子集的时候,我们需要用一个新的符号来表达。一般所采用的符号是P(A|B),可读为“在事件B(所选出的鸡是母鸡的)发生的假定条件下,时间A(白鸡)发生的概率”。采用数学符号P(A|B) = 很显然,每一个子集本身总可以被考虑为一个总体。为了表达上的方便,我们说一个子集时,意思是说这个子集背后还有一个较大的总体。从上面的例子可以看出P(A)一般是与P(A|B)不同的。再
4、来看一个例子。例2、从标号为1、2、3、4的四个球中,等可能地任取一个球,那么事件A:“得标号为4”的概率P(A)=0.25 ;如果已知事件B:“得标号为偶数”已经出现,那么这时只剩下两种可能,或得2号或得4号,所以P(A|B)=0.5 在一般情况下,应该怎么样定义P(A|B)呢?由于频率与概率有很多类似的性质,先从频率的讨论开始。设A、B为任一个随机试验E中的两个事件,每次试验结果。不外是下列四种情况中的一种。(1)A出现 ,B不出现 (2)B出现,A不出现 (3)A,B都出现 (4)A,B都不出现。现在把E重复做n次,分别以n1、n2、n3、n4记下四种情况出现的次数,显然=n 。而且 B
5、的频率为(B)= , AB的频率为(AB)= , 在B已经出现的条件下,A的频率为(A|B)=,根据这些式子,得 (AB)=(A|B) (B)。因此,如(B)0 就有 (A|B)=这个式子告诉我们,如何去定义P(A|B)。我们就得到如下定义定义 设(,F,P)为概率空间,AF,BF,设P(B)0 。在事件B已出现的条件下,事件A出现的概率P(A|B)定义为P(A|B)= 对于古典类型的随机试验,设B含有m个不同的基本事件,m0 ,AB含有k个,以n表示中总共不同的基本事件的个数,则 P(A|B)= = 类似的可以知道,对于几何随机试验,例如F(B)0 ,我们有这样的式子P(A|B)= =容易验
6、证,条件概率具有概率定义中的三个基本性质:如果P(B)0 ,那么P(A|B)作为A的集函数是F上的概率;即(1)对每个AF,有1 P(A|B)0 ;(2)P(|B)=1 ;(3)如F,m=1,2,. ,两两互不相容,则有 现在对上面的三个性质进行证明:证 (1)因 ,0 ,故由(3)知1 P(A|B)0(2) =1(3) =第二章条件概率的三定理现在对条件概率来证明三条重要的定理,这就是:概率的乘法定理,全概率公式与贝叶斯(Bayes)公式。这些定理在概率的计算中起着重要的作为。2.1 概率的乘法定理定理1 设,.,为n个事件,n 2,满足0 ;则 =上式称为乘法公式。它的直观意义是:,.,同
7、时出现的概率,等于出现,在出现的条件下出现,在,出现的条件下出现,各自的概率的乘积。证 由于0,故 =右方出现的条件概率都有意义;由条件概率的定义有例1 设箱子内有a(a2)个白球b个黑球,在其中接连取三次,每一次取出一个球,取球后不还原,问三个取出来的求都是白球的概率是多少?解 以表示“第i次取得白球”这一个事件,i=1、2、3、要求的是 。因为故可用 = 。显然 。如已知第一次取得白球,箱内只剩下a-1个白球b个黑球,可见 ,类似得= 。于是由概率的乘法公式得注:这个例子中随机试验是复合的:= 。共含有a+b个,共含有a+b-1个,共含有a+b-2个,=(白球,球,球),=(球,白球,球)
8、,=(球,球,白球),这里“球”不论是白或者黑均可。事件对第一次试验的结果加了条件, 。如已知出现,那么由a-1个白球b个黑球组成,所以 。如已知前二次都是得到的白球,则由a-2个白球b个黑球构成,所以= 。 注意到随机试验依赖于随机试验后的结果,随机试验依赖于随机试验和随机试验的结果,所以说、 、 都是相依的随机试验。例2 设一批产品总共有N件,其中有M件产品是次品,不放回地抽取三件,试求第三件猜抽到的是正品的概率。解 令 =抽到的第i件是正品, i=1、2、3于是表示抽到的第i件是次品,故所求的概率是注:上例中的概率也可以直接用古典方法求得,但是不如使用乘法公式简单方便。这个公式中的条件概
9、率不要从定义出发来求,而应从该条件所限制的一个较小样本空间内来求古典概率。2.2 概率的全概率公式定理2 设,为有穷或者可列多个互不相容的事件,=1,0,(n=1,2,3,),则对任何一个事件,有.上面的式子称为全概率公式。证明 :由于=1得到=0 。因为互不相容,故也互不相容,n=1,2,3,于是 由条件概率的乘法公式;带入上面的式子得到例1 设甲盒子中有a个白球b个黑球,a0,b0,乙盒子中有c个白球d个黑球,自甲盒子中任意取一球放入乙盒子中,然后再从乙盒子中任取一球,试求事件A:“从乙盒子中取得的球为白球”的概率。解 以表事件“自甲盒子中取出的球为白(黑)球”,显然=,所以=1,又0 0
10、 ,由全概率公式。但是如出现,那么乙盒子中有c+1个白球,d个黑球,所以= ;类似得到=。代入中便得到例2 某个工厂有四条流水线生产同一种产品,该四条流水线的产量分别占产量的15%、20%、30% 和35%,又这四条流水线的不合格品率依次为0.05、0.04、0.03以及0.02 。现在从出厂产品中任意取一件产品,问恰好抽到不合格品的概率为多少?又若该工厂规定,处了不合格的产品要追究有关流水线的经济责任,现在在出厂产品中任意取一件,结果为不合格品,但是该件产品是哪一条流水线生产的标志已经脱落,问厂方如何处理这件不合格品比较合理?比方说,第一条(或者第二条、第三条、第四条)流水线应该承担多大的责
11、任?解 令 A=任取一件,恰好抽到不合格品 B=任取一件,恰好抽到第i条流水线的产品 (i=1、2、3、4)于是由全概率公式得到=0.0315=3.15%其中,分别为0.05、0.04、0.03、0.02 。这是题目中告诉我们的。在实际问题中,这些数据可以从过去的生产的产品中统计出来。下面来解决下面的问题。从概率论的角度考虑可以按的大小来追究第i条(i=1、2、3、4)流水线的经济责任。例如,对于第四条流水线,由条件概率的定义知在前面的计算当中,已经利用全概率公式来求得=0.0315=3.15%而于是有由此可知,第四条流水线应该负有22.2%的责任。这个结果是容易理解的,虽然第四条流水线的产量
12、占总产量的35%,但是他的不合格率却不是很高,他生产的不合格品只占总不合格品的22.2% ,所以在来计算下、和由此可知,第一条流水线应该负有23.8%的责任。由此可知,第二条流水线应该负有25.4%的责任。由此可知,第三条流水线应该负有28.6%的责任。上面的计算中实际上已经建立了一个非常有用的公式常常称为贝叶斯公式。2.3 概率的贝叶斯公式定理3 设,为有穷或者可列多个互不相容的事件,=1,0,(n=1,2,3,),则对任何一个事件A,0 , 有上面的式子称为贝叶斯公式证明 :由条件概率的定义及全概率公式得到例子 设甲乙丙三个盒子中 甲盒子中有 个白球 个黑球 乙盒子中有 个白球 个黑球 丙
13、盒子中有 个白球 个黑球 , 现在任意取出一盒子,再从这个盒子当中取出来一个球,结果发现这个球为白球。试在事件A“此球为白球”的条件下,求事件“这个球是属于甲盒子的”条件概率。解 这里,这里分别表示“这个球属于甲盒子” “这个球属于乙盒子” “这个球属于丙盒子”,这三个互不相容的事件,所以;又由全概率公式0所以可以用贝叶斯公式得到=贝叶斯公式通常用在下列实际问题中:设只可能出现 共有有穷个或者可列多种不同的情况,而事件A只能伴随着这些情况之一发生。如今A已经出现的情况下,试求发生了情况的条件概率。例子 有朋自远方来,他乘坐火车来的概率是 ,乘船来,或者乘坐汽车来,或者乘坐飞机来的概率分别是,
14、, ,如果他乘坐火车来,迟到的概率是 ;如果他乘坐船或者乘坐汽车,那么迟到的概率分别为 , ; 如果乘坐飞机来便不会迟到(因而。这时迟到的概率为0)。结果他是迟到了,试问在此条件下,他乘坐的是火车的概率是多少?解 以事件A表示“迟到”, 分别表示“乘坐火车”“乘船”“乘坐飞机”,这样于是注意 与是不同的。类似的,如果以事件A的对立事件 (不迟到)代替上面式子中的A ,就得到 2.4 概率的三定理的综合应用下列中各个例子可以说明上述定理的联合应用例1 设甲乙二人在装有a个白球和b个黑球的盒子中任意取出一个球,从甲开始然后轮流取球。每次取后不还原,试求甲(或者乙)先取出的是白球的概率(或者)。解
15、为了使甲先取出一个白球,必须也只须或者甲第一次就取出的球是白球(记为“白”),或者甲第一次取出的球是黑球,乙第二次取出的球是黑球,甲第三次取出的球为白球(记为“黑、黑、白”) 因而事件“甲先取出的球是白球”可以表示为互不相容的事件“白”、“黑、黑、白”、“黑、黑、黑、黑、白” 的和,然而事件“白”的概率为 ,事件“黑、黑、白”的概率可用概率的乘法公式 =来计算得出 ,事件“黑、黑、黑、黑、白”的概率任然可以用概率的乘法公式来计算出,所以同样得到注意,由于b是有穷数,故上面两个式子右方中自某一项起全为0,又因为甲、乙二人中,总有一个人先取出白色的球,故。以、的值代入并且简化后,得到等式于是我们附
16、带地用概率的方法证明了上面的恒等式。用概率的方法来证明一些关系或者解决其他一些数学分析中的问题。是概率论中的重要研究方向之一。例2 从装有a个白球和b个黑球的盒子中同时取出n个球,试求至少取出一白球的概率p 。解 先求对立事件的概率,事件B:“取出的全部是黑球”的概率是 所以还可以用另一个让发求得p :同时取出n个球可以看成不还原地连续取出n次,每次取出一个球。为了使n次中至少取出一白球,必须也只须或者第一次就得到白球(概率为),或者第一次取出的是黑球第二次取出的是白球(概率为),这些事件互不相容,所以比较上面的两个式子,可见它们右方的值相等,于是又得到恒等式:当a0时第三章条件概率的应用在前
17、面的内容中我们认识的大多概率都是在样本空间中的。并且只是计算了一些条件概率,许多的实验都是用某些特定的条件概率来描述。在理论上这意味着:样本空间中的概率可由给定的条件概率中推到出来。下面来介绍几个条件概率的应用3.1 用条件概率所定义的概率波利亚罐子模型罐子模型。一个罐子中包括b个黑球与r个红球。随机地抽取一个球。看了颜色再放,并且还要另外加进去c个与抽出来的球具有同样颜色的球和d个相反颜色的球(这个时候罐子里面就有r+b+c+d个球了),这种过程反复地进行,其中c和d是任意的整数。C和d可以取为负数,不过在这种情形下经过有限次取球之后会因为没有了球而停止。特别的,取c=-1,d=0,则我们的
18、抽样就变成了无放回的抽样,它在r+b次以后就结束现在我们转向数学描述,注意一点就是,某些基本的概率可以通过它所确定的条件概率来计算。对应于n次抽取的样本空间的典型的描述法是用n个字母B和R的序列来代表其样本点。事件“第一次取出的球是黑的”(即是第一个字母是B的全部序列所构成的集合)的概率为。如果第一个球是黑色的球,则第二次取出的球的颜色任然为黑色的概率是因此黑黑的概率为黑黑黑的概率为显然这样的方法可以计算出每一个样本点的概率概率的显式表达式不是很容易得到的,除非在下面介绍的一个重要的而且著名的特殊情形:波利亚管子模型,其特征是d=0,c0。每次抽取后,这时候与取出来的球有相同颜色的球的数目增加
19、,而与取出的球的颜色不同的球的数目保持不变。在效果上看,每一次取出的球是什么颜色增加了下一次也取到这种颜色球的概率,因此,我们得带到了类似传染病的一个模型,在这其中,每一次传染以后都增加再传染的概率。在n次抽取中,先取出个黑球后在取出个红球(这当中)的概率是考虑n个抽取为个黑球, 个红球的其他抽取顺序,计算它的概率,发现因子是相同的,只是排列的次序是不同的。因此可以得到抽出个黑球和 个红球的所有可能的抽取方式具有不同的概率,这为波利亚罐子模型咋分析上的简明性,分子分母同乘以,即是所有的排列的数目,利用广义二项式系式得到下列形式:3.2 配对问题例 有n张信纸,分别标号为1,2,3,n,另外有n个信封也同样标号,今将每一张信纸任意的装入每一个信封中,试求“没有一个配对”的概率及“恰有r个配对成功”的概率(),这里说的“r个配对”是指的是有r张信纸,分别装入同号码的信封。解 以表示“第i号信纸装入第i号信封”这一事件,则为了求,利用一般加法公式。第i号信纸可以装入n个信封,恰好装入第i号信封的概率,故如出现,第j号信纸共有n-1个信封可以选择,故从而类似地一般有 ,(r=1,2,n)于是注意与n有关,如记为则利用 便不难求出 。如果指定某r张信纸装入对应的信封中,这事件的概率为其余n-r张信纸中没有一个配对成功的概率为由于r张配对的信纸一共有种选择的方法,所以注意当时候,
限制150内