概率论与数理统计 — 第一章 概率论的基本概念.doc
授课章节 第一章 概率论的基本概念 目的要求了解随机试验,掌握随机事件及其概率、全概率公式、独立性。重点难点重点:等可能概型,难点:贝叶斯公式。在自然界与人类社会生活中,存在着两类截然不同的现象:确定性现象和随机现象。确定性现象:在一定条件下必然发生的现象称为确定性现象。例如:早晨太阳必然从东方升起;在标准大气压下,纯水加热到100摄氏度必然沸腾;边长为a、b的矩形,其面积必为ab等。确定性现象的特征是条件完全决定结果,它们之间的数量关系可以用函数加以描述。随机现象:在一定的条件下,可能出现这样的结果,也可能出现那样的结果,而在试验或观察之前不能预知确切的结果。例如:某地区的年降雨量;打靶射击时,弹着点离靶心的距离;投掷一枚均匀的硬币,可能出现“正面”和“反面”情况等等。随机现象的特征是条件不能完全决定结果,它们之间的数量关系无法用函数加以描述。随机现象在一次观察中出现什么结果具有偶然性, 但在大量试验或观察中, 这种结果的出现具有一定的统计规律性 , 概率论就是研究随机现象这种本质规律的一门数学学科。§1 随机试验我们遇到过各种试验。但在概率论中的试验是一个含义广泛的术语,它包括各种各样的科学试验,甚至对某一事物的某一特征的观察也认为是一种试验。下面举一些试验的例子:E1 :抛一枚硬币,观察正面、反面出现的情况。E2 :将一枚硬币抛三次,观察正面、反面出现的情况。E3 :将一枚硬币抛三次,观察出现正面的次数。E4 :掷一枚骰子,观察出现的点数。E5 :记录某城市120急救电话台一昼夜接到呼叫的次数。E6 :在一批灯泡中任意抽取一只,测试它的寿命。E7 :记录某地一昼夜的最高温度和最低温度。这些试验都具有以下的特点:1、 可以在相同的条件下重复地进行;2、 每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;3、 进行一次试验之前不能确定哪个结果一定出现或一定不出现。在概率论中,我们将具有上述三个特点的试验称为随机试验。§2 样本空间、随机事件(一)样本空间对于随机试验,尽管在每次试验之前不能预知试验的结果,但试验的一切可能的结果是已知的,我们把随机试验的所有可能结果组成的集合称为的样本空间,记为。样本空间的元素,即E的每个结果,称为样本点。例如,上面的7个随机试验的样本空间分别为:E1 :抛一枚硬币,观察正面、反面出现的情况。;E2 :将一枚硬币抛三次,观察正面、反面出现的情况。;E3 :将一枚硬币抛三次,观察出现正面的次数。; E4 :掷一枚骰子,观察出现的点数。;E5 :记录某城市120急救电话台一昼夜接到呼叫的次数。;E6 :在一批灯泡中任意抽取一只,测试它的寿命。;E7 :记录某地一昼夜的最高温度和最低温度。;这里表示最低温度,表示最高温度。并设这一地区的温度不会小于T0,也不会大于T1。(二)随机事件实际上,在进行随机试验时,人们往往关心满足某种条件的那些样本点所组成的子集。例如,若规定某种灯泡的寿命(小时)少于500为次品,即在E5中,我们关心的结果是否发生。显然,是的一个子集。我们就称这样的子集为随机事件。随机事件常用大写字母表示,它是样本空间的子集合。在每次试验中,当且仅当子集中的一个样本点出现时,称事件发生。例如在E4中,如果用表示事件“掷出奇点数”,那么是一个随机事件。由于在一次投掷中,当且仅当掷出的点数是1,3,5中的任何一个时才称事件A发生了,所以我们把事件A表示为。同样地,若用表示事件“掷出偶点数”,那么B也是一个随机事件,。对于一个试验,在每次试验中必然发生的事件,称为的必然事件;在每次试验中都不发生的事件,称为的不可能事件。例如在中,“掷出的点数不超过6”就是必然事件,用集合表示这一事件就是的样本空间.而事件“掷出的点数大于6”是不可能事件,这个事件不包括的任何一个可能结果,所以用空集表示。对于一个试验,它的样本空间是的必然事件;空集是不可能事件。必然事件与不可能事件虽已无随机性可言,但在概率论中,常把它们当作两个特殊的随机事件,这样做是为了数学处理上的方便。(三)事件间的关系与运算因为事件是一个集合,因而事件间的关系和运算是按集合间的关系和运算来处理的。下面给出这些关系和运算在概率中的提法。并根据“事件发生”的含义,给出它们在概率中的含义。设试验的样本空间为,而是的子集。1°事件的包含与相等 事件“若事件A发生必然导致事件B发生”称事件B包含事件A,记为或者。若且,则称事件A与事件B相等,记。2°事件的和 事件“与至少有一个发生”称为事件与事件的和,记为。事件发生意味着:或事件发生,或事件发生,或事件与事件都发生。事件的和可以推广到多个事件的情景。设有个事件,定义它们的和事件中至少有一个发生为。3°事件的积 事件“与都发生”称为事件与事件的积事件,记为,也简记为。事件(或)发生意味着事件发生且事件也发生,即与都发生。类似的,可以定义个事件的积事件=都发生。4°事件的差 事件“发生而不发生”称为事件与事件的差事件,记为。5°互不相容事件(互斥) 若事件与事件不能同时发生,即,则称事件与事件是互斥的,或称它们是互不相容的。 若事件中的任意两个都互斥,则称这些事件是两两互斥的。6°对立事件 事件“不发生”称为事件的对立事件,记为.和满足:,。事件运算满足的定律 设为事件,则有交换律:;。结合律:;。分配律:;。德·摩根律:;。§3 频率与概率(一) 频率 定义设为任一随机试验,为其中任一事件,在相同条件下,把独立的重复做次,表示事件在这次试验中出现的次数(称为频数)。比值称为事件在这次试验中出现的频率。频率满足具有性质:1° ;2° ;3° 若A1、A2、 两两互斥的事件,则人们在实践中发现:在相同条件下重复进行同一试验,当试验次数很大时,某事件发生的频率具有一定的“稳定性”,就是说其值在某确定的数值上下摆动。一般说,试验次数越大,事件发生的频率就越接近那个确定的数值。因此事件发生的可能性的大小就可以用这个数量指标来描述。(二)概率定义概率的统计定义 设有随机试验,若当试验的次数充分大时,事件的发生频率稳定在某数附近摆动,则称数为事件的概率,记为P(A),即。概率的这种定义,称为概率的统计定义,统计定义是以试验为基础的,但这并不是说概率取决于试验。值得注意的是事件出现的概率是事件的一种属性。也就是说完全决定于事件本身的结果,是先于试验客观存在的。概率的统计定义只是描述性的,一般不能用来计算事件的概率。通常只能在充分大时,以事件出现的频率作为事件概率的近似值。对于任意事件A,由频率的三个性质可得由它产生的概率P(A)也满足这三个性质,下面给出概率的公理化定义。设E是随机试验,S为它的样本空间,给E的每一个事件A赋一个实数值,记做P(A),如果它满足:(1)非负性 。(2)规范性 。(3)可列可加性, 设 A1、A2、 两两互斥的事件,则 则称P(A)为事件A的概率。 概率的性质:(1) .(2) 设 A1、A2、An 两两互斥的事件,则此性质称为有限可加性。特殊的,若,则。(3)设A、B是两个事件,若,则有 ,既有。(4)对于任意事件A,有。(5)(逆事件概率)对于任意事件A,有。(6)(加法公式)对任意两个事件,有.这条性质可以推广到多个事件。设是任意个事件,则有 。它符合“加奇减偶”法则。Example 1.2 设事件的概率分别为 .在下列三种情况下分别求的值:()与互斥;()()解:由性质(5),=.(1) 因为与互斥,所以,=(2) 因为所以=(3) =§4 等可能概型(古典概型)“概型”是指某种概率模型。“古典概型”是一种最简单、最直观的概率模型。在上节的概率模型中:E1 :抛一枚硬币,观察正面、反面出现的情况,。E2 :将一枚硬币抛三次,观察正面、反面出现的情况。E4 :掷一枚骰子,观察出现的点数,。它们相同的特点是,样本点总数有限,出现每个样本点的机会(概率)相同。我们把具有这种特点的概率模型称为等可能概型或古典概型,一般地定义如下: E是随机试验,S为样本空间,如果满足:1° 样本点总数有限,即,n为有限数。2° 试验时,发生每个样本点的机会相同。称这样的试验模型E为等可能概型或古典概型。下面给出等可能概型中事件概率的计算公式。设等可能概型E有n个样本点,即,A为事件,它包含k个样本点,即。试验时,把发生每个样本点看成事件、,显然,它们是互不相容的且满足:,这样就有,所以,对每一个i ,有 。又,所以。这就是等可能概型中事件概率的计算公式。例1 某企业有员工200人,其中男员工160人,女员工40人,现随机抽取一人参加会议,问抽取到女员工的概率?解:将200人编号1200号,其中男员工1160号,女员工161200号,样本空间为 ,显然这是等可能概型,设A = “抽取到女员工”,则,从而, 。例2 袋中有五只大小形状相同的球,其中三只黑色球,两只白色球。现从袋中随机地取出两只球,求取出的两球都是黑色球的概率。解:将五只球编号1、2、,带圈的为黑球,样本空间S = (1,2), (1, ),(1, ),(1, ),(2, ),(2, ),(2, ),(, ), (, ),(, ),显然这是等可能概型,设A =“取出的两球都是黑色球”,则A = (, ), (, ),(, ),即 。在例2中,球的个数只有5只,这使得我们可以将所有的样本点一一地列出,显然,当球的个数很多时这种方法是不可取的。事实上,在计算概率时,我们不需要每个样本点的具体结果,而只需知道样本点总数和事件A包含样本点数即可。再看样本空间中的每个样本点,它正是5个元素(1、2、)取两个元素组合的结果,因此应共有不同的结果,而事件A包含样本点正是三个元素(、)取两个元素组合的结果,因此应共有不同的结果,所以, 。例3 箱中装有100个产品,其中有3个次品,为检查产品质量,从这箱产品中任意抽5个,求抽得5个产品中恰有一个次品的概率。解:从100个产品中任意抽取5个产品,共有种抽取方法,就是说样本空间共有元素。设 事件=“抽得5个产品中恰有一个次品”,则包含样本点数个,故得事件的概率为例4 将n个球随机地放入N(N n)个盒子中,求每个盒子至多有一个球的概率(设盒子的容量不限)。解: 这显然也是等可能问题。先求n个球随机地放入N个盒子的方法总数。因为每个球都可以落入N个盒子中的任何一个,有N种不同的放法,所以n个球放入N个盒子共有种不同的放法。设事件A =“每个盒子至多有一个球”,下面讨论共有多少种放法。第一个球可以放进N个盒子之一,有N种放法;第二个球只能放进余下的N 1个盒子之一,有N 1种放法;第n个球只能放进余下的个盒子之一,有种放法;所以共有种不同的放法。故得事件的概率为。有许多实际问题与例4具有相同的数学模型。例如,假设每一个人的生日在一年365天中的任一天是等可能的,即都等于1/365,那么,随机选取n(365)个人,他们的生日各不相同的概率是:,因此,n个人中至少有两个人的生日在同一天的概率是:。经计算有:n 20 23 30 40 50 64 100p0.411 0.507 0.706 0.891 0.970 0.997 0.从表上可以看出,在一个64人的集体中,“至少有两个人的生日在同一天”这件事的概率与1相差无几。在实际调查中,几乎总是会发生的,大家可以不妨一试。在统计学中,如果这件事没发生,就有相当的理由认为这个集体的人员是刻意构造的。例4 某接待站在一周内曾接待过12位来访者,已知这12位来访者都是在周二和周四进行,问是否可以推断接待日是有规定的。解:假设接待日无规定,那么每位来访者在一周内的任一天上访是等可能的,把12位来访者看成12只球,一周7天理解为7只盒子,则12只球随机放入7只盒子共有712种不同的放法。而事实上,12只球仅放入2只盒子(周二和周四)共有212种不同的放法。这样,12位来访者都是在周二和周四进行的概率是。人们在长期的实践中得出一个实际推断原理“概率很小的事件在一次实验时几乎是不发生的”。由此,可以推断出:“接待日是有规定的”。那么,接待日规定在哪些天呢? 同样的方法可以推断接待日就是周二和周四。§5 条件概率材色(一) 条件概率在实际问题中,常常会遇到这样的问题:在得到某个信息以后(即在已知事件发生的条件下),求事件发生的概率。这时,因为求的概率是在已知发生的条件下,所以称为在事件发生的条件下事件发生的条件概率,记为。同理称为事件B发生的条件下事件A发生的条件概率。例1 袋中有球22只,其颜色和材质分布如下:木质玻璃白色57黑色46从中摸球一只,记A =“摸到木质球”,B =“摸到白色球”,则,如果求在摸到木质球的条件下,该球为白色球的概率,即,同理,。在这个例子中,这个结果具有普遍性,即对任意的事件A和B 有:。它称为条件概率公式。(二)乘法公式由条件概率公式,可得乘法公式: 或 。乘法公式还可以推广到多个事件乘积的概率,如,还有其它顺序的乘法公式。, 例2 袋中有r只红球,t只白球。每次自袋中摸球一只,观察颜色后放回,并同时再放入同颜色的球a只。若在袋中连续摸球四次,试求第一、二次摸到红球,第三、四次摸到白球的概率。解:设Ai =“第i次摸到红球”,i = 1、2、3、4 ,则所求概率为 。(三)全概率公式和贝叶斯公式为了计算复杂事件的概率,经常把一个复杂事件分解为若干个互不相容的简单事件的和,通过分别计算简单事件的概率,来求得复杂事件的概率。首先给出划分的定义。定义:设E是随机试验,S是样本空间,B1、B2、Bn 为E的一组事件,如果(i)B1、B2、Bn 为两两互不相容,即Bi Bj = ,(ii)B1B2Bn = S ,则称B1、B2、Bn 为样本空间S的一个划分。定理1 设E是随机试验,S是样本空间,B1、B2、Bn 为E的一组事件,A为E的事件,则此公式称全概率公式。定理2 设E是随机试验,S是样本空间,B1、B2、Bn 为E的一组事件,A为E的事件,则此公式称贝叶斯公式也称逆概率公式。例3 某电子设备制造厂所用的元件是由三家元件制造厂提供的,根据以往的记录有如下数据:元件制造厂次品率提供的份额10.020.1520.010.8030.030.05设这三家工厂的产品在仓库中均匀混合放置的,且无区别的标志。(1)在仓库中随机抽取一只元件,求它是次品的概率。(2)在仓库中随机抽取一只元件,若已知它是次品,求它是来自每个厂的概率。 解:设A =“取到的是一只次品”,Bi =“取到的是第i厂制造的”,i = 1、2、3 。易知B1、B2、B3是样本空间的一个划分。(1)由全概率公式,(2)由贝叶斯公式由此可见,这只次品来自第2个厂家的概率最大。例4 七人分得三张参观票,采用轮流抓阄的方式分配这张参观票,问这种方式是否公平?解: 设=“第人抓到参观票”(i = 1,2,7),于是, ,。从这道题,我们可以看到,第一个人、第二个人、 抓到参观票的概率一样。这就是“抓阄不分先后原理”。例5 发报台分别以概率0.6和0.4发出信号“· ”和“”,由于通讯系统受到干扰,当发出信号“· ”时,收报台未必收到信号“· ”,而是分别以0.8和0.2收到“· ”和“”;同样,发出“”时分别以0.9和0.1收到“”和“· ” 。如果收报台收到“· ”,问它没收错的概率?解: 设=“发报台发出信号· ”,=“发报台发出信号 ”,“收报台收到· ” ,“收报台收到 ”;于是,;按贝叶斯公式,有所以没收错的概率为.例6 根据以往的记录,某种诊断癌症的试验有如下效果:若以A表示事件“试验反应为阳性”,以C表示事件“被诊断者患有癌症”,则有 , 。现在对自然人群进行普查,设被试验的人患有癌症的概率为0.005,即,试求。解:,而,所以,即 ,本题的结果表明,虽然,这两个概率都很高。但若将此实验用于普查,则有,即其正确性只有8.7%.如果不注意到这一点,将会经常得出错误的诊断。这也说明,若将和搞混了会造成不良的后果。§5 独立性设A,B是两个事件,一般而言,这表示事件B的发生对事件A的发生的概率有影响,只有当时才可以认为B的发生与否对A的发生毫无影响,这时称事件B独立于事件A ;同理, 称事件A独立于事件B 。如果,由乘法公式得,另一方面,由 可导出 ,即两个事件独立是互称的。定义: 若两事件A,B满足,则称A,B相互独立。若三事件A,B,C 满足:,则称A,B,C相互独立。同理给出更多个事件独立的定义。注意,多个事件中两两独立并不能保证它们相互独立。定理1 若四对事件中有一对是相互独立的,则另外三对也是相互独立的。证明:设相互独立,即。因为,所以,即相互独立。同理可证其它。在实际问题中,我们一般不用定义来判断两事件,是否相互独立,而是相反,从试验的具体条件以及试验的具体本质分析去判断它们有无关联,是否独立?如果独立,就可以用定义中的公式来计算积事件的概率了。常见的独立模型有两个:射击模型和有放回的抽样。例1 两门高射炮彼此独立的射击一架敌机,设甲炮击中敌机的概率为0.1,乙炮击中敌机的概率为0.2,求敌机被击中的概率?解: 设=甲炮击中敌机,=乙炮击中敌机,那么敌机被击中=;因为与相互独立,所以,有注意:事件的独立性与互斥是两码事,互斥性表示两个事件不能同时发生,而独立性则表示他们彼此不影响。例1 某种类型的高射炮击中敌机的概率是0.1,问至少需配备多少门这样的高射炮,才能以99%的把握击中来犯的敌机?解:设至少需配备n门这样的高射炮。再设Ai =“第i门炮击中敌机”,i = 1、2、n,则事件“击中敌机”就是“至少有一门炮击中敌机”,即,这样,本题的问题就是选择最小的n,使。因为即