概率论与数理统计_.doc
随机事件和概率第一节 基本概念1、排列组合初步(1)排列组合公式 从m个人中挑出n个人进行排列的可能数。 从m个人中挑出n个人进行组合的可能数。 (2)加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。(3)乘法原理(两个步骤分别不能完成这件事):m×n某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。(4)一些常见排列 特殊排列 相邻 彼此隔开 顺序一定和不可分辨 重复排列和非重复排列(有序) 对立事件 顺序问题2、随机试验、随机事件及其运算(1)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。(2)事件的关系与运算关系:如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):如果同时有,则称事件A与事件B等价,或称A等于B:A=B。A、B中至少有一个发生的事件:AB,或者A+B。属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。A、B同时发生:AB,或者AB。AB=Ø,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。-A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。运算: 结合率:A(BC)=(AB)C A(BC)=(AB)C 分配率:(AB)C=(AC)(BC) (AB)C=(AC)(BC) 德摩根率: ,3、概率的定义和性质(1)概率的公理化定义设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:1° 0P(A)1, 2° P() =13° 对于两两互不相容的事件,有常称为可列(完全)可加性。则称P(A)为事件的概率。(2)古典概型(等可能概型)1° ,2° 。设任一事件,它是由组成的,则有P(A)= =4、五大公式(加法、减法、乘法、全概、贝叶斯)(1)加法公式P(A+B)=P(A)+P(B)-P(AB)当P(AB)0时,P(A+B)=P(A)+P(B)(2)减法公式P(A-B)=P(A)-P(AB)当BA时,P(A-B)=P(A)-P(B)当A=时,P()=1- P(B)(3)条件概率和乘法公式定义 设A、B是两个事件,且P(A)>0,则称为事件A发生条件下,事件B发生的条件概率,记为。条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(/B)=1P(/A)=1-P(B/A)乘法公式:更一般地,对事件A1,A2,An,若P(A1A2An-1)>0,则有。(4)全概公式设事件满足1°两两互不相容,2°,则有。此公式即为全概率公式。(5)贝叶斯公式设事件,及满足1° ,两两互不相容,>0,1,2,2° ,则,i=1,2,n。此公式即为贝叶斯公式。,(,),通常叫先验概率。,(,),通常称为后验概率。如果我们把当作观察的“结果”,而,理解为“原因”,则贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。5、事件的独立性和伯努利试验(1)两个事件的独立性设事件、满足,则称事件、是相互独立的(这个性质不是想当然成立的)。 若事件、相互独立,且,则有所以这与我们所理解的独立性是一致的。若事件、相互独立,则可得到与、与、与也都相互独立。(证明)由定义,我们可知必然事件和不可能事件Ø与任何事件都相互独立。(证明) 同时,Ø与任何事件都互斥。(2)多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)并且同时满足P(ABC)=P(A)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。两两互斥互相互斥。两两独立互相独立?(3)伯努利试验定义 我们作了次试验,且满足u 每次试验只有两种可能结果,发生或不发生;u 次试验是重复进行的,即发生的概率每次均一样;u 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。这种试验称为伯努利概型,或称为重伯努利试验。用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,。随机变量及其分布第一节 基本概念在许多试验中,观察的对象常常是一个随同取值的量。例如掷一颗骰子出现的点数,它本身就是一个数值,因此P(A)这个函数可以看作是普通函数(定义域和值域都是数字,数字到数字)。但是观察硬币出现正面还是反面,就不能简单理解为普通函数。但我们可以通过下面的方法使它与数值联系起来。当出现正面时,规定其对应数为“1”;而出现反面时,规定其对应数为“0”。于是称为随机变量。又由于是随着试验结果(基本事件)不同而变化的,所以实际上是基本事件的函数,即X=X()。同时事件A包含了一定量的(例如古典概型中A包含了1,2,m,共m个基本事件),于是P(A)可以由P(X()来计算,这是一个普通函数。定义 设试验的样本空间为,如果对中每个事件都有唯一的实数值X=X()与之对应,则称X=X()为随机变量,简记为。有了随机变量,就可以通过它来描述随机试验中的各种事件,能全面反映试验的情况。这就使得我们对随机现象的研究,从前一章事件与事件的概率的研究,扩大到对随机变量的研究,这样数学分析的方法也可用来研究随机现象了。一个随机变量所可能取到的值只有有限个(如掷骰子出现的点数)或可列无穷多个(如电话交换台接到的呼唤次数),则称为离散型随机变量。像弹着点到目标的距离这样的随机变量,它的取值连续地充满了一个区间,这称为连续型随机变量。1、随机变量的分布函数(1)离散型随机变量的分布率设离散型随机变量的可能取值为Xk(k=1,2,)且取各个值的概率,即事件(X=Xk)的概率为P(X=xk)=pk,k=1,2,,则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:。显然分布律应满足下列条件:(1),(2)。(2)分布函数对于非离散型随机变量,通常有,不可能用分布率表达。例如日光灯管的寿命,。所以我们考虑用落在某个区间内的概率表示。定义 设为随机变量,是任意实数,则函数称为随机变量X的分布函数。 可以得到X落入区间的概率。也就是说,分布函数完整地描述了随机变量X随机取值的统计规律性。分布函数是一个普通的函数,它表示随机变量落入区间( ,x内的概率。的图形是阶梯图形,是第一类间断点,随机变量在处的概率就是在处的跃度。分布函数具有如下性质:1° ;2° 是单调不减的函数,即时,有 ;3° , ;4° ,即是右连续的;5° 。(3)连续型随机变量的密度函数定义 设是随机变量的分布函数,若存在非负函数,对任意实数,有, 则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。的图形是一条曲线,称为密度(分布)曲线。由上式可知,连续型随机变量的分布函数是连续函数。所以,密度函数具有下面4个性质:1° 。2° 。的几何意义;在横轴上面、密度曲线下面的全部面积等于1。如果一个函数满足1°、2°,则它一定是某个随机变量的密度函数。3° 。4° 若在处连续,则有。它在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。 对于连续型随机变量,虽然有,但事件并非是不可能事件Ø。令,则右端为零,而概率,故得。不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件()的概率为1,而概率为1的事件也不一定是必然事件。2、常见分布01分布P(X=1)=p, P(X=0)=q二项分布在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。, 其中,则称随机变量服从参数为,的二项分布。记为。容易验证,满足离散型分布率的条件。当时,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。泊松分布设随机变量的分布律为,则称随机变量服从参数为的泊松分布,记为或者P()。泊松分布为二项分布的极限分布(np=,n)。如飞机被击中的子弹数、来到公共汽车站的乘客数、机床发生故障的次数、自动控制系统中元件损坏的个数、某商店中来到的顾客人数等,均近似地服从泊松分布。超几何分布随机变量X服从参数为n,N,M的超几何分布。几何分布,其中p0,q=1-p。随机变量X服从参数为p的几何分布。均匀分布设随机变量的值只落在a,b内,其密度函数在a,b上为常数k,即axb 其他,其中k=,则称随机变量在a,b上服从均匀分布,记为XU(a,b)。分布函数为 axb 0, x<a, 1, x>b。 当ax1<x2b时,X落在区间()内的概率为P(。指数分布设随机变量X的密度函数为 , 0, , 其中,则称随机变量X服从参数为的指数分布。X的分布函数为 , x<0。 记住几个积分: , 正态分布设随机变量的密度函数为, ,其中、为常数,则称随机变量服从参数为、的正态分布或高斯(Gauss)分布,记为。具有如下性质:1° 的图形是关于对称的;2° 当时,为最大值;3° 以轴为渐近线。特别当固定、改变时,的图形形状不变,只是集体沿轴平行移动,所以又称为位置参数。当固定、改变时,的图形形状要发生变化,随变大,图形的形状变得平坦,所以又称为形状参数。 若,则的分布函数为。参数、时的正态分布称为标准正态分布,记为,其密度函数记为,分布函数为。是不可求积函数,其函数值,已编制成表可供查用。(x)和(x)的性质如下:1° (x)是偶函数,(x)(-x);2° 当x=0时,(x)为最大值;3° (-x)1-(x)且(0)。如果,则。所以我们可以通过变换将的计算转化为的计算,而的值是可以通过查表得到的。 分位数的定义。3、随机变量函数的分布随机变量是随机变量的函数,若的分布函数或密度函数知道,则如何求出的分布函数或密度函数。(1)是离散型随机变量已知的分布列为 ,显然,的取值只可能是,若互不相等,则的分布列如下:,若有某些相等,则应将对应的相加作为的概率。(2)是连续型随机变量先利用X的概率密度fX(x)写出Y的分布函数FY(y),再利用变上下限积分的求导公式求出fY(y)。二维随机变量及其分布第一节 基本概念1、二维随机变量的基本概念(1)二维离散型随机变量联合概率分布及边缘分布如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y)时,则称为离散型随机量。理解:(X=x,Y=y)(X=xY=y)设=(X,Y)的所有可能取值为,且事件=的概率为pij,称为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: YXy1y2yjpi·x1p11p12p1jp1·x2p21p22p2jp2·xipi1pi·p·jp·1p·2p·j1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)对于随机向量(X,Y),称其分量X(或Y)的分布为(X,Y)的关于X(或Y)的边缘分布。上表中的最后一列(或行)给出了X为离散型,并且其联合分布律为,则X的边缘分布为 ;Y的边缘分布为 。(2)二维连续型随机向量联合分布密度及边缘分布对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D=(X,Y)|a<x<b,c<y<d有则称为连续型随机向量;并称f(x,y)为=(X,Y)的分布密度或称为X和Y的联合分布密度。分布密度f(x,y)具有下面两个性质:(1) f(x,y)0;(2)一般来说,当(X,Y)为连续型随机向量,并且其联合分布密度为f(x,y),则X和Y的边缘分布密度为注意:联合概率分布边缘分布(3)条件分布当(X,Y)为离散型,并且其联合分布律为在已知X=xi的条件下,Y取值的条件分布为其中pi, pj分别为X,Y的边缘分布。当(X,Y)为连续型随机向量,并且其联合分布密度为f(x,y),则在已知Y=y的条件下,X的条件分布密度为在已知X=x的条件下,Y的条件分布密度为其中分别为X,Y的边缘分布密度。(4)常见的二维分布均匀分布设随机向量(X,Y)的分布密度函数为其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)U(D)。例如图3.1、图3.2和图3.3。y1 D1O 1 x图3.1yD211 O 2 x图3.2yD3dcO a b x图3.3正态分布设随机向量(X,Y)的分布密度函数为其中,共5个参数,则称(X,Y)服从二维正态分布,记为(X,Y)N(由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,反推则错。即XN(5)二维随机向量联合分布函数及其性质设(X,Y)为二维随机变量,对于任意实数x,y,二元函数称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:(1)(2)F(x,y)分别对x和y是非减的,即当x2>x1时,有F(x2,y)F(x1,y);当y2>y1时,有F(x,y2) F(x,y1);(3)F(x,y)分别对x和y是右连续的,即(4)2、随机变量的独立性(1)一般型随机变量F(X,Y)=FX(x)FY(y)(2)离散型随机变量例35:二维随机向量(X,Y)共有六个取正概率的点,它们是:(1,-1),(2,-1),(2,0),2,2),(3,1),(3,2),并且(X,Y)取得它们的概率相同,则(X,Y)的联合分布及边缘分布为 YX-1012p1·100020300p·j1(3)连续型随机变量f(x,y)=fX(x)fY(y)联合分布边缘分布f(x,y)=fX(x)fY(y)直接判断,充要条件:可分离变量正概率密度区间为矩形例36:如图3.1,f(x,y)=8xy, fX(x)=4x3, fY(y)=4y-4y3,不独立。例37:f(x,y)=(4)二维正态分布=0(5)随机变量函数的独立性若X与Y独立,h,g为连续函数,则:h(X)和g(Y)独立。例如:若X与Y独立,则:3X+1和5Y-2独立。3、简单函数的分布两个随机变量的和Z=X+Y离散型:连续型fZ(z)两个独立的正态分布的和仍为正态分布()。2、随机变量的独立性例317:设(X,Y)的联合分布密度为(1) 求C;(2) 求X,Y的边缘分布;(3) 讨论X与Y的独立性;(4) 计算P(X+Y1)。3、简单函数的分布随机变量的数字特征第一节 基本概念1、一维随机变量的数字特征(1)一维随机变量及其函数的期望设X是离散型随机变量,其分布律为P()pk,k=1,2,n,期望就是平均值。数学期望的性质(1) E(C)=C(2) E(CX)=CE(X)(3) E(X+Y)=E(X)+E(Y),(4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。(5) Y=g(X)离散: 连续:(2)方差D(X)=EX-E(X)2,方差,标准差离散型随机变量连续型随机变量方差的性质(1) D(C)=0;E(C)=C(2) D(aX)=a2D(X); E(aX)=aE(X)(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b(4) D(X)=E(X2)-E2(X)(5) D(X+Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E(X-E(X)(Y-E(Y),无条件成立。E(X+Y)=E(X)+E(Y),无条件成立。类似的,n个相互独立的正态分布的线性组合,仍服从正态分布。, (3)常见分布的数学期望和方差分布名称符号均值方差0-1分布p二项分布np泊松分布几何分布超几何分布均匀分布指数分布正态分布01分布 X01qpE(X)=p,D(X)=pq二项分布 XB(n,p),(k=0,1,2n)E(X)=np,D(X)=npq泊松分布 P() P(X=k)=,k=0,1,2E(X)= , D(X)= 超几何分布 E(X)=几何分布 ,k=0,1,2E(X)=, D(X)=均匀分布 XUa,b,f(x)=,a, b E(X)=, D(X)=指数分布 f(x)= ,(x>0)E(X)=, D(X)=正态分布 XN(,2),E(X)= , D(X)= 22、二维随机变量的数字特征(1)协方差和相关系数对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。协方差有下面几个性质:(i) cov (X, Y)=cov (Y, X);(ii) cov(aX,bY)=ab cov(X,Y);(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);(iv) cov(X,Y)=E(XY)-(E(X)(E(Y).对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称为X与Y的相关系数,记作(有时可简记为)。|1,当|=1时,称X与Y安全相关:完全相关而当时,称X与Y不相关。与相关系数有关的几个重要结论(i) 若随机变量X与Y相互独立,则;反之不真。(ii) 若(X,Y)N(),则X与Y相互独立的充要条件是,即X和Y不相关。(iii) 以下五个命题是等价的:;cov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).(2)二维随机变量函数的期望(3)原点矩和中心矩对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即uk=E(Xk), k=1,2, .于是,我们有对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即于是,我们有对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为,即大数定律和中心极限定理第一节 基本概念1、切比雪夫不等式设随机变量X具有数学期望E(X)=,方差D(X)=2,则对于任意正数,有下列切比雪夫不等式切比雪夫不等式给出了在未知X的分布的情况下,对概率的一种估计,它在理论上有重要意义。2、大数定律(1)切比雪夫大数定律(要求方差有界)设随机变量X1,X2,相互独立,均具有有限方差,且被同一常数C所界:D(Xi)<C(i=1,2,),则对于任意的正数,有特殊情形:若X1,X2,具有相同的数学期望E(XI)=,则上式成为或者简写成:切比雪夫大数定律指出,n个相互独立,且具有有限的相同的数学期望与方差的随机变量,当n很大时,它们的算术平均以很大的概率接近它们的数学期望。(2)伯努利大数定律设是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数,有伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即这就以严格的数学形式描述了频率的稳定性。(3)辛钦大数定律(不要求存在方差)设X1,X2,Xn,是相互独立同分布的随机变量序列,且E(Xn)=,则对于任意的正数有3、中心极限定理(1)列维林德伯格定理设随机变量X1,X2,相互独立,服从同一分布,且具有相同的数学期望和方差:,则随机变量的分布函数Fn(x)对任意的实数x,有或者简写成:此定理也称为独立同分布的中心极限定理。(2)棣莫弗拉普拉斯定理设随机变量X1,Xn均为具有参数n, p(0<p<1)的二项分布,则对于任意实数x,有例53:某车间有200台车床,在生产时间内由于需要检修、调换刀具、变换位置、调换工件等常需停车。设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1Kw,问应供应该车间多少瓦电力,才能以99.9%的概率保证该车间不会因供电不足而影响生产。数理统计的基本概念第一节 基本概念1、总体、个体和样本(1)总体与样本总体在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体);而把总体中的每一个单元称为样品(或个体)。在以后的讨论中,我们总是把总体看成一个具有分布的随机变量(或随机向量)。例如单正态总体X,用来表示我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。为了使抽取的样本很好地反映总体地信息,最常用的方法是“简单随机抽样”:(1)代表性。即每一样品Xi与总体X同分布;(2)独立性。即样品抽取互相间不影响。此时的样本是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。注意:在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我们称之为样本的两重性。(2)样本函数与统计量设为总体的一个样本,称()为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。2、统计量(1)常用统计量样本均值样本方差(与概率论中的方差定义不同)样本标准差样本k阶原点矩样本k阶中心矩 (二阶中心矩与概率论中的方差定义相同)(2)统计量的期望和方差,,其中,为二阶中心矩。3、三个抽样分布(2、t、F分布)(1)2分布设n个随机变量相互独立,且服从标准正态分布,可以证明:它们的平方和的分布密度为我们称随机变量W服从自由度为n的分布,记为W(n),其中所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。分布满足可加性:设则注意两个结果:E(2)=n,D(2)=2n(2)t分布设X,Y是两个相互独立的随机变量,且可以证明:函数的概率密度为我们称随机变量T服从自由度为n的t分布,记为Tt(n)。注意两个结果:E(T)=0,D(T)=(n>2)(3)F分布设,且X与Y独立,可以证明:的概率密度函数为我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为Ff(n1, n2).正态分布,4、正态总体下统计量的分布和性质注意一个定理:与独立。(1)正态分布设为来自正态总体的一个样本,则样本函数(2)t-分布设为来自正态总体的一个样本,则样本函数其中t(n-1)表示自由度为n-1的t分布。(3)分布设为来自正态总体的一个样本,则样本函数其中表示自由度为n-1的分布。(4)F分布 设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数其中表示第一自由度为,第二自由度为的F分布。第七章 参数估计第一节 基本概念1、点估计的两种方法(1)矩法所谓矩法就是利用样本各阶原点矩与相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。设总体X的分布中包含有未知数,则其分布函数可以表成显示它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。21