概率论与数理统计知识点总结!.doc
Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date概率论与数理统计知识点总结!概率论与数理统计复习参考资料概率论与数理统计第一章随机事件及其概率§1.1 随机事件一、给出事件描述,要求用运算关系符表示事件:二、给出事件运算关系符,要求判断其正确性:§1.2 概率古典概型公式:P(A)=实用中经常采用“排列组合”的方法计算补例1:将n个球随机地放到n个盒中去,问每个盒子恰有1个球的概率是多少?解:设A:“每个盒子恰有1个球”。求:P(A)=?所含样本点数:所含样本点数:补例2:将3封信随机地放入4个信箱中,问信箱中信的封数的最大数分别为1、2、3的概率各是多少?解:设Ai :“信箱中信的最大封数为i”。(i =1,2,3)求:P(Ai)=?所含样本点数:A1所含样本点数:A2所含样本点数: A3所含样本点数:注:由概率定义得出的几个性质:1、0<P(A)<12、P()=1,P() =0§1.3 概率的加法法则定理:设A、B是互不相容事件(AB=),则:P(AB)=P(A)+P(B)推论1:设A1、 A2、 An 互不相容,则P(A1+A2+.+ An)= P(A1) + P(A2) + P(An)推论2:设A1、 A2、 An 构成完备事件组,则P(A1+A2+.+ An)=1推论3: P(A)=1P()推论4:若BA,则P(BA)= P(B)P(A)推论5(广义加法公式):对任意两个事件A与B,有P(AB)=P(A)+P(B)P(A B)补充对偶律:§1.4 条件概率与乘法法则条件概率公式:P(A/B)=(P(B)0)P(B/A)= (P(A)0)P(AB)=P(A/B)P(B)= P(B / A)P(A)有时须与P(A+B)=P(A)+P(B)P(AB)中的P(AB)联系解题。全概率与逆概率公式:全概率公式:逆概率公式: (注意全概率公式和逆概率公式的题型:将试验可看成分为两步做,如果要求第二步某事件的概率,就用全概率公式;如果求在第二步某事件发生条件下第一步某事件的概率,就用逆概率公式。)§1.5 独立试验概型事件的独立性:贝努里公式(n重贝努里试验概率计算公式):课本P24另两个解题中常用的结论1、定理:有四对事件:A与B、A与、与B、与,如果其中有一对相互独立,则其余三对也相互独立。2、公式:第二章 随机变量及其分布一、关于离散型随机变量的分布问题1、求分布列:确定各种事件,记为x写成一行; 计算各种事件概率,记为p k写成第二行。得到的表即为所求的分布列。注意:应符合性质1、(非负性) 2、(可加性和规范性)补例1:将一颗骰子连掷2次,以x 表示两次所得结果之和,试写出x的概率分布。解:所含样本点数:6×6=36所求分布列为:1/362/363/364/365/366/365/364/363/362/361/36pk12111098765432x补例2:一袋中有5只乒乓球,编号1,2,3,4,5,在其中同时取3只,以x表示取出3只球中最大号码,试写出x的概率分布。解:所含样本点数:=106/103/101/10p k543x所求分布列为:2、求分布函数F(x):分布函数二、关于连续型随机变量的分布问题:xR,如果随机变量x的分布函数F(x)可写成F(x)=,则x为连续型。称概率密度函数。解题中应该知道的几个关系式: 第三章 随机变量数字特征一、求离散型随机变量x 的数学期望Ex =?数学期望(均值)二、设x 为随机变量,f(x)是普通实函数,则=f(x)也是随机变量,求E=?xx1x2xkpkp1p2pk= f(x)y1y2yk以上计算只要求这种离散型的。补例1:设x的概率分布为:x1012pk求:,的概率分布;。解:因为x1012pk=x12101=x21014所以,所求分布列为:=x12101pk和:=x21014pk当=x1时,E=E(x1)=2×+(1)×+0×+1×+×=1/4当=x2时,E=E x2=1×+0×+1×+4×+×=27/8三、求x 或的方差Dx =? D=?实用公式=其中,=补例2:x202pk0.40.30.3求:E x 和D x 解:=2×0.4+0×0.3+2×0.3=0.22=(2)2×0.4+02×0.3+22×0.3=2.8=2=2.8(0.2)2=2.76第四章 几种重要的分布常用分布的均值与方差(同志们解题必备速查表)名称概率分布或密度期望方差参数范围二项分布n pn p q0<P<1q=1p正态分布任意>0泊松分布不要求>0指数分布不要求>0解题中经常需要运用的E x 和D x 的性质(同志们解题必备速查表)E x的性质D x 的性质第五章 参数估计§8.1 估计量的优劣标准(以下可作填空或选择)若总体参数的估计量为,如果对任给的>0,有,则称是的一致估计;如果满足,则称是的无偏估计;如果和均是的无偏估计,若,则称是比有效的估计量。§8.3 区间估计:几个术语1、设总体分布含有一位置参数,若由样本算得的一个统计量及,对于给定的(0<<1)满足:则称随机区间(,)是的100(1)的置信区间,和称为的100(1)的置信下、上限,百分数100(1)称为置信度。一、求总体期望(均值)E x 的置信区间1、总体方差已知的类型据,得1,反查表(课本P260表)得临界值;= 求d= 置信区间(-d,+d)补简例:设总体随机取4个样本其观测值为12.6,13.4,12.8,13.2,求总体均值的95%的置信区间。解:1=0.95,=0.05(U)=1=0.975,反查表得:U=1.96=0.3,n=4 d=0.29所以,总体均值的=0.05的置信区间为:(d,d)=(130.29,130.29)即(12.71,13.29)2、总体方差未知的类型(这种类型十分重要!务必掌握!)据和自由度n1(n为样本容量),查表(课本P262表)得;确定=和求d= 置信区间(-d,+d)注:无特别声明,一般可保留小数点后两位,下同。二、求总体方差的置信区间据和自由度n1(n为样本数),查表得临界值:和确定=和上限 下限置信区间(下限,上限)典型例题:补例1:课本P166之16 已知某种木材横纹抗压力的实验值服从正态分布,对10个试件作横纹抗压力试验得数据如下(单位:kg/cm2):482493457471510446435418394469试对该木材横纹抗压力的方差进行区间估计(0.04)。解:=0.04,又n=10,自由度n1=9查表得,=19.7=2.53=457.5=+=1240.28上限=4412.06下限=566.63所以,所求该批木材横纹抗压力的方差的置信区间为(566.63,4412.06)第六章 假设检验必须熟练掌握一个正态总体假设检验的执行标准一般思路:1、提出待检假设H02、选择统计量3、据检验水平,确定临界值4、计算统计量的值5、作出判断检验类型:未知方差,检验总体期望(均值)根据题设条件,提出H0:= (已知);选择统计量;据和自由度n1(n为样本容量),查表(课本P262表)得;由样本值算出?和?从而得到;作出判断典型例题:对一批新的某种液体的存贮罐进行耐裂试验,抽查5个,得到爆破压力的数据(公斤/寸2 )为:545,545,530,550,545。根据经验爆破压认为是服从正态分布的,而过去该种液体存贮罐的平均爆破压力为549公斤/寸2 ,问这种新罐的爆破压与过去有无显著差异?(=0.05)解:H0:= 549选择统计量=0.05,n1=4,查表得:=2.776又=543s2=57.=1.77<2.776接受假设,即认为该批新罐得平均保爆破压与过去的无显著差异。检验类型:未知期望(均值),检验总体方差根据题设条件,提出H0:= (已知);选择统计量;据和自由度n1(n为样本容量),查表(课本P264表)得临界值:和;由样本值算出?和?从而得到;若<<则接受假设,否则拒绝!补例:某厂生产铜丝的折断力在正常情况下服从正态分布,折断力方差=64,今从一批产品中抽10根作折断力试验,试验结果(单位:公斤):578,572,570,568,572,570,572,596,584,570。 是否可相信这批铜丝折断力的方差也是64?(=0.05)解: H0:=64选择统计量=0.05,n1=9,查表得:=2.7=19又=575.2s2=75.73=2.7<<=19接受假设,即认为这批铜丝折断力的方差也是64。第1章 随机事件及其概率(1)排列组合公式 从m个人中挑出n个人进行排列的可能数。 从m个人中挑出n个人进行组合的可能数。(2)加法和乘法原理加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。乘法原理(两个步骤分别不能完成这件事):m×n某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。(3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题(4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。(5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件,用来表示。基本事件的全体,称为试验的样本空间,用表示。一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,表示事件,它们是的子集。为必然事件,Ø为不可能事件。不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件()的概率为1,而概率为1的事件也不一定是必然事件。(6)事件的关系与运算关系:如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):如果同时有,则称事件A与事件B等价,或称A等于B:A=B。A、B中至少有一个发生的事件:AB,或者A+B。属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。A、B同时发生:AB,或者AB。AB=Ø,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。-A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。运算:结合率:A(BC)=(AB)C A(BC)=(AB)C分配率:(AB)C=(AC)(BC) (AB)C=(AC)(BC)德摩根率: ,(7)概率的公理化定义设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:1° 0P(A)1,2° P() =13° 对于两两互不相容的事件,有常称为可列(完全)可加性。则称P(A)为事件的概率。(8)古典概型1° ,2° 。设任一事件,它是由组成的,则有P(A)= =(9)几何概型若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,。其中L为几何度量(长度、面积、体积)。(10)加法公式P(A+B)=P(A)+P(B)-P(AB)当AB不相容P(AB)0时,P(A+B)=P(A)+P(B)当AB独立,P(AB)=P(A)P(B), P(A+B)=P(A)+P(B)-P(A)P(B)(11)减法公式P(A-B)=P(A)-P(AB)当BA时,P(A-B)=P(A)-P(B)当A=时,P()=1- P(B)(12)条件概率定义 设A、B是两个事件,且P(A)>0,则称为事件A发生条件下,事件B发生的条件概率,记为。条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(/B)=1P(/A)=1-P(B/A)(13)乘法公式乘法公式:更一般地,对事件A1,A2,An,若P(A1A2An-1)>0,则有。(14)独立性两个事件的独立性设事件、满足,则称事件、是相互独立的。若事件、相互独立,且,则有若事件、相互独立,则可得到与、与、与也都相互独立。必然事件和不可能事件Ø与任何事件都相互独立。Ø与任何事件都互斥。多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)并且同时满足P(ABC)=P(A)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。(15)全概公式设事件满足1°两两互不相容,2°,则有。全概率公式解决的是多个原因造成的结果问题,全概率公式的题型:将试验可看成分为两步做,如果要求第二步某事件的概率,就用全概率公式;(16)贝叶斯公式设事件,及满足1° ,两两互不相容,>0,1,2,2° ,则,i=1,2,n。此公式即为贝叶斯公式。,(,),通常叫先验概率。,(,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。将试验可看成分为两步做,如果求在第二步某事件发生条件下第一步某事件的概率,就用贝叶斯公式。(17)伯努利概型我们作了次试验,且满足u 每次试验只有两种可能结果,发生或不发生;u 次试验是重复进行的,即发生的概率每次均一样;u 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。这种试验称为伯努利概型,或称为重伯努利试验。用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,。第二章 随机变量及其分布(1)离散型随机变量的分布律设离散型随机变量的可能取值为Xk(k=1,2,)且取各个值的概率,即事件(X=Xk)的概率为P(X=xk)=pk,k=1,2,,则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:。显然分布律应满足下列条件:(1), (2)。(2)连续型随机变量的分布密度设是随机变量的分布函数,若存在非负函数,对任意实数,有,则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。密度函数具有下面4个性质:1、 。2、 。3、4、P(x=a)=0,a为常数,连续型随机变量取个别值的概率为0(3)离散与连续型随机变量的关系积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。(4)分布函数设为随机变量,是任意实数,则函数称为随机变量X的分布函数,本质上是一个累积函数。 可以得到X落入区间的概率。分布函数表示随机变量落入区间( ,x内的概率。分布函数具有如下性质:1° ;2° 是单调不减的函数,即时,有 ;3° , ;4° ,即是右连续的;5° 。对于离散型随机变量,;对于连续型随机变量, 。(5)八大分布0-1分布P(X=1)=p, P(X=0)=q二项分布在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。, 其中,则称随机变量服从参数为,的二项分布。记为。当时,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。泊松分布设随机变量的分布律为,则称随机变量服从参数为的泊松分布,记为或者P()。泊松分布为二项分布的极限分布(np=,n)。几何分布,其中p0,q=1-p。随机变量X服从参数为p的几何分布,记为G(p)。均匀分布设随机变量的值只落在a,b内,其密度函数在a,b上为常数,即axb 其他,则称随机变量在a,b上服从均匀分布,记为XU(a,b)。分布函数为 axb 0, x<a,1, x>b。当ax1<x2b时,X落在区间()内的概率为。指数分布 ,0, ,其中,则称随机变量X服从参数为的指数分布。X的分布函数为 , x<0。记住积分公式:正态分布设随机变量的密度函数为, ,其中、为常数,则称随机变量服从参数为、的正态分布或高斯(Gauss)分布,记为。具有如下性质:1° 的图形是关于对称的;2° 当时,为最大值;dtexFxtò¥-=222)(21)(smps若,则的分布函数为参数、时的正态分布称为标准正态分布,记为,其密度函数记为,分布函数为。是不可求积函数,其函数值,已编制成表可供查用。(-x)1-(x)且(0)。如果,则。(6)分位数下分位表:;上分位表:。(7)函数的分布函数离散型已知的分布列为,的分布列(互不相等)如下:,若有某些相等,则应将对应的相加作为的概率。连续型先利用X的概率密度fX(x)写出Y的分布函数FY(y)P(g(X)y),再利用变上下限积分的求导公式求出fY(y)。(2)定理法:当Y=g(X)严格单调并且可导时:其中h(y)是g(x)的反函数(1)联合分布离散型如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。设=(X,Y)的所有可能取值为,且事件=的概率为pij,称为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:YXy1y2yjx1p11p12p1jx2p21p22p2jxipi1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)连续型对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D=(X,Y)|a<x<b,c<y<d有则称为连续型随机向量;并称f(x,y)为=(X,Y)的分布密度或称为X和Y的联合分布密度。分布密度f(x,y)具有下面两个性质:(1) f(x,y)0;(2) (2)二维随机变量的本质(3)联合分布函数设(X,Y)为二维随机变量,对于任意实数x,y,二元函数称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:(1)(2)F(x,y)分别对x和y是非减的,即当x2>x1时,有F(x2,y)F(x1,y);当y2>y1时,有F(x,y2) F(x,y1);(3)F(x,y)分别对x和y是右连续的,即(4)(5)对于P(x1<xx2,y1<yy2)=(4)离散型与连续型的关系(5)边缘分布离散型X的边缘分布为;Y的边缘分布为。连续型X的边缘分布密度为Y的边缘分布密度为(6)条件分布离散型在已知X=xi的条件下,Y取值的条件分布为在已知Y=yj的条件下,X取值的条件分布为连续型在已知Y=y的条件下,X的条件分布密度为;在已知X=x的条件下,Y的条件分布密度为(7)独立性一般型F(X,Y)=FX(x)FY(y)离散型有零不独立连续型f(x,y)=fX(x)fY(y)直接判断,充要条件:可分离变量正概率密度区间为矩形二维正态分布0随机变量的函数若X1,X2,Xm,Xm+1,Xn相互独立, h,g为连续函数,则:h(X1,X2,Xm)和g(Xm+1,Xn)相互独立。特例:若X与Y独立,则:h(X)和g(Y)独立。例如:若X与Y独立,则:3X+1和5Y-2独立。(8)二维均匀分布设随机向量(X,Y)的分布密度函数为其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)U(D)。例如图3.1、图3.2和图3.3。y1D1O 1 x图3.1yD211O 2 x图3.2yD3dcO a b x图3.3(9)二维正态分布设随机向量(X,Y)的分布密度函数为其中是5个参数,则称(X,Y)服从二维正态分布,记为(X,Y)N(由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即XN(但是若XN(,(X,Y)未必是二维正态分布。(10)函数分布Z=X+Y根据定义计算:对于连续型,fZ(z)两个独立的正态分布的和仍为正态分布()。n个相互独立的正态分布的线性组合,仍服从正态分布。, Z=max,min(X1,X2,Xn)若相互独立,其分布函数分别为,则Z=max,min(X1,X2,Xn)的分布函数为:第四章 随机变量的数字特征(1)一维随机变量的数字特征离散型连续型期望期望就是平均值设X是离散型随机变量,其分布律为P()pk,k=1,2,n,(要求绝对收敛)设X是连续型随机变量,其概率密度为f(x),(要求绝对收敛)函数的期望Y=g(X)Y=g(X)方差D(X)=EX-E(X)2,标准差(2)期望的性质(1) E(C)=C(2) E(CX)=CE(X)(3) E(X+Y)=E(X)+E(Y),(4) E(XY)=E(X) E(Y),充分条件:X和Y独立;充要条件:X和Y不相关。(3)方差的性质(1) D(C)=0;E(C)=C(2) D(aX)=a2D(X); E(aX)=aE(X)(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b(4) D(X)=E(X2)-E2(X)(5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立;充要条件:X和Y不相关。D(X±Y)=D(X)+D(Y) ±2E(X-E(X)(Y-E(Y),无条件成立。而E(X+Y)=E(X)+E(Y),无条件成立。(4)常见分布的期望和方差期望方差0-1分布p二项分布np泊松分布几何分布超几何分布均匀分布指数分布正态分布(5)二维随机变量的数字特征期望函数的期望方差协方差对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。相关系数对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称为X与Y的相关系数,记作(有时可简记为)。|1,当|=1时,称X与Y完全相关:完全相关而当时,称X与Y不相关。以下五个命题是等价的:;cov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).(6)协方差的性质(i) cov (X, Y)=cov (Y, X);(ii) cov(aX,bY)=ab cov(X,Y);(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);(iv) cov(X,Y)=E(XY)-E(X)E(Y).(7)独立和不相关(i) 若随机变量X与Y相互独立,则;反之不真。(ii) 若(X,Y)N(),则X与Y相互独立的充要条件是X和Y不相关。-