概率论与数理统计考点.doc
概率论与数理统计第一章 随机事件与概率事件之间的关系:事件之间的运算:运算法则:交换律AB=BA AB=BA结合律(AB)C=A(BC) (AB)C=A(BC) 分配律(AB)C=(AC)(BC) (AB)C=(AC)(BC)对偶律 = =古典概型:概率公式:求逆公式 P()=1- P(A)加法公式 P(AB)=P(A)+P(B)-P(AB) P(ABC)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)求差公式:P(A-B)=P(A)-P(AB); 当AÉB时,有P(A-B)=P(A)-P(B)注意: A-B = A = A-AB = (AB)-B条件概率公式:P(A|B)= ; (P(B)>0) P(A|B)表示事件B发生的条件下,事件A发生的概率。乘法公式:P(AB)=P(A)P(B|A)= P(B)P(A|B) (其中P(A)>0, P(B)>0) 一般有P(ABC)=P(A)P(B|A)P(C|AB) (其中P(AB)>0)全概率公式:P(A)= P(A|Bi)P(Bi) 其中B1,B2,Bn构成W的一个分斥。贝叶斯公式:P(Ak|B)= = (由果溯因)概论的性质:事件的独立性:如果事件A与事件B满足P(AB)=P(A)P(B),则称事件A与事件B相互独立。结论:1. 如果P(A)>0,则事件A与B独立Û 2. 事件A与事件B独立Û事件A与事件独立Û事件与事件B独立Û事件与事件独立贝努里概型:指在相同条件下进行n次试验;每次试验的结果有且仅有两种A与;各次试验是相互独立;每次试验的结果发生的概率相同P(A)=p, P()=1-p。二项概率-在n重独立试验中,事件A恰好发生k次的概率为b(k;n,p),则b(k;n,p)= Cpk(1-p)n-k (k=0,1,2,3,n)。第二章 随机变量与概率分布随机变量的分布函数:分布函数F(x)的性质 (1)0F(x)1;(2) F(x)=0, F(x)=1一些概率可用分布函数来表示Pa<xb=F(b)-F(a),Px=a=F(a)-F(a-0), Px<a=F(a-0), Px>a=1-F(a), Pxa=1-F(a-0), 离散型随机变量常见分布:1)两点分布X(0,1);X的取值只有0或1,其概率为PX=0=p, PX=1=1-p2)二项分布XB(n,p);分布律为 b(k;n,p)= PX=k= Cpk(1-p)n-k (k=0,1,2,3,n) 其中 0<p<13)泊松分布XP(l);分布律为 PX=k= e-l (k=0,1,2,3,) 。4)几何分布:XGe(p);分布列为 PX=k= (1-p)k-1p (k=0,1,2,3,) 。在伯努利试验序列中,记每次试验中事件A发生的概率为p,如果X为事件A首次出现时的试验次数,则X的可能取值为1,2,称X服从几何分布。如果说恰好出现K次,则用二项分布b(k;n,p)= PX=k= Cpk(1-p)n-k (k=0,1,2,3,n) 其中 0<p<15)超几何分布:X h(n,N,M);分布列为 PX=k= (k=0,1,2,3,r, 其中r=minM,n) 。 设有N个产品,其中有M个不合格品,若从中不放回地随机抽取n个,则其中含有的不合格品个数X服从超几何分布。连续性随机变量:密度函数.密度函数必须满足条件:(1) p(x)³0, -<x<+(2) ò p(x)dx=F(+)=1连续型随机变量的性质:1.分布函数是连续函数;2 F¢(x)=p(x);3 Px=a=0, 所以Pa<x£b= Pa£x£b= Pa£x<b= Pa<x<b= ò p(x)dx 4 Px<x£x+Dx» p(x)Dx常见连续型型随机变量的分布:1)均匀分布xUa,b;密度函数 p(x)= 分布函数F(x)= 2)指数分布xexp(l);密度函数 p(x)= 分布函数F(x)= 3)正态分布xN(m,s2);密度函数p(x)= e (-<x<+) 分布函数F(x)= òedt标准正态分布N(0,1),它的分布函数F(x)可查表得到,一般F(x)=F( )。随机变量的函数的概率分布:1离散型的求法设离散型随机变量X的分布律为: ,则X的函数Y=g(X)的分布律为:, 当g(xj)有相同情况时,概率为相应之和。2连续型的公式法:设X为连续型随机变量,其密度函数为fX(x),设g(x)是一严格单调的可导函数,其值域a,b,且g¢(x)¹0,记x=h(y)为y=g(x)的反函数,则Y=g(X)的密度函数为fY(y)=3连续型的直接变换法(分布函数法):FY(y)=PY£y= Pg(x)£y= PXÎS,其中S=x|g(x)£y,然后再把FY(y)对y求导,即得fY(y)fY(y)=第三章 多维随机变量及其概率分布二维随机变量:二维随机向量(x,h)的联合分布函数指F(x,y)=Px£x,h£y0£F(x,y)£1 ; F(-,+)= F(x,-)= F(-,y)=0; F(+,+)=1; Px1x£x2,y1<h£y2=F(x2,y2)- F(x2,y1)- F(x1,y2)+F(x1,y1)二维随机向量(x,h)的边缘分布函数Fx(x)= Px£x=F(x,+), Fh(y)= Ph£y=F(+,y)二维离散随机变量:二维离散型随机变量及其概率分布 Px=xi,h=yj=pij , 其中 pij=1 且 pij³0 可用一个分布列表或分布列矩阵 (pij) 来表示x的边缘分布列为 Px=xi=pij = pi*h的边缘分布列为 Ph=yj=pij = p*二维连续随机变量:二维连续型随机向量(x,h)的分布函数F(x,y)= òòp(u,v)dudv p(x,y) 称为随机向量(x,h)的联合密度函数p(x,y)³0, òòp(x,y)dxdy=1 , =p(x,y)利用密度函数求概率 P(x,h)ÎD=二维连续型随机向量(x,h)的边缘分布, px(x),ph(y) 称为边缘密度函数px(x)= òp(x,y)dy ph(y)= òp(x,y)dx条件分布:离散型:在条件Y=yj下随机变量X的条件概率分布为PX=xi|Y=yj= = , i=1,2,连续型:在条件Y=y下随机变量X的条件分布函数FX|Y(x|y)与条件概率密度函数fX|Y(x|y)分别为:FX|Y(x|y)= fX|Y(x|y) = 二元正态分布:二元正态分布N(m1,m2,s12,s22,r)的密度函数p(x,y)= exp- - + 二元正态分布N(m1,m2,s12,s22,r)的边缘密度分布仍是正态分布 xN(m1,s12) , hN(m2,s22)边缘概率密度为 fX(x)= e, fY(y)= e二元均匀分布:(X,Y)在区域D上服从均匀分布¾设D是xOy面上的有界区域,其面积为A。如果二维随机变量(X,Y)具有概率密度 f(x,y)= ,则称(X,Y)在区域D上服从均匀分布。独立性:若F(x,y)=Fx(x)Fh(y),则称随机变量x与h相互独立。几个充要条件:连续型随机变量x与h相互独立Û p(x,y)=px(x)ph(y) 离散型随机变量x与h相互独立Û pij=pipj 二元正态分布N(m1,s12,m2,s22,r) 随机变量x与h相互独立Ûr=0。X与Y相互独立Þf(X)与g(Y)也相互独立。两个随机变量的函数的分布:几条结论:1. XP(l1), YP(l2), 若X与Y相互独立,则X+YP(l1+l2);2. XN(m1,s12), Y N(m2,s22), X与Y相互独立,则X+Y N(m1+m2,s12+s22);3.(卷积公式)设(X,Y)是二维连续型随机变量,其概率密度为f(x,y),关于X,Y的边缘概率密度分别为fX(x), fY(y),设X与Y相互独立,则Z=X+Y的概率密度为 fZ(z)= òfX(x)fY(z-x)dx=òf(x, z-x)dx 或fZ(z)= òfX(z-y)fY(y)dy=òf(z-y, y)dy.多维随机变量:n维随机变量(X1,X2,Xn)的分布函数F(x1,x2,xn)=PX1£x1, X2£x2,Xn£xn.如果X1,X2,Xn相互独立,且每个XiN(mi,si2), 则X=a1X1+a2X2+anXn N(, )如果X1,X2,Xn相互独立,Xj的分布函数为FXj(xj),则M=maxX1,X2,Xn的分布函数为 Fmax(z)=FX1(x1)FX2(x2) FXn(x1n), 则m=minX1,X2,Xn 的分布函数为 Fmin(z)=1- (1-FX1(x1)(1-FX2(x2) (1-FXn(x1n)第四章 随机变量的数字特征数学期望:1. 随机变量数学期望的定义离散型 E(x)= E(g(x)= 连续型E(x)=ò xp(x)dx E(g(x)=ò g(x)p(x)dx 2. 二维随机变量(X,Y)的数学期望:离散型 E(X)=*=xipij E(Y)= yjp*j=yipij 连续型E(X)=ò xfX(x)dx=ò ò xf(x,y)dxdyE(Y)=ò yfY(y)dy=ò ò yf(x,y)dxdy3. 二维随机变量X的函数Y=g(X)的数学期望:Eg(X,Y)= g(xi,yj)pij Eg(X,Y)= ò ò g(x,y)f(x,y)dxdy 4. 数学期望的性质E(c)=c , E(ax)=ax , E(x±h)=Ex±Eh 若x与h相互独立,则 E(xh)=ExEh方差:1.随机变量方差的定义¾¾- D(X)=EX-E(X)2 = EX2 (EX)2 D(X)= ò x-E(X)2 f(x)dx2.方差性质:D(c)=0 , D(ax)=a2x , D(ax+b)=a2Dx , D(x±h)=Dx+Dh±2cov(x,h)若x与h相互独立,则 D(x±h)=Dx+Dh协方差:1.x与h的协方差cov(x,h)=E(x-Ex)(h-Eh) (或为sxh)2.协方差的性质:cov(x,x)= Dxcov(x,h)=cov(h,x), cov(x,c)=0cov(ax,bh)=ab cov(x,h) , cov(x,h±z)=cov(x,h)±cov(x,z)相关系数:x与h的相关系数rxh的定义 rxh=相关系数rxh反映了随机变量x与h之间的线性相关的程度。注意|rxh|£1。当rxh=0,则称x与h不相关;当|rxh|=1,则称x与h完全相关几个结论: rxh=0 Û cov(x,h)=0 Û E(xh)=ExEh Û D(x+h)=Dx+DhÛ D(x-h)=Dx+Dh注意随机变量x与h相互独立,则x与h不相关;反之x与h不相关,不能推出x与h相互独立。常用分布的期望与方差分布分布列和概率密度数学期望方差分布(0,1)Px=0=p, Px=1=1-ppp(1-p)二项分布B(n,p)b(k;n,p)= Px=k= Cpk(1-p)n-k (k=0,1,2,3,n)npnp(1-p)泊松分布P(l)Px=k= e-l k=0,1,2, l>0ll均匀分布Ua,bp(x)=几何分布XGe(p)分布列为 PX=k= (1-p)k-1p (k=0,1,2,3,) 超几何分布X h(n,N,M)PX=k= k=0,1,2,3, minM,n指数分布exp(l)p(x)=正态分布N(m,s2)p(x)= e (-<x<+)ms2二维正态分布N(m1,s12,m2,s22,r)p(x,y)= exp- - + Ex=m1Eh=m2Dx=s12Dh=s22第五章 大数定律及中心极限定理切比雪夫不等式:P|x-Ex|³e£ , P|x-Ex|<e³ 1 - 中心极限定理:棣莫弗(Demoiver)-拉普拉斯(Laplace)定理:设随机变量Yn (n=1,2,3,)服从参数为n, p的二项分布,即YnB(n,p),则对任意实数x,恒有 P£x= F(x) = òedt ®òedt这一定理说明,服从二项分布B(n,p)的随机变量Yn作标准化后的随机变量的极限分布是标准正态分布N(0,1)。中心极限定理(林德贝格-勒维):设随机变量X1,X2,Xn,相互独立,服从同一分布,且具有数学期望EXk=m,和方差D(Xk)=s2¹0,随机变量Yn=(-nm)/s 的分布函数为 Fn(x),则对任意实数x,恒有 Fn(x)= PYn£x= F(x) = òedt这一定理说明,的标准化随机变量Yn=(-nm)/s 的极限分布是标准正态分布N(0,1)第六章 样本及抽样分布(1)数理统计的基本概念:样本函数和统计量:常见统计量及其性质:样本均值样本方差样本标准差样本k阶原点矩样本k阶中心矩其中,为二阶中心矩(2)正态总体下的四大分布:正态分布设为来自正态总体的一个样本,则样本函数t分布设为来自正态总体的一个样本,则样本函数其中t(n-1)表示自由度为n-1的t分布。设为来自正态总体的一个样本,则样本函数其中表示自由度为n-1的分布第七章 参数估计(1)点估计矩估计设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。若为的矩估计,为连续函数,则为的矩估计极大似然估计:当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称为样本的似然函数,简记为Ln.当总体X为离型随机变量时,设其分布律为,则称为样本的似然函数。若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。若为的极大似然估计,为单调函数,则为的极大似然估计。(2)估计量的评选标准无偏性:设为未知参数的估计量。若E ()=,则称 为的无偏估计量。E()=E(X), E(S2)=D(X)有效性:设和是未知参数的两个无偏估计量。若,则称有效一致性:设是的一串估计量,如果对于任意的正数,都有则称为的一致估计量(或相合估计量)。若为的无偏估计,且则为的一致估计。只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。(3)区间估计:置信区间和置信度:设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即那么称区间为的置信区间,为该区间的置信度(或置信水平)。单正态总体的期望和方差的区间估计:设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:(i)选择样本函数;(ii)由置信度,查表找分位数;(iii)导出置信区间。已知方差,估计均值(i)选择样本函数(ii) 查表找分位数(iii)导出置信区间未知方差,估计均值(i)选择样本函数(ii)查表找分位数(iii)导出置信区间方差的区间估计(i)选择样本函数(ii)查表找分位数(iii)导出的置信区间第八章 假设检验基本步骤:假设检验的基本步骤如下:(i) 提出零假设H0; (ii) 选择统计量K;(iii) 对于检验水平查表找分位数;(iv) 由样本值计算统计量之值K;将进行比较,作出判断:当时否定H0,否则认为H0相容。两类错误:第一类错误:当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即P否定H0|H0为真=;此处的恰好为检验水平。第二类错误:当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即P接受H0|H1为真=。两类错误的关系:人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平。大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把取得很小,如0.01,甚至0.001。反之,则应把取得大些。单正态总体均值和方差的假设检验条件零假设统计量对应样本函数分布否定域(拒绝域)已知N(0,1)未知第 18 页