概率论与数理统计复习资料要点总结--学生.doc
概率论与数理统计复习资料一、复习提纲注:以下是考试的参考内容,不作为实际考试范围,仅作为复习参考之用。考试内容以教学大纲和实施计划为准;注明“了解”的内容一般不考。1、 会事件关系的运算,了解概率的古典定义2、 能较熟练地求解古典概率;了解概率的公理化定义3、 掌握概率的基本性质和应用这些性质进行概率计算;理解条件概率的概念;掌握加法公式与乘法公式4、 能准确地选择和运用全概率公式与贝叶斯公式解题;掌握事件独立性的概念及性质。5、 理解随机变量的概念,掌握离散性随机变量分布率的性质及求法,掌握(01)分布、二项分布、泊松分布的分布律。6、 理解分布函数的概念及性质,理解并掌握连续型随机变量的概率密度及性质。7、 掌握指数分布(参数)、均匀分布、正态分布8、 会求特殊的一维随机变量函数分布的分布律或概率密度。9、 会求分布中的待定参数。会求区间的概率.10、 会求边缘分布律、边缘密度函数,会判别随机变量的独立性。11、 掌握二维连续型随机变量未知参数的计算,落在区域概率的计算。12、 理解二维随机变量的概念,理解二维随机变量的联合分布函数及其性质,掌握二维离散型随机变量的联合分布律及其性质,掌握二维连续型随机变量的联合概率密度及其性质,并会用它们计算有关事件的概率。13、 会求二维离散型随机变量函数的分布率.14、 掌握数学期望和方差的定义及性质,会熟练地求随机变量及其函数的数学期望和方差。会熟练地默写出几种重要随机变量的数学期望及方差。15、 较熟练地求协方差与相关系数.16、 会用独立正态随机变量线性组合性质解题。17、 理解总体、样本、简单随机样本、统计量及抽样分布概念,样本均值与样本方差及样本矩概念,掌握c2分布(及性质)、t分布、F分布及其分位点概念。18、 理解正态总体样本均值与样本方差的抽样分布定理;会用矩估计方法来估计未知参数。19、 掌握极大似然估计法,无偏性与有效性的判断方法。20、 会求单正态总体均值与方差的置信区间。21、 会求单正态总体均值的假设检验。二、各章知识要点第一章 随机事件与概率1事件的关系 2运算规则 (1) (2)(3) (4)3概率满足的三条公理及性质:(1) (2)(3)对互不相容的事件,有 (可以取)(可列可加性)性质:(4) (5) (6),若,则,(7),因此, P(AB),P(A),P(B),P(AB)这四个概率只要知道三个,剩下一个就能够求出来.特别的若A与B互不相容, 则P(AB)=P(A) +P(B);若A与B独立, 则P(AB)=P(A) +P(B)-P(A)P(B)= ;(8)4古典概型:基本事件有限且等可能5条件概率(1) 定义:若,则,条件概率是概率的一种,所有概率的性质都适合于条件概率。(2) 乘法公式:若为完备事件组,则有(3) 全概率公式: (4) Bayes公式: 7事件的独立性: 独立 (注意独立性的应用,求相互独立的多个事件的和的概率)第二章随机变量与概率分布1 离散随机变量:取有限或可列个值,满足(1),(2)=1 (3)对任意,2 连续随机变量:具有概率密度函数,满足(1);(2);(3)对任意,3 几个常用随机变量名称与记号分布列或密度数学期望方差0-1分布,或二项式分布,Poisson分布均匀分布,指数分布正态分布4 分布函数 ,具有以下性质 (1);(2)单调不减;(3)右连续; (4),特别; (5)对离散随机变量,; (6)对连续随机变量,为连续函数,且在连续点上,分布函数是一个普通的函数,它表示随机变量落入区间( ,x内的概率5 正态分布的概率计算 以记标准正态分布的分布函数,则有 (1);(2);(3)若,则 ; (4)以记标准正态分布的上侧分位数,则正态分布的概率密度具有如下性质:1° 的图形是关于对称的;2° 当时,为最大值;3° 以轴为渐近线。6 随机变量的函数 随机变量是随机变量的函数,若的分布函数或密度函数知道,则如何求出的分布函数或密度函数。(1)是离散型随机变量已知的分布列为 ,显然,的取值只可能是,若互不相等,则的分布列如下:,若有某些相等,则应将对应的相加作为的概率。(2)连续,在的取值范围内严格单调,且有一阶连续导数,则,若不单调,先求分布函数,再求导。第三章 多维随机变量1、二维随机变量的基本概念(1)二维离散型随机变量联合概率分布及边缘分布如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y)时,则称为离散型随机量。理解:(X=x,Y=y)(X=xY=y)设=(X,Y)的所有可能取值为,且事件=的概率为pij,称 为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: YXy1y2yjpi·x1p11p12p1jp1·x2p21p22p2jp2·xipi1pi·p·jp·1p·2p·j1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)对于随机向量(X,Y),称其分量X(或Y)的分布为(X,Y)的关于X(或Y)的边缘分布。上表中的最后一列(或行)给出了X为离散型,并且其联合分布律为,则X的边缘分布为 ;Y的边缘分布为 。(2)二维连续型随机向量联合分布密度及边缘分布联合概率密度f(x,y)具有下面两个性质:(1) f(x,y)0;(2)一般来说,当(X,Y)为连续型随机向量,并且其联合分布密度为f(x,y),则X和Y的边缘分布密度为注意:联合概率分布边缘分布,同时注意计算方法(3) (4)常见的二维分布均匀分布设随机向量(X,Y)的分布密度函数为其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)U(D)。正态分布 记为(X,Y)N(由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,反推则错。即XN(5)二维随机向量联合分布函数及其性质设(X,Y)为二维随机变量,对于任意实数x,y,二元函数称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:(1)(2)F(x,y)分别对x和y是非减的,即当x2>x1时,有F(x2,y)F(x1,y);当y2>y1时,有F(x,y2) F(x,y1);(3)F(x,y)分别对x和y是右连续的,即(4)2、随机变量的独立性(1)一般型随机变量 F(X,Y)=FX(x)FY(y)(2)离散型随机变量 例35:二维随机向量(X,Y)共有六个取正概率的点,它们是:(1,-1),(2,-1),(2,0),2,2),(3,1),(3,2),并且(X,Y)取得它们的概率相同,则(X,Y)的联合分布及边缘分布为 YX-1012p1·100020300p·j1因,所以X、Y不独立(3)连续型随机变量f(x,y)=fX(x)fY(y)联合分布边缘分布f(x,y)=fX(x)fY(y)直接判断,充要条件:可分离变量正概率密度区间为矩形例37:f(x,y)=(4)二维正态分布独立等价于=0(5)随机变量函数的独立性若X与Y独立,h,g为连续函数,则:h(X)和g(Y)独立。例如:若X与Y独立,则:3X+1和5Y-2独立。3、简单函数的分布(重点离散性)离散型:连续型 两个独立的正态分布的和仍为正态分布N()。有限个相互独立的正态分布的线性组合仍为正态分布。2、随机变量的独立性例317:设(X,Y)的联合分布密度为(1) 求C;(2) 求X,Y的边缘分布;(3) 讨论X与Y的独立性;(4) 计算P(X+Y1)。第四章 随机变量的数字特征1期望(1) 离散时 , ;一般情况下,求离散函数的期望的步骤:(1)求函数的分布律;(2)求期望(2) 连续时,;连续时,求的期望,就拿与给定随机变量的概率密度相乘,再在整个实数轴或二维平面内积分。(4)数学期望的性质(1) E(C)=C(2) E(CX)=CE(X)(3) E(X+Y)=E(X)+E(Y),(4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。2方差(1)方差,标准差;(2)方差的性质(1) D(C)=0;E(C)=C(2) D(aX)=a2D(X); E(aX)=aE(X)(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b(4) D(X)=E(X2)-E2(X)(5) D(X+Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E(X-E(X)(Y-E(Y协方差),无条件成立。E(X+Y)=E(X)+E(Y),无条件成立。类似的,n个相互独立的正态分布的线性组合,仍服从正态分布。, 3协方差(1);(2);(3);(4)时,称不相关,独立不相关,反之不成立,但正态时等价;(5)4相关系数 ;有, 与相关系数有关的几个重要结论(i) 若随机变量X与Y相互独立,则;反之不真。(ii) 若(X,Y)N(),则X与Y相互独立的充要条件是,即X和Y不相关。(iii) 以下五个命题是等价的:;cov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).5 阶原点矩, 阶中心矩数理统计的基本概念 第一节 基本概念1、总体、个体和样本(1)总体与样本总体在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体);而把总体中的每一个单元称为样品(或个体)。在以后的讨论中,我们总是把总体看成一个具有分布的随机变量(或随机向量)。例如单正态总体X,用来表示我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。为了使抽取的样本很好地反映总体地信息,最常用的方法是“简单随机抽样”:(1)代表性。即每一样品Xi与总体X同分布;(2)独立性。即样品抽取互相间不影响。此时的样本是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。注意:在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我们称之为样本的两重性。(2)样本函数与统计量设为总体的一个样本,称()为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。2、统计量(1)常用统计量样本均值样本方差(与概率论中的方差定义不同)样本标准差样本k阶原点矩样本k阶中心矩 (二阶中心矩与概率论中的方差定义相同)(2)统计量的期望和方差,,其中,为二阶中心矩。3、三个抽样分布(2、t、F分布)(1)2分布设n个随机变量相互独立,且服从标准正态分布,它们的平方和我们称随机变量W服从自由度为n的分布,记为W(n),所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。(2)t分布设X,Y是两个相互独立的随机变量,且函数我们称随机变量T服从自由度为n的t分布,记为Tt(n)。(3)F分布设,且X与Y独立,我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为Ff(n1, n2).正态分布,4、正态总体下统计量的分布和性质注意一个定理:与独立。(1)正态分布设为来自正态总体的一个样本,则样本函数(2)t-分布设为来自正态总体的一个样本,则样本函数其中t(n-1)表示自由度为n-1的t分布。(3)分布设为来自正态总体的一个样本,则样本函数其中表示自由度为n-1的分布。(4)F分布 设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数其中 表示第一自由度为,第二自由度为的F分布。第七章 参数估计1矩估计:(1)根据参数个数求总体的矩;(2)令总体的矩等于样本的矩;(3)解方程求出矩估计2极大似然估计:(1)写出极大似然函数;(2)求对数极大似然函数(3)求导数或偏导数;(4)令导数或偏导数为0,解出极大似然估计(如无解回到(1)直接求最大值,一般为min或max)3估计量的评选原则(1)无偏性:若,则为无偏; (2) 有效性:两个无偏估计中方差小的有效;4参数的区间估计(正态)参数条件估计函数置信区间已知未知未知第八章:正态总体均值的假设检验【相关公式】一、Z-检验设1, n为取自正态总体N(,2)的一个子样,2=为已知常数,检验H0:=0 (0已知)(这里视H1: 0)选用统计量Z= N(0,1) (8.1)对给定的水平由=,查表得临界值 ,确定出拒绝域为C=,其中z为(8.1)的观察值二、T-检验在实际应用中,2往往并不知道,我们自然想到用2的无偏估计代替它,便得到t-检验法。1,,n为取自总体N(, 2)的子样,需检验,H0:=0 H1: 0选用统计量 (8.3) 由给定的水平,由 =查表定出临界值,进而确定出拒绝域为C=【相关例题】1。某批矿砂的5 个样品中的镍含量,经测定(%)3.25 3.27 3.24 3.26 3.24设测定值总体服从正态分布,但参数均未知,问在=0.01下能否接受假设,这批矿砂的镍含量的均值为3.25.例2 某区进行数学统考,初二年级平均成绩为75.6分,标准差为7.4分,从该区某中学中抽取50位初二学生,测得平均数学统考成绩为78分,试问该中学初二的数学成绩与全区数学成绩有无显著差异?12