概率论与数理统计总复习.ppt
1概率论与数理统计总复习一、内容提要二、典型例题12随机试验可能结果基本事件Ai不含任何Ai任何组合事件A不可能必然完备事件组Ai等概完备事件组贝努利试验独立试验 概型只有两个可能结果n次重复古典概型条件:n次试验中 A发生k次B由其中m个事件组成公式(一)概念之间的关系(一)概念之间的关系一、一、随机变量与概率随机变量与概率231、运算关系、运算关系包含包含:A 则 B 相等相等:A=B和和:至少有一个发 生 AUB积积:同时发生 ABA、B不相容A、B 对立 记为差:ABB=SA(二)事件的关系(二)事件的关系34除与一般代数式运算相同的法则以外,注意1)对偶律对偶律 2)其他其他3)独立性独立性事件的独立性是由概率定义的;n个事件的独立性要求个等式成立。(三)(三)解题方法解题方法1、一般概率、一般概率1)利用两种概型10 古典20 n重贝努利概型2)利用事件间的运算2、运算法则、运算法则45化为事件的和利用对立事件A、B相互独立分解到完备组中:全概公式利用随机变量及其分布计算。一般情况化为事件的积一般情况是完备组,562)用乘法公式1)在缩减完备组中计算,方法同 1。3)用贝叶斯公式2 2、条件概率、条件概率67一实数值X(i),(一)随机变量的定义(一)随机变量的定义对于随机试验E的每一个可能结果i,的变量,则称实数变量X(i)为一个随机变量,简记为X。注意:注意:1、X 是定义在随机试验结果的集合i 上按试验的不同结果而取不同的值.取值是随机的.2、在一定的试验下,二、随机变量及其分布二、随机变量及其分布都唯一地对应着因此X的可以依据我们所关心的结果的数值特征选取 X 所代表的具体意义。3、X 的引入使我们便于研究随机试验的全貌,并使用分析的工具。781、离散型随机变量随机变量 X 的取值可以一一列举(有限或无限)定义定义分布律(分布列分布列)表示法称X 为离散型随机变量离散型随机变量。(二)随机变量的分布及性质(二)随机变量的分布及性质公式法列表法89定义定义对于随机变量X,若存在非负函数,使对任意实数则称X为连续型随机变量连续型随机变量,的概率密度的概率密度.都有f(x)0 x1其图形:(2)归一归一性性(1)非非负性负性密度函数的性质密度函数的性质2 2、连续性随机变量、连续性随机变量9103、分布函数、分布函数为X的分布函数.记作设 X是一个随机变量,称定义定义分布函数的性质分布函数的性质 1、单调不减性单调不减性:3、右连续性右连续性:对任意实数 ,2、归一归一 性性:若 x1x2,则 F(x1)F(x2);对任意实数x,0 F(x)1,且10111)分布函数的值表示了X 落在2)离散型:若分布函数的几点说明分布函数的几点说明是一个普通的函数,在 处内的概率。由于是X 取的诸值的概率之和,故又称 为累积概率函数为累积概率函数.图形特点:图形特点:是一条有跳跃的上升阶梯形曲线。11123 3)X为连续性随机变量为连续性随机变量f(x)0 x在f(x)x012133)把Y的分布用表(离散型)或Y的密度(连续性)1、问题:若之间的事件等价关系。关系和分布函数关系。是随机变量,表述出来。其中已知X 的分布,求的分布。2、基本方法4、随机变量函数的分布、随机变量函数的分布是 x的函数。研究1)由2)由之间的事件的关系再求之间的分布3、具体讨论1314则当若若X的分布律的分布律当则1)离散型离散型推广得:1415及有关函数表述出来。求其为等价的事件将用利用求出Y的密度函数。2 2)连续性连续性设 X是一个取值于区间具有概率密度的连续型随机变量,1516性质:性质:(一)二维随机变量(一)二维随机变量(X,Y)的分布函数的分布函数定义定义对于任意实数二元函数称为二维随机变量(X,Y)的分布函数的联合分布函数。或称为X和Y 三、二维随机变量及其分布三、二维随机变量及其分布2.且是变量的不减函数。1617(二)离散型(二)离散型的所有可能取值为设则和Y的联合分布列联合分布列。称为二维随机变量的分布列分布列,或随机变量X(非负性)(非负性)(归一性)(归一性)1718二维离散型随机变量的联合分布列二维离散型随机变量的联合分布列X Y y1 y2 yj p11 p12 .P1j .p21 p22 .P2j .pi1 pi2 .Pij .x1 x2xi关于Y的边缘分布关于X的边缘分布1819(X,Y)的边缘分布的边缘分布设的分布列为:则则关于关于的边缘分布列为关于的边缘分布列为:分别记1920(三)连续型三)连续型总有 的联合概率密度。其具有以下性质:定义定义 设二维随机变量的分布函数为,对任意实数为的概率密度,或称为随机变量和对于非负可积的函数(非负性)(非负性)(归一性)(归一性)2021的关于X 和Y 的边缘概率密度。定义定义 设是的联合密度函数,则分别是边缘概率密度边缘概率密度 2122均有(四)两个随机变量的独立性(四)两个随机变量的独立性若二维随机变量对任意的实数成立,则称随机变量与是相互独立相互独立的。若记且成立,可见X,Y 相互独立的定义与两个事件相互独立的定义是一致的。判断X,Y 相互独立的办法:2223其的概率密度为 的边缘概率密度分别为2324四、随机变量的数字特征四、随机变量的数字特征(一)数学期望(一)数学期望 E X定义定义X为离散型X为连续型若X为离散型X为连续型X为离散型其分布列为X为连续型其密度函数为2425若若 (X,Y)有联合密度2526期望的性质期望的性质其中 C 为常数。2.对于任何常数及 b.3.若相互独立,则2627 定义定义计算公式(二)方差(二)方差X为离散型其分布列为X为连续型其密度函数为X为离散型X为连续型2728其中 k 为常数。3.对于任何常数及 b.相互独立,则方差的性质方差的性质2829均匀分布泊松分布二项分布0-1分布参数范围方差均值概率分布名称(三三)常用的六个分布常用的六个分布指数分布2930标准正态分布参数范围方差均值概率分布名称(三三)常用的六个分布常用的六个分布正态分布任意3031称为标准化的随机变量,有2、正态分布随机变量函数的标准化、正态分布随机变量函数的标准化.表可查。注意注意3132COV(X,Y)=E(XE X)(YE Y)若随机变量 X,Y 为离散型.若随机变量 X,Y 为连续型.协方差协方差相关系数相关系数COV(X,Y)E(XY)EXEY一般计算公式3233COV(X,Y)E(XY)EXEY可见,可见,存在的必要条件为COV(X,Y)0 .即即定义:定义:若可见,若X与Y 独立,称称X与与Y不相关。不相关。D(X士Y)=D X+DY士2COV(X,Y)D(X士Y)=D X+DY即即33341.COV(X,X)E(X-EX)2=DX;3.COV(aX,bY)ab COV(X,Y),a,b是常数;4.COV(X1+X2,Y)COV(X1,Y)+COV(X2,Y).二、协方差与相关系数的性质二、协方差与相关系数的性质2.COV(X,Y)COV(Y,X);COV(X,Y)=E(XE X)(YE Y)5.5.34352 2)3 3)4 4)1 1)相关系数)相关系数则称则称X与与Y不相关;不相关;四个等价命题:四个等价命题:3536或(一)(一)切比雪夫不等式切比雪夫不等式五、大数定理与中心极限定理五、大数定理与中心极限定理设对任意不等式成立,则称此式为切比切比雪雪夫不等式夫不等式切比雪夫大数定律切比雪夫大数定律独立同分布下的大数定律贝努里大数定律贝努里大数定律3637之和总可以近似服从正态分布.(二)独立同分布下的中心极限定理(二)独立同分布下的中心极限定理设X1,X2,Xn,相互独立,且服从同一分布,具有相同的期望和方差则此定理表明此定理表明,无论原来服从什么分布,当n 充分大时,即3738(三)棣莫夫拉普拉斯中心极限定理(三)棣莫夫拉普拉斯中心极限定理设随机变量则对任意的,有此定理的常用公式有:3839数理统计数理统计一、一、总体和样本总体和样本 一个统计问题总有它明确的研究对象.总体总体 个体个体总体中每个成员(元素)称为个体.所抽取的部分个体称为样本样本.组成样本的个体称为样品样品。1、样本均值设是来自总体X的一个样本,2、样本方差3940二、极大似然估计法二、极大似然估计法:设是的一个样本值事件 发生的概率为为 的函数,形式已知(如离散型)X的分布列为的联合分布列联合分布列为:为样本的似然函数样本的似然函数。定义定义4041若总体X属连续型,其概率密度的形式已知,为待估参数;则的联合密度:一般,关于可微,故可由下式求得:因此的极大似然估计也可从下式解得:在同一点处取极值。41424243则结论:设为来自总体 的一个样本,任何总体的样本矩都是统计量。4344的证明都可以在教材上找到.当总体为正态分布时,教材上给出了几个重要的抽样分布定理.这里我们不加证明地叙述.几个定理 定理定理 1 (样本均值的分布)设 X1,X2,Xn 是取自正态总体则有的样本,n取不同值时样本均值 的分布三、几个重要的抽样分布定理三、几个重要的抽样分布定理44450对于给定的 算出1-,查标准正态分布表便可求得4546设 X1,X2,Xn 是取自正态总体分别为样本均值和样本方差,则有的样本,的分布定理定理 2 (样本方差的分布)4647分布分布分布是由正态分布派生出来的一种分布.定义定义:设随机变量相互独立,都服从标准正态分布N(0,1),则称统计量:所服从的分布为自由度为 n1 的分布.分布的密度函数为4748c2 分布的分位点 对于给定的正数称满足条件分位点分位点.分布的上来定义.通过积分其中伽玛函数其中伽玛函数的点4849 设 X1,X2,Xn 是取自正态总体的样本,分别为样本均值和样本方差,则有(与样本均值和样本方差有关 的一个分布)定理定理 3 定定义义:设设XN(0,1),Y ,且且X与与Y相相互独立,则称变量互独立,则称变量所服从的分布为自由度为所服从的分布为自由度为 n的的 t 分布分布.记为记为T .4950t 分布的分位点分布的分位点 对于给定的正数称满足条件的点为分位点”。分布的“上5051四、正态总体均值和方差的区间估计四、正态总体均值和方差的区间估计设为总体的样本,分别是样本均值和样本方差。1 1、已知、已知2 2时,时,的置信区间的置信区间设2、未知知2 2时,时,的置信区间的置信区间则的置信度为1的置信区间为51523、方差2 2的置信区间的置信区间这就是2 2的置信度为1的置信区间置信区间。5253提出原假设和备择假设 第一步:1、已知第二步:取统计量,在H0成立下求出它的分布第三步:查表确定临界值,使对给定的显著性水平均值假设检验过程分为五个步骤:或得H0否定域一、单个正态总体均值的假设检验一、单个正态总体均值的假设检验设总体其样本为5354选择假设H1 表示U可能大于0,也可能小于0。这称为双边假设检验。由于取用的统计量服从 U分布,第五步:判断则否定H0,接受H1则H0相容,接受H0故称其为U检验法。检验法。0第四步:将样本值 代入算出统计量54552、未知、未知2 2,均值,均值的的假设检验假设检验未知2,可用样本方差代替2检验步骤检验步骤提出原假设和备择假设 第一步:第二步:取一检验统计量,在H0成立下求出它的分布第三步:查表确定临界值,使对给定的显著性水平确定H0的否定域。5556即“”是一个小概率事件.或由于取用的统计量服从t分布,第四步:得H0否定域将样本值 代入算出统计量第五步:判断则否定H0,接受H1则H0相容,接受H0故称其为t 检验法。5657提出假设取统计量当H0成立有或是小概率事件。在显著性水平条件下检验假设则H0相容。二、单个正态总体方差的假设检验二、单个正态总体方差的假设检验5758三、两个正态总体均值差的双侧假设检验三、两个正态总体均值差的双侧假设检验5859提出原假设和备择假设 第一步:第二步:取统计量,在H0成立下求出它的分布第三步:查表确定临界值,使对给定的显著性水平假设检验过程分为五个步骤:其中5960第四步:将样本值 代入算出统计量其中6061第五步:判断则否定H0,接受H1则H0相容,接受H06162四、两个正态总体方差比的双侧假设检验四、两个正态总体方差比的双侧假设检验6263提出原假设和备择假设 第一步:第二步:取统计量,在H0成立下求出它的分布第三步:查表确定临界值,使对给定的显著性水平假设检验过程分为五个步骤:及6364第四步:将样本值 代入算出统计量第五步:判断若若 或或 则否定H0,接受H1若若 则H0相容,接受H06465 例:某行业进行专业劳动技能考核,一个月安排一次,每人最多参加3次;某人第一次参加能通过的概率为60%;如果第一次未通过就去参加第二次,这时能通过的概率为80%;如果第二次再未通过,则去参加第三次,此时能通过的概率为90%。求这人能通过考核的概率。65解:设 Ai=这人第i次通过考核,i=1,2,3 A=这人通过考核,亦可:典型例题6566例:一单位有甲、乙两人,已知甲近期出差的概率为80%,若甲出差,则乙出差的概率为20%;若甲不出差,则乙出差的概率为90%。(1)求近期乙出差的概率;(2)若已知乙近期出差在外,求甲出差的概率。66Bayes公式全概率公式解:设A=甲出差,B=乙出差666767 例3:设X的概率密度为 (1)求常数c的值;(2)写出X的概率分布函数;(3)要使 求k的值。解:676868例:解:例:解:6869例 设随机变量 的概率密度为(1)确定常数 ;(2)求 ;(3)求 ;(4)求6970解:(1)由 得 所以:(2)7071(3)(4)在 的区域 :上作直线 ,并记则7172例例 设二维随机变量设二维随机变量(X,Y)的密度函数为的密度函数为试求随机变量试求随机变量 Z=X/Y 的密度函数的密度函数.解解由公式由公式72737374例设 是相互独立的随机变量,证明证:因 故而 可能取的值为 且 相互独立,故故:7475 解解 例例757676777778787979808081 例例 设总体设总体 的分布密度为的分布密度为 为总体为总体 的样本的样本,求参数求参数 的矩估的矩估 计量计量.解:由于解:由于 只含有一个未知参数只含有一个未知参数 ,一般只,一般只需求出需求出 便能得到便能得到 的矩估计量,但是的矩估计量,但是8182 即即 不含有不含有 ,故不能由此得到故不能由此得到 的矩估的矩估计量计量.为此为此,求求 故令故令 于是解得于是解得 的矩估计量为的矩估计量为 8283惊人的预测惊人的预测8384惊人的预测惊人的预测8485惊人的预测惊人的预测8586惊人的预测惊人的预测8687谢谢谢谢87