概率论与数理统计完整公式以及各知识点梳理_1.pdf
.1/27 概率论与数理统计完整版公式 第 1 章 随机事件与其概率 1排列组合公式)!(!nmmPnm从 m 个人中挑出 n 个人进行排列的可能数.)!(!nmnmCnm 从 m 个人中挑出 n 个人进行组合的可能数.2加法和 乘 法 原理 加法原理两种方法均能完成此事:m+n 某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n种方法来完成,则这件事可由 m+n 种方法来完成.乘法原理两个步骤分别不能完成这件事:mn 某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n 种方法来完成,则这件事可由 mn 种方法来完成.3一些常见排列 重复排列和非重复排列有序 对立事件至少有一个 顺序问题 4随机试 验 和 随机事件 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验.试验的可能结果称为随机事件.5基本事件、样本空 间 和 事件 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的部分事件组成的.这样一组事件中的每一个事件称为基本事件,用来表示.基本事件的全体,称为试验的样本空间,用表示.一个事件就是由中的部分点基本事件组成的集合.通常用大写字母A,B,C,表示事件,它们是的子集.为必然事件,为不可能事件.不可能事件的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件的概率为 1,而概率为 1 的事件也不一定是必然事件.6事件的 关 系 与运算 关系:如果事件 A 的组成部分也是事件B的组成部分,A发生必有事件B发生:BA 如果同时有BA,AB,则称事件A与事件B等价,或称A等于B:A=B.A、B中至少有一个发生的事件:AB,或者A+B.属于A而不属于B的部分所构成的事件,称为A 与B的差,记为A-B,也可 表示为A-AB或者BA,它表示A发生而B不发生的事件.2/27 A、B同时发生:AB,或者AB.AB=,则表示 A 与 B 不可能同时发生,称事件 A 与事件 B 互不相容或者互斥.基本事件是互不相容的.-A 称为事件 A 的逆事件,或称 A 的对立事件,记为A.它表示 A 不发生的事件.互斥未必对立.运算:结合率:A=C A=C 分配率:C=C=德摩根率:11iiiiAABABA,BABA 7概率的 公 理 化定义 设为样本空间,A为事件,对每一个事件A都有一个实数 P,若满足下列三个条件:1 0P1,2 P=1 3 对于两两互不相容的事件1A,2A,有 11)(iiiiAPAP 常称为可列完全可加性.则称 P为事件A的概率.8古典概型 1n21,2 nPPPn1)()()(21.设任一事件A,它是由m21,组成的,则有 P=)()()(21m=)()()(21mPPP nm基本事件总数所包含的基本事件数A 9几何概型 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型.对任一事件 A,)()()(LALAP.其中 L 为几何度量长度、面积、体积.10加法公式 P=P+P-P 当 P0 时,P=P+P 11减法公式 P=P-P 当 BA 时,P=P-P 当 A=时,P=1-P 12条件概率 定义设 A、B 是两个事件,且 P0,则称)()(APABP为事件 A 发生条件下,事件 B.3/27 发生的条件概率,记为)/(ABP)()(APABP.条件概率是概率的一种,所有概率的性质都适合于条件概率.例如 P=1P=1-P 13乘法公式 乘法公式:)/()()(ABPAPABP 更一般地,对事件 A1,A2,An,若 P0,则有 21(AAP)nA)|()|()(213121AAAPAAPAP21|(AAAPn)1nA.14独立性 两个事件的独立性 设事件A、B满足)()()(BPAPABP,则称事件A、B是相互独立的.若事件A、B相互独立,且0)(AP,则有)()()()()()()|(BPAPBPAPAPABPABP 若事件A、B相互独立,则可得到A与B、A与B、A与B也都相互独立.必然事件和不可能事件 与任何事件都相互独立.与任何事件都互斥.多个事件的独立性 设 ABC 是三个事件,如果满足两两独立的条件,P=PP;P=PP;P=PP 并且同时满足 P=PPP 那么 A、B、C 相互独立.对于 n 个事件类似.15全概公式 设事件nBBB,21满足 1nBBB,21两两互不相容,),2,1(0)(niBPi,2niiBA1,则有)|()()|()()|()()(2211nnBAPBPBAPBPBAPBPAP.16贝叶斯公式 设事件1B,2B,nB与A满足 11B,2B,nB两两互不相容,)(BiP0,i1,2,n,2niiBA1,0)(AP,则 njjjiiiBAPBPBAPBPABP1)/()()/()()/(,i=1,2,n.此公式即为贝叶斯公式.)(iBP,1i,2,n,通常叫先验概率.)/(ABPi,1i,2,n,通常称为后验概率.贝叶斯公式反映了因果的概率规律,并作出了由果朔因的推断.4/27 17伯努利概型 我们作了n次试验,且满足 每次试验只有两种可能结果,A发生或A不发生;n次试验是重复进行的,即A发生的概率每次均一样;每次试验是独立的,即每次试验A发生与否与其他次试验A发生与否是互不影响的.这种试验称为伯努利概型,或称为n重伯努利试验.用p表示每次试验A发生的概率,则A发生的概率为qp 1,用)(kPn表示n重伯努利试验中A出现)0(nkk次的概率,knkknnqpkPC)(,nk,2,1,0.第二章 随机变量与其分布 1离散型随机变量的分布律 设离散型随机变量X的可能取值为 Xk且取各个值的概率,即事件的概率为 P=pk,k=1,2,则称上式为离散型随机变量X的概率分布或分布律.有时也用分布列的形式给出:,|)(2121kkkpppxxxxXPX.显然分布律应满足下列条件:10kp,2,1k,211kkp.2连续型随机变量的分布密度 设)(xF是随机变量X的分布函数,若存在非负函数)(xf,对任意实数x,有 xdxxfxF)()(,则称X为连续型随机变量.)(xf称为X的概率密度函数或密度函数,简称概率密度.密度函数具有下面 4 个性质:1 0)(xf.2 1)(dxxf.3离散与连续型随机变量的关系 dxxfdxxXxPxXP)()()(积分元dxxf)(在连续型随机变量理论中所起的作用与kkpxXP)(在离散型随机变量理论中所起的作用相类似.5/27 4分布函数 设X为随机变量,x是任意实数,则函数)()(xXPxF 称为随机变量 X 的分布函数,本质上是一个累积函数.)()()(aFbFbXaP 可以得到 X落入区间,(ba的概率.分布函数)(xF表示随机变量落入区间,x内的概率.分布函数具有如下性质:1,1)(0 xFx;2)(xF是单调不减的函数,即21xx 时,有)(1xF)(2xF;30)(lim)(xFFx,1)(lim)(xFFx;4)()0(xFxF,即)(xF是右连续的;5)0()()(xFxFxXP.对于离散型随机变量,xxkkpxF)(;对于连续型随机变量,xdxxfxF)()(.5八大分布 0-1 分布 P=p,P=q 二项分布 在n重贝努里试验中,设事件A发生的概率为p.事件A发生的次数是随机变量,设为X,则X可能取值为n,2,1,0.knkknnqpCkPkXP)()(,其中nkppq,2,1,0,10,1,则 称 随 机 变 量X服 从 参 数 为n,p的 二 项 分 布.记 为),(pnBX.当1n时,kkqpkXP1)(,1.0k,这就是0-1分布,所以0-1分布是二项分布的特例.6/27 泊松分布 设随机变量X的分布律为 ekkXPk!)(,0,2,1,0k,则称随机变量X服从参数为的泊松分布,记为)(X或者 P.泊松分布为二项分布的极限分布np=,n.超几何分布),min(,2,1,0,)(nMllkCCCkXPnNknMNkM 随机变量 X 服从参数为 n,N,M 的超几何分布,记为 H.几何分布,3,2,1,)(1kpqkXPk,其中 p0,q=1-p.随机变量 X 服从参数为 p 的几何分布,记为 G.均匀分布 设随机变量X的值只落在a,b内,其密度函数)(xf在a,b上为常数ab 1,即 ,0,1)(abxf 其他,则称随机变量X在a,b上服从均匀分布,记为 XU.分布函数为 xdxxfxF)()(当 ax1x2b 时,X 落在区间21,xx内的概率为 abxxxXxP1221)(.0,xb.axb.7/27 指数分布 其中0,则称随机变量 X 服从参数为的指数分布.X 的分布函数为 记住积分公式:!0ndxexxn 正态分布 设随机变量X的密度函数为 222)(21)(xexf,x,其中、0为常数,则称随机变量X服从参数为、的正态分布或高斯Gauss分布,记为),(2NX.)(xf具有如下性质:1 )(xf的图形是关于x对称的;2 当x时,21)(f为最大值;若),(2NX,则X的分布函数为 dtexFxt222)(21)(.参数0、1时的正态分布称为标准正态分布,记为)1,0(NX,其密度函数记为 2221)(xex,x,分布函数为 xtdtex2221)(.)(x是不可求积函数,其函数值,已编制成表可供查用.1-且 21.如果X),(2N,则X)1,0(N.1221)(xxxXxP.)(xf,xe 0 x,0,0 x,)(xF,1xe 0 x,0 x0.8/27 6分位数 下分位表:)(XP;上分位表:)(XP.7函数分布 离散型 已知X的分布列为 ,)(2121nnipppxxxxXPX,)(XgY 的分布列)(iixgy 互不相等如下:,),(,),(),()(2121nnipppxgxgxgyYPY,若有某些)(ixg相等,则应将对应的ip相加作为)(ixg的概率.连续型 先利用 X 的概率密度 fX写出 Y 的分布函数 FYPgy,再利用变上下限积分的求导公式求出 fY.第三章 二维随机变量与其分布 1联合分布 离散型 如果二维随机向量X,Y的所有可能取值为至多可列个有序对x,y,则称为离散型随机量.设=X,Y的所有可能取值为),2,1,)(,(jiyxji,且事件=),(jiyx的概率为pij,称),2,1,(),(),(jipyxYXPijji 为=X,Y的分布律或称为 X 和 Y 的联合分布律.联合分布有时也用下面的概率分布表来表示:Y X y1 y2 yj x1 p11 p12 p1j x2 p21 p22 p2j xi pi1 ijp 这里pij具有下面两个性质:1pij0i,j=1,2,;2.1ijijp.9/27 连续型 对 于 二 维 随 机 向 量),(YX,如 果 存 在 非 负 函 数),)(,(yxyxf,使对任意一个其邻边分别平行于坐标轴的矩形区域 D,即 D=|axb,cyd有 DdxdyyxfDYXP,),(),(则称为连续型随机向量;并称 f为=X,Y的分布密度或称为 X 和 Y 的联合分布密度.分布密度 f具有下面两个性质:(1)f0;2 .1),(dxdyyxf 2二维随机变量的本质)(),(yYxXyYxX 3联合分布函数 设X,Y为二维随机变量,对于任意实数 x,y,二元函数,),(yYxXPyxF 称为二维随机向量X,Y的分布函数,或称为随机变量 X 和 Y 的联合分布函数.分 布 函 数 是 一 个 以 全 平 面 为 其 定 义 域,以 事 件)(,)(|),(2121yYxX的概率为函数值的一个实值函数.分布函数 F具有以下的基本性质:1;1),(0yxF 2Fx,y分别对 x 和 y 是非减的,即 当 x2x1时,有 Fx2,yF;当 y2y1时,有 FF;3Fx,y分别对 x 和 y 是右连续的,即);0,(),(),0(),(yxFyxFyxFyxF 4.1),(,0),(),(),(FxFyFF 5对于,2121yyxx 0)()()()(11211222yxFyxFyxFyxF,.4离散型与连续型的关系 dxdyyxfdyyYydxxXxPyYxXP)()()(,.10/27 5边缘分布 离散型 X 的边缘分布为),2,1,()(jipxXPPijjii;Y 的边缘分布为),2,1,()(jipyYPPijijj.连续型 X 的边缘分布密度为;dyyxfxfX),()(Y 的边缘分布密度为.),()(dxyxfyfY 6条件分布 离散型 在已知X=xi的条件下,Y 取值的条件分布为;iijijppxXyYP)|(在已知Y=yj的条件下,X 取值的条件分布为,)|(jijjippyYxXP 连续型 在已知 Y=y 的条件下,X 的条件分布密度为)(),()|(yfyxfyxfY;在已知 X=x 的条件下,Y 的条件分布密度为)(),()|(xfyxfxyfX 7独立性 一般型 F=FXFY 离散型 jiijppp 有零不独立 连续型 f=fXfY 直接判断,充要条件:可分离变量 正概率密度区间为矩形 二维正态分布,121),(2222121211221)(2)1(212yyxxeyxf 0.11/27 随机变量的函数 若 X1,X2,Xm,Xm+1,Xn相互独立,h,g 为连续函数,则:hX1,X2,Xm和 gXm+1,Xn相互独立.特例:若 X 与 Y 独立,则:hX和 gY独立.例如:若 X 与 Y 独立,则:3X+1 和 5Y-2 独立.8二维均匀分布 设随机向量X,Y的分布密度函数为 其他,0),(1),(DyxSyxfD 其中 SD为区域 D 的面积,则称X,Y服从 D 上的均匀分布,记为X,YUD.9二维正态分布 设随机向量X,Y的分布密度函数为,121),(2222121211221)(2)1(212yyxxeyxf 其中1|,0,0,21,21是 5 个参数,则称X,Y服从二维正态分布,记为X,YN).,2221,21 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即 XN).(),22,2211NY 但是若 XN)(),22,2211NY,未必是二维正态分布.10函数分布 Z=X+Y 根据定义计算:)()()(zYXPzZPzFZ 对于连续型,fZdxxzxf),(两 个 独 立 的 正 态 分 布 的 和 仍 为 正 态 分 布222121,.n 个相互独立的正态分布的线性组合,仍服从正态分布.iiiC,iiiC222.12/27 Z=max,min 若nXXX21,相 互 独 立,其 分 布 函 数 分 别 为)()()(21xFxFxFnxxx,,则 Z=max,min的分布函数为:)()()()(21maxxFxFxFxFnxxx)(1)(1)(1 1)(21minxFxFxFxFnxxx 2分布 设n个随机变量nXXX,21相互独立,且服从标准正态分布,可以证明它们的平方和 niiXW12 的分布密度为.0,0,0221)(2122uueunufunn 我们称随机变量 W 服从自由度为 n 的2分布,记为 W)(2n,其中.2012dxexnxn 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数.2分布满足可加性:设),(2iinY 则).(2112kkiinnnYZ.13/27 t 分布 设 X,Y 是两个相互独立的随机变量,且),(),1,0(2nYNX 可以证明函数 nYXT/的概率密度为 2121221)(nntnnntf).(t 我们称随机变量 T 服从自由度为 n 的 t 分布,记为 Tt.)()(1ntnt F 分布 设)(),(2212nYnX,且 X 与 Y 独立,可以证明21/nYnXF 的概率密度函数为 0,00,1222)(2211222121212111yyynnynnnnnnyfnnnn 我们称随机变量 F 服从第一个自由度为 n1,第二个自由度为 n2的 F 分布,记为 Ff.),(1),(12211nnFnnF 第四章 随机变量的数字特征 1 离散型 连续型.14/27 一维随机变量的数字特征 期望 期望就是平均值 设 X 是离散型随机变量,其分布律为Ppk,k=1,2,n,nkkkpxXE1)(要求绝对收敛 设 X 是连续型随机变量,其概率密度为 f,dxxxfXE)()(要求绝对收敛 函数的期望 Y=g nkkkpxgYE1)()(Y=g dxxfxgYE)()()(方差 D=EX-E2,标准差)()(XDX,kkkpXExXD2)()(dxxfXExXD)()()(2 矩 对于正整数 k,称随机变量 X的 k 次幂的数学期望为 X 的 k阶原点矩,记为 vk,即 k=E=iikipx,k=1,2,.对于正整数 k,称随机变量 X与 EX差的 k 次幂的数学期望为 X 的 k 阶中心矩,记为k,即.)(kkXEXE=iikipXEx)(,k=1,2,.对于正整数 k,称随机变量 X 的 k次幂的数学期望为X 的 k阶原点矩,记为 vk,即 k=E=,)(dxxfxk k=1,2,.对于正整数 k,称随机变量 X 与 EX 差的 k 次幂的数学期望为 X 的 k阶 中 心 矩,记 为k,即.)(kkXEXE=,)()(dxxfXExk k=1,2,.15/27 切比雪夫不等式 设随机变量 X 具有数学期望 EX=,方差 DX=2,则对于任意正数,有下列切比雪夫不等式 22)(XP 切比雪夫不等式给出了在未知 X 的分布的情况下,对概率)(XP 的一种估计,它在理论上有重要意义.2期望的性质(1)E=C(2)E=CE(3)E=E+E,niniiiiiXECXCE11)()((4)E=E E,充分条件:X 和 Y 独立;充要条件:X 和 Y 不相关.3方差的性质(1)D=0;E=C(2)D=a2D;E=aE(3)D=a2D;E=aE+b(4)D=E-E2(5)D=D+D,充分条件:X 和 Y 独立;充要条件:X 和 Y 不相关.D=D+D2EX-EY-E,无条件成立.而 E=E+E,无条件成立.4常见分布的期望和方差 期望 方差 0-1 分布),1(pB p)1(pp 二项分布),(pnB np)1(pnp 泊松分布)(P 几何分布)(pG p1 21pp 超几何分布),(NMnH NnM 11NnNNMNnM 均匀分布),(baU 2ba 12)(2ab 指数分布)(e 1 21.16/27 正态分布),(2N 2 分布2 n 2n t 分布 0 2nn2 5二维随机变量的数字特征 期望 niiipxXE1)(njjjpyYE1)(dxxxfXEX)()(dyyyfYEY)()(函数的期望),(YXGE ijijjipyxG),(),(YXGE dxdyyxfyxG),(),(方差 iiipXExXD2)()(jjjpYExYD2)()(dxxfXExXDX)()()(2 dyyfYEyYDY)()()(2 协方差 对于随机变量X与Y,称它们的二阶混合中心矩11为X 与 Y 的协方差或相关矩,记为),cov(YXXY或,即).()(11YEYXEXEXY 与记号XY相对应,X 与 Y 的方差 DX与 DY也可分别记为XX与YY.17/27 相关系数 对于随机变量 X 与 Y,如果 DX0,D0,则称)()(YDXDXY 为 X 与 Y 的相关系数,记作XY有时可简记为.|1,当|=1 时,称 X 与 Y 完全相关:1)(baYXP 完全相关,时负相关,当,时正相关,当)0(1)0(1aa 而当0时,称 X 与 Y 不相关.以下五个命题是等价的:0XY;cov=0;E=EE;D=D+D;D=D+D.协方差矩阵 YYYXXYXX 混合矩 对于随机变量 X 与 Y,如果有)(lkYXE存在,则称之为 X 与 Y 的k+l阶混合原点矩,记为kl;k+l阶混合中心矩记为:.)()(lkklYEYXEXEu 6协方差的性质(i)cov=cov;(ii)cov=ab cov;(iii)cov=cov+cov;(iv)cov=E-EE.7独立和不相关(i)若随机变量 X 与 Y 相互独立,则0XY;反之不真.(ii)若X,YN,222121,则 X 与 Y 相互独立的充要条件是 X 和 Y 不相关.第五章 大数定律和中心极限定理.18/27 1大数定律 X 切比雪夫大数定律 设随机变量 X1,X2,相互独立,均具有有限方差,且被同一常数C 所界:DXiC,则对于任意的正数,有.1)(11lim11niiniinXEnXnP 特殊情形:若X1,X2,具有相同的数学期望 EXI=,则上式成为.11lim1niinXnP 伯努利大数定律 设是 n次独立试验中事件 A发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意的正数,有.1limpnPn 伯努利大数定律说明,当试验次数 n 很大时,事件 A 发生的频率与概率有较大判别的可能性很小,即.0limpnPn 这就以严格的数学形式描述了频率的稳定性.辛钦大数定律 设 X1,X2,Xn,是相互独立同分布的随机变量序列,且 EXn=,则对于任意的正数有.11lim1niinXnP 2中心极限定理),(2nNX 列维林德伯格定理 设随机变量 X1,X2,相互独立,服从同一分布,且具有相同的数学期望和方差:),2,1(0)(,)(2kXDXEkk,则随机变量 nnXYnkkn1 的分布函数Fn对任意的实数x,有 xtnkknnndtexnnXPxF.21lim)(lim212 此定理也称为独立同分布的中心极限定理.19/27 棣莫弗拉普拉斯定理 设随机变量nX为具有参数 n,p0p的二项分布,则对于任意实数 x,有 xtnndtexpnpnpXP.21)1(lim22 3二项定理 若当),(,不变时knpNMN,则 knkknnNknMNkMppCCCC)1().(N 超几何分布的极限分布为二项分布.4泊松定理 若当0,npn时,则 ekppCkknkkn!)1().(n 其中 k=0,1,2,n,.二项分布的极限分布为泊松分布.第六章 样本与抽样分布 1数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个 或多个 指标的全体称为总体 或母体.我们总是把总体看成一个具有分布的随机变量或随机向量.个体 总体中的每一个单元称为样品或个体.样本 我们把从总体中抽取的部分样品nxxx,21称为样本.样本中所含的样品数称为样本容量,一般用 n 表示.在一般情况下,总是把样本看成是 n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本.在泛指任一次抽取的结果时,nxxx,21表示 n 个随机变量样本;在具体的一次抽取之后,nxxx,21表示 n 个具体的数值样本值.我们称之为样本的两重性.样本函数和统计量 设nxxx,21为总体的一个样本,称 nxxx,21 为样本函数,其中为一个连续函数.如果中不包含任何未知参数,则称nxxx,21为一个统计量.20/27 常见统计量与其性质 关系:如果事件 A 的组成部分也是事件B的组成部分,A发生必有事件B发生:BA 如果同时有BA,AB,则称事件A与事件B等价,或称A等于B:A=B.A、B中至少有一个发生的事件:AB,或者A+B.属于A而不属于B的部分所构成的事件,称为A 与B的差,记为A-B,也可表示为A-AB或者BA,它表示A发生而B不发生的事件.A、B同时发生:AB,或者AB.AB=,则表示 A 与 B 不可能同时发生,称事件 A 与事件 B 互不相容或者互斥.基本事件是互不相容的.-A 称为事件 A 的逆事件,或称 A 的对立事件,记为A.它表示 A 不发生的事件.互斥未必对立.运算:结合率:A=C A=C 分配率:C=C=德摩根率:11iiiiAABABA,BABA 2正态总体下的四大分布 正态分布 设为样本空间,A为事件,对每一个事件A都有一个实数 P,若满足下列三个条件:1 0P1,2 P=1 3 对于两两互不相容的事件1A,2A,有 11)(iiiiAPAP 常称为可列完全可加性.则称 P为事件A的概率.t 分布 1n21,2 nPPPn1)()()(21.设任一事件A,它是由m21,组成的,则有 P=)()()(21m=)()()(21mPPP nm基本事件总数所包含的基本事件数A.21/27 分布2 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型.对任一事件 A,)()()(LALAP.其中 L 为几何度量长度、面积、体积.F 分布 P=P+P-P 当 P0 时,P=P+P 3正态总体下分布的性质 P=P-P 当 BA 时,P=P-P 当 A=时,P=1-P 第七章 参数估计.22/27 1 点估计 矩估计 设总体 X 的分布中包含有未知数m,21,则其分布函数可以表成).,;(21mxF它的 k 阶原点矩),2,1)(mkXEvkk中也包 含 了 未 知 参 数m,21,即),(21mkkvv.又 设nxxx,21为总体 X 的 n 个样本值,其样本的 k 阶原点矩为 nikixn11).,2,1(mk 这样,我们按照当参数等于其估计量时,总体矩等于相应的样本矩的原则建立方程,即有 nimimmniimniimxnvxnvxnv121122121211.1),(,1),(,1),(由上面的 m 个方程中,解出的 m 个未知参数),(21m即为参数m,21的矩估计量.若为的矩估计,)(xg为连续函数,则)(g为)(g的矩估计.23/27 极 大 似然估计 当 总 体X为 连 续 型 随 机 变 量 时,设 其 分 布 密 度 为),;(21mxf,其 中m,21为 未 知 参 数.又 设nxxx,21为总体的一个样本,称),;(),(11122nimimxfL 为样本的似然函数,简记为Ln.当 总 体X为 离 型 随 机 变 量 时,设 其 分 布 律 为),;(21mxpxXP,则称),;(),;,(1111222nimimnxpxxxL 为样本的似然函数.若似然函数),;,(2211mnxxxL在m,21处取到最大值,则称m,21分别为m,21的最大似然估计值,相应的统计量称为最大似然估计量.miLiiin,2,1,0ln 若为的极大似然估计,)(xg为单调函数,则)(g为)(g的极大似然估计.2 估计量的评选标准 无偏性 设),(21nxxx为未知参数的估计量.若 E =,则称为的无偏估计量.EX=EX,ES2=DX 有效性 设),(2111nxxx和),(2122nxxx是未知参数的两个无偏估计量.若)()(21DD,则称21比有效.24/27 一致性 设n是的一串估计量,如果对于任意的正数,都有,0)|(|limnnP 则称n为的一致估计量或相合估计量.若为的无偏估计,且),(0)(nD则为的一致估计.只要总体的 E和 D存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量.3 区间估计 置 信 区间 和 置信度 设总体X含有一个待估的未知参数.如果我们从样本nxxx,21出发,找出两个统计量),(2111nxxx与),(2122nxxx)(21,使 得 区 间,21以)10(1的概率包含这个待估参数,即,121P 那么称区间,21为的置信区间,1为该区间的置信度或置信水平.单 正 态总 体 的期 望 和方 差 的区 间 估计 设nxxx,21为总体),(2NX的一个样本,在置信度为1下,我们来确定2和的置信区间,21.具体步骤如下:i选择样本函数;ii由置信度1,查表找分位数;iii导出置信区间,21.已知方差,估计均值 i选择样本函数).1,0(/0Nnxu 查表找分位数.1/0nxP iii导出置信区间 nxnx00,.25/27 未知方差,估计均值 i选择样本函数).1(/ntnSxt 查表找分位数.1/nSxP iii导出置信区间 nSxnSx,方差的区间估计 i选择样本函数).1()1(222nSnw ii查表找分位数.1)1(2221SnP iii导出的置信区间 SnSn121,1 第八章 假设检验 基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理.为了检验一个假设H0是否成立.我们先假定H0是成立的.如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的.与H0相对的假设称为备择假设,用H1表示.这里所说的小概率事件就是事件RK,其概率就是检验水平,通常我们取=0.05,有时也取 0.01 或 0.10.基本步骤 假设检验的基本步骤如下:(i)提出零假设H0;(ii)选择统计量K;(iii)对于检验水平查表找分位数;(iv)由样本值nxxx,21计算统计量之值K;将与K进行比较,作出判断:当)(|KK或时否定H0,否则认为H0相容.26/27 两类错误 第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0.这时,我们把客观上H0成立判为H0为不成立 即否定了真实的假设,称这种错误为以真当假的错误或第一类错误,记为犯此类错误的概率,即 P否定H0|H0为真=;此处的恰好为检验水平.第二类错误 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0.这时,我们把客观上H0.不成立判为H0成立 即接受了不真实的假设,称这种错误为以假当真的错误或第二类错误,记为犯此类错误的概率,即 P接受H0|H1为真=.两类错误的关系 人们当然希望犯两类错误的概率同时都很小.但是,当容量 n 一定时,变小,则变大;相反地,变小,则变大.取定要想使变小,则必须增加样本容量.在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平.大小的选取应根据实际情况而定.当我们宁可以假为真、而不愿以真当假时,则应把取得很小,如 0.01,甚至 0.001.反之,则应把取得大些.单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域 已知2 00:H nxU/00 N0,1 21|uu 00:H 1uu 00:H 1uu 未知2 00:H nSxT/0)1(nt)1(|21ntt 00:H)1(1ntt 00:H)1(1ntt 未知2 220:H 202)1(Snw)1(2n)1()1(22122nwnw或 2020:H)1(21nw.27/27 2020:H)1(2nw