《数理统计教案》PPT课件.ppt
数理统计数理统计讲授:河海大学数学系列基础课程河海大学数学系列基础课程CAICAI第六章第六章 样本及抽样分布样本及抽样分布l随机样本随机样本l抽样分布抽样分布 从本章开始,我们将学习数理统计部分,前面五章的内容属于概率论范畴。数理统计实际上是概率论的具体应用。它的研究范围分成两个方面,一个是统计推断统计推断,另一个是抽样理论抽样理论与试验设计试验设计。本课程仅研究第一个方面的内容。统计推断主要研究抽样分布抽样分布、参数估计参数估计、假设检验假设检验等本章的主要内容如下:6.1 随机样本随机样本一、总体与样本一、总体与样本 1、总体总体:研究对象的全体。通常指研究对象的某项数量指标,可记为X、Y、Z、等,它是随机变量。2、个体个体:组成总体的单元。通常也指与总体对应的某项数量指标,可用X1,X2,等表示,它们也是随机变量。3、样本样本:来自总体的部分个体X1,Xn。n称为样本容量。若是按随机抽样原则得到的,则称其是“简单简单随机样本随机样本”或简称为“随机样本随机样本”或“样本样本”。按随机抽样原则得到的样本满足以下两个条件:(1)独立性独立性:X1,Xn 相互独立;(2)同分布性同分布性:X1,Xn与总体同分布。来自总体X的随机样本X1,Xn可记为其中f(x)是X的概率函数。样本观测值样本观测值:对样本X1,Xn进行观测,即可得一组观测值x1,xn二、经验分布函数二、经验分布函数1、构造、构造 将样本观测值:x1,xn从小到大排列得为总体X的一个经验分布函数。其中N(A)表示A中元素个数。2、经验分布函数的性质(1)经验分布函数是分布函数;(2)K.Glivenko(格涅汶科)证明:其中F(x)=PX x为总体X的分布函数。三、统计量三、统计量 样本X1,Xn的函数g(X1,Xn)称为是总体X的一个统计量统计量,若g(X1,Xn)与任何未知参数无关。4、极大、极小统计量、极大、极小统计量 极大统计量:X(n)=maxX1,Xn,其观测值:x(n)=maxx1,,xn 极小统计量:X(1)=minX1,Xn,其观测值:x(1)=minx1,xn6.2 抽样分布抽样分布一、一、2分布分布 统计量的分布称为抽样分布。数理统计中主要研究如下四个分布:U分布、2分布、t 分布和F分布。其密度为1.构造构造f(y)2(n)2.再生性再生性 若 1 2(n1),2 2(n2),1,2独立,则 1+2 2(n1+n2)。3.期望与方差期望与方差 若 2(n),则E=n,D=2n。4.分位点分位点 设 2(n),若对于:0 45),近似地有其中z 为N(0,1)的上侧 分位点。二、二、t分布分布 1.构造构造 若 N(0,1),2(n),与 独立,则t(n)称为自由度为n的t分布。其密度函数为 密度函数f(t)的图形与N(0,1)的密度函数的图形很象,只是 t(n)的图形两端尾巴厚一些,腰瘦一些。2.基本性质基本性质:(1)f(t)关于t=0(纵轴)对称。事实上,f(-t)=f(t)。(2)f(t)的极限为N(0,1)的密度函数,即 3.分位点分位点 设Tt(n),若对:0 0,满足PT t(n)=,则称t(n)为t(n)的上侧 分位点;存在t/2(n)0,满足 P|T|t/2(n)=,则称t/2(n)为t(n)的双侧 分位点.三、三、F分布分布1.构造构造 若 1 2(n1),2 2(n2),1,2独立,则 F(n1,n2)称为第一自由度为n1,第二自由度为n2的F分布。其密度为2.F分布的分位点分布的分位点 对于:0 0,满足PT f(n1,n2)=,则称f(n1,n2)为F(n1,n2)的上侧 分位点;类似地,称f1-(n1,n2)为F(n1,n2)的下侧 分位点。可以证明:四、正态总体的抽样分布四、正态总体的抽样分布这里分布N(0,1)也称为U分布分布。例例例例例例本章小结本章小结1、总体与样本、总体与样本2、经验分布函数、经验分布函数3、统计量概念与几个常用的统计量、统计量概念与几个常用的统计量4、数理统计中的几个常用分布(关键是构造)、数理统计中的几个常用分布(关键是构造)5、正态总体的抽样分布定理、正态总体的抽样分布定理第七章第七章 参数估计参数估计l点估计点估计l点估计的评价标准点估计的评价标准l区间估计区间估计l正态总体参数的区间估计正态总体参数的区间估计l区间估计的大样本法区间估计的大样本法7.1 点估计点估计一、参数估计的概念一、参数估计的概念 定义定义 设X1,Xn是总体X的一个样本,其概率函数为f(x;),。其中为未知参数,为参数空间,f(x;)可表示分布律或密度函数.若统计量g(X1,Xn)可作为 的一个估计,则称其为的一个估计量,记为若x1,xn是样本的一个观测值。由于g(x1,xn)是实数域上的一个点,现用它来估计,故称这种估计为点估计点估计。点估计的经典方法是矩估计法与极大似然估计法。二、矩估计法二、矩估计法(简称简称“矩法矩法”)定义定义 用样本矩作为总体同阶矩的估计,从而解出未知参数的方法称为矩估计法或矩法。的矩估计可记为 应满足方程:k的取值取决于f(x;)中未知参数的维数。若维数为1,即仅有一个参数,则可在第一个方程中让k取1;若维数为2,则可让k取1和2,解联立方程即可得或或余类推。矩估计三、极大似然估计法三、极大似然估计法1、极大似然思想、极大似然思想 你从河海大学去火车站赶火车,25分钟后列车就要开了,你是坐公共汽车去还是坐出租车去?答案是坐出租车去。这是因为坐出租车在25分钟内赶到火车站的把握大。一般说,事件A与参数有关,取值不同,则P(A)也不同。若A发生了,则认为此时的值就是的估计值。这就是极大似然思想。极大似然思想。例例5 设袋中装有许多黑、白球,不同颜色球的数量比为3:1,试设计一种方法,估计任取一球为黑球的概率p。解解 易知p的值无非是1/4或3/4。现从袋中有放回地任取3只球,用X表示其中的黑球数,则Xb(3,p),要估计p的值。对P的不同取值,X取k=0,1,2,3的概率可列表如下:X 0 1 2 3 X 0 1 2 3 (p=1/4)27/64 27/64 9/64 1/64 (p=1/4)27/64 27/64 9/64 1/64 (p=3/4)1/64 9/64 27/64 27/64 (p=3/4)1/64 9/64 27/64 27/64故根据极大似然思想即知2、似然函数与极大似然估计、似然函数与极大似然估计为该总体的为该总体的似然函数似然函数。它实际上代表样本取其观测值时的概率。定义定义 3、极大似然估计的推求、极大似然估计的推求(1)解似然方程法解似然方程法称为未知参数 的似然方程。若该方程有解,则其解就是(2)直接法直接法 由似然方程解不出 的似然估计时,可由定义通过分析直接推求。注解:注解:若概率函数中含有多个未知参数,比如则可解方程组 若碰到某些个参数用似然方程解不出,则可用直接法推求。例例 设总体设总体X的分布函数为的分布函数为例例7.2 估计量的评选标准估计量的评选标准一、无偏性一、无偏性 易知,样本均值和样本方差分别是总体均值和总体方差的无偏估计。事实上,二、有效性二、有效性 易知,样本X1,Xn的加权平均值都是EX的无偏估计。但当 i=1/n时,其方差最小。事实上,由柯西不等式可知 的无偏估计类中有一个下界,这由如下的罗克拉美(Rao-Cramer)不等式给出:三、一致性三、一致性7.3 区间估计区间估计一、概念一、概念i=1,2,为两个统计量,给定:0 1,若有 p 1 2=1,则称1 为置信度,(1,2)为 的置信区间,1 为置信下限,2为置信上限。(1,2)也称为 的区间估计。i=i(X1,Xn),二、置信区间二、置信区间 100组观测值对应100个置信区间,每一个置信区间可能包含 的真值,也可能不包含 的真值。若给定 =0.05,则表示100个这样的区间里,大约有95个包含 的真值。对样本X1,Xn的每一组观测值,比如说我们均可由给定的置信度1,求得一个置信区间 用置信度为1的置信区间(1,2)去估计未知参数,显然1是越大越好,它反映区间估计的可靠性,而 21,则是越小越好,它反映区间估计的精度。本课程主要讨论正态总体参数的区间估计,即置信区间问题。7.4 正态总体参数的区间估计正态总体参数的区间估计一、单正态总体均值的置信区间一、单正态总体均值的置信区间1、2已知注:注:在推求的置性区间的过程中,我们发现 的置性区间是不唯一的,事实上,由 (1-)1-查表计算即得的置信度为1的置信区间 也可解得 的置信区间。(置信度为1)是 的长度最短的置性区间。以后,在各种情况下,推求置性区间的思路与这里类似。其中0 1500,即认为采用新工艺后,灯管寿命有了显著提高。显著性检验的思想和步骤:显著性检验的思想和步骤:(1)根据实际问题作出假设H0与H1;(2)构造统计量,在H0真时其分布已知;(3)给定水平 的值(一般为0.05,0.025,0.01,0.005等),求出H0对H1的拒绝域C;(4)查表、计算得分位点和统计量的值;(5)比较统计量与分位点值的大小,得出结论,依据是小概率原理小概率原理。8.2 单正态总体参数的假设检验单正态总体参数的假设检验一、单总体均值的假设检验一、单总体均值的假设检验1、2已知的情形 对于假设H0:=0;H1:0,构造查表,计算,比较大小,即得结论:说明:说明:(1)H0:=0;H1:u0称为双边HT问题;而 H0:=0;H1:0(或 0 或H0:0;H1:0 也称为单边HT问题,不过这是一个完备的HT问题。(3)完备的单边HT问题与不完备的单边HT问题有相同的拒绝域,从而检验法一致。对于H0:=0;H1:0,2已知的情形,其拒绝域为 U z 现以H0:0;H1:0,2已知为例,说明完备单边问题与不完备单边问题具有相同的拒绝域。对于H0:0;H1:0,2已知,构造 则U z是概率不超过 的的小概率事件,故可作为拒绝域。2、2未知的情形由p|T|t/2(n 1)=,可得拒绝域|T|t/2(n 1),查表、计算,比较大小即得结论。此时,对于单边问题H0:=0;H1:0,有拒绝域T t(n 1)。对于假设H0:=0;H1:0,构造二、单总体方差的假设检验二、单总体方差的假设检验1、未知的情形2、已知的情形8.3 双正态总体均值差与方差比的双正态总体均值差与方差比的假设检验假设检验一、均值差的假设检验一、均值差的假设检验二、方差比的假设检验二、方差比的假设检验 此时没有已知精确分布的统计量来作检验,只有在大样本(n1,n2 30)的情况下,可认为从而得到第一种情形。两样本独立,给定检验水平 ,由观测值1.1,2未知的情形由pF F1/2(n1 1,n2 1)或F F/2(n1 1,n2 1)=即得拒绝域 F F1/2(n1 1,n2 1)或 F F/2(n1 1,n2 1)而对应的单边问题的拒绝域分别是 F F1(n1 1,n2 1)与 F F(n1 1,n2 1)2、1,2 已知的情形即可得到检验的拒绝域。单正态总体参数的假设检验单正态总体参数的假设检验