数理统计的基础知识.pdf
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。第五章第五章 数理统计的基础知识数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。例如:1、某种电子元件的寿命服从什么分布是完全不知道的。2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0-1)分布,但其中的参数 p 未知。对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料。二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断本书中参数估计和假设检验。第一节第一节数理统计的基本概念数理统计的基本概念一、总体与总体的分布一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体总体或母体母体,而把组成总体的每个元素称为个体个体。总体中所包含的个体的个数称为总体的容量总体的容量.容量为有限的总体称为有限总体有限总体;容量为无限的总体称为无限总体无限总体.总体和个体之间的关系就是集合与元素之间的关系.在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X。例如:研究一批灯泡的平均寿命例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。但在实际问题中,我们仅仅关心灯泡的使用寿命(记X表示该批灯泡的寿命)。则X就是我们研究的总体(所有灯泡寿命的集合),每一个灯泡的寿命就是一个个体。再如:考查某一群体的身高和体重再如:考查某一群体的身高和体重,则全体人员的(身高、体重)是总体,每个人的身高和体重是个体。由此给出定义:总体总体:对所研究对象的某些指标进行试验,将试验的全部可能的观测值称为总体记为X。个体个体:每一个可能的观测值称为个体。对不同的个体,X的取值一般是不同的。例如在试验中观察若干个个体就会得到X的一种数值,但在试验或观察之前,无法确定会得到一组什么样的数值,所以X是一个随机是一个随机变量或随机向量,而变量或随机向量,而X的分布也就完全描述了我们所关心的指标,即总体的分布的分布也就完全描述了我们所关心的指标,即总体的分布。为方便起见,以后我们将X的可能取值的全体组成的集合称为总体,或直接称随机变随机变量量X为总体为总体,X的分布也就是总体的分布。的分布也就是总体的分布。例如:正态总体:是指表示总体某个数量指标的随机变量服从正态分布。【注 1】总体的分布一般情况下是未知的,这就需要利用总体中部分个体的数据资料来-1-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。对总体服从的分布进行检验这是分布拟合检验(非参数检验)问题;有时即使知道总体所服从的分布,但分布中的参数未知,这也需利用利用总体中部分个体的数据资料来对总体服从的分布中的未知参数进行统计推断(参数估计)。而这就需要从总体中抽取若干个体进行观察,从中获得研究总体的一些观察数据,然后通过这些数据的统计分析,对总体的分布进行判断或对总体的参数做出合理的估计。而一般的方法是按照一定的原则从总体中抽取若干个体进行观察,这个过程称为随机抽样随机抽样。二、样本与样本的分布二、样本与样本的分布由于每个个体的观察结果具有随机性,因此可以将第 i 次抽取的个体记为Xi,则为随机变量,为此引入以下概念。1 1、样本:样本:从一个总体X中,随机的抽出 n 个个体X1,X2,这样取得的X1,X2,Xn,通常记为(X1,X2,Xn),Xn称为总体X的一个样本。样本所含的个体数目称为样本容量.【注 2】:(1)由于每个Xi都是从总体X中随机抽出的,因此是一个随机变量,而样本(X1,X2,Xn)就是 n 维的随机向量。(2)在依次取 n 个个体X1,X2,Xn观测完毕后,得到 n 个具体的数据(x1,x2,xn),称为样本(X1,X2,Xn)的观测值样本值样本值。因此样本本身是随机向量,而一经抽取就是一组确定的数值,这就是所谓的样本两重性。2 2、简单随机样本、简单随机样本我们的目的是根据从总体中抽取的一个样本值(x1,x2,xn)对总体 X 的分布或某些特征进行各种分析推断,所以要求抽取的样本能很好地反映总体的特性,为此我们要求随机抽取的样本(X1,X2,Xn)满足:(1)具有代表性具有代表性。即样本的每个分量Xi与总体 X 有相同的分布;(2)具有独立性具有独立性。即X1,X2,间是互相独立的;满足上述两条的样本称为简单随机样本简单随机样本,今后如无特别说明,所说的样本均指简单随机样本。在实际问题中,抽取简单随机样本的方法很简单:-2-word 格式支持编辑,如有帮助欢迎下载支持。,Xn是相互独立的随机变量,也就是说,n 次观察值之文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。(1)放回抽样;(2)不放回抽样:有限总体有限总体,当样本容量远小于总体容量时,不放回近似代替放回;无限总体无限总体,总是用不放回抽样.综合上述,给出明确的数学概念:定义一定义一:一个随机变量 X 或其相应的分布函数(分布律、密度函数)称为一个总体。定义二定义二:若随机向量X1,X2,分布,则称X1,X2,Xn是相互独立的随机变量且每个分量Xi与总体 X 有相同的,Xn是来自总体的容量为 n 的简单随机样本。简单随机样本的分布有如下性质简单随机样本的分布有如下性质:设总体 X 的分布函数为F(x)(称为总体分布函数),或密度函数f(x)或分布律(称为总体概率密度),则来自总体的样本(X1,X2,Xn)的联合分布函数:F(x1,x2.xn)F(x),称为样本分布函数ii1nn联合密度函数:f(x1,x2.xn)f(x),称为连续样本密度函数ii1n联合分布律:p(x1,x2,样本密度xn)P(X1 x1,X2 x2.Xn xn)P(X xi),称为离散i1【例 1】总体X服从参数为p的(0-1)分布,PX 1 p,PX 01 p,求(X1,X2,Xn)的分布。【解】由题意X的分布律为PX x p(1 p)设(x1,x2,x1x,(x 0,1),,xn)为来自X的简单随机样本值,则(X1,X2,Xn)的联合概率分布为2【例 2】总体X服从N(,),求样本(X1,X2,Xn)的联合密度函数.【解】设(x1,x2,分布为,xn)为来自X的简单随机样本值,则(X1,X2,Xn)的联合概率f(x1,x2,xn)i1n11 x 21n1exp(i)()exp22222(x)2ii1n三、统计推断问题简述三、统计推断问题简述总体和样本是数理统计中的两个基本概念.样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数).另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言).我们称通过总体X的一个样本-3-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。X1,X2,Xn对总体X的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体推断(个体)样本样本值抽样在实际应用中,总体的分布一般是未知的,或虽然知道总体分布所属的类型,但其中包含着未知参数.统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.通过观察或试验得到的样本值,一般是杂乱无章的,例如:例例 1 1 样本的一些例子与观察值的表示方法样本的一些例子与观察值的表示方法:(1)某食品厂用自动装罐机生产净重为 345 克的午餐肉罐头,由于随机性,每个罐头的净重都有差别.现在从生产线上随机抽取10 个罐头,秤其净重,得如下结果:344336345342340338344343344343这是一个容量为 10 的样本的观察值,它是来自该生产线罐头净重这一总体的一个样本的观一个样本的观察值察值.(2)对 363 个零售商店调查周售额(单位:元)的结果如下:这是一个容量为 363 的样本的观察值,对应的总体是所有零售店的周零售额.不过这里没有给出每一个样本的具体的观察值,而是给出了样本观察值所在的区间,称为分组样本的观察分组样本的观察值值.这样一来当然会损失一些信息,但是在样本量较大时,这种经过整理的数据更能使人们对总体有一个大致的印象.通过该例可以看出,以上的两种样本值的表示方法,虽然能够反应出总体的一些大致的信息,但不够直观,判断不出总体服从什么分布。为了对总体的分布有一个大致的判断,就需要对所获得的样本值进行整理,而分组数据统计表或频率直方图是两种常用整理方法分组数据统计表或频率直方图是两种常用整理方法.四、分组数据统计表和频率直方图四、分组数据统计表和频率直方图1.1.分组数据表:分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等,称区间的长度为组距组距.分组的组数应与样本容量相适应.分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱.因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则.区间所含的样本值个数称为该区间的组频组频数.组频数与总的样本容量之比称为组频率组频率.2.2.频数直方图:频数直方图:设X1,X2,Xn是总体X的一个样本,又设总体具有概率密度f,如何用样本来推断f?注意到现在的样本是一组实数,因此,一个直观的办法是将实轴划分为若干小区间,记下诸观察值Xi落在每个小区间中的个数,根据大数定律中频率近似概率的原理,从这些个数来推断总体在每一小区间上的密度。具体做法如下:设x1,x2,xn是样本的n个观察值.(i)求出x1,x2,xn中的最小者x(1)和最大者x(n);(ii)选取常数a(略小于x(1))和b(略大于x(n)),并将区间a,b等分成m个小区间(一般取m使m1在左右):10nba,mti,tit),i 1,2,m,t 一般情况下,小区间不包括右端点.ni(iii)求出组频数ni,组频率 fi,以及n(iv)在ti,ti t)上以hi为高,t为宽作小矩形,其面积恰为fi,所有小矩形合在一起就构成了频率直方图频率直方图能够大体刻画总体的分布情况。实际上,我们就是用直方图对应的分段函数-4-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。来近似总体的密度函数f(x)这样做为什么合理?我们引进“随机变量”,对每个小区间(tj1,tj,定义1,若Xi(tj1,tjYi,i 1,2,则Yi是独立同分布于两点分布:0,若X(t,t ij1j其中p PXi(tj1,tj),由大数定律,我们有,n以概率为成立,于是当n充分大时,就可用fj来近似代替上式右边以f(x)(x(tj1,tj)为曲边的曲边梯形的面积,而且若m充分大,tj较小时,我们就可用小矩形的高度n(x)fj/tj来近似取代f(x),x(tj1,tj.课本例课本例 4 4:根据频率直方图可见,该零件的质量服从正态分布,其数学期望大约为 209,这可通过第七章的分布拟合进行检验。【注 2】样本的频率直方图可以形象地描述总体的概率密度的大致形态。五、经验分布函数五、经验分布函数对于总体X的分布函数F(未知),设有它的样本X1,X2,Xn,我们同样可以从样本出发,找到一个已知量来近似它,这就是经验分布函数Fn(x).定义定义 设总体X的一个容量为 n 的样本的样本值x1,x2,xn可按大小次序排列成k若x(k)x x(k1),则不大于x的样本值的频率为.因而函数n与事件X x在 n 次独立重复试验中的频率是相同的,我们称Fn(x)为经验分布函数。【注3】Fn(x)是一个阶梯状的函数,在x X(k),k 1,2,n处有跃度为1的间n断点,若有l个观察值相同,则Fn(x)在此观察值处的跃度为l对于固定的x,Fn(x)n即表示事件 X x 在n次试验中出现的频率,即Fn(x)1落在(,x)中Xi的个数。n用与直方图分析相同的方法可以论证Fn(x)F(x),n ,以概率为成立。经验分布函数的图形如图对于经验分布函数Fn(x),格里汶科(Glivenko)在 1933 年证明了以下的结果:对于任一实数 x,当n 时Fn(x)以概率 1 一致收敛于分布函数F(x),即因此,对于任一实数x当n充分大时,经验分布函数的任一个观察值Fn(x)与总体分布函数F(x)只有微小的差别,从而在实际中可当作F(x)来使用.课本例课本例 5 5【注 4】由图可以看出,经验分布函数是一个阶梯状的曲线,我们可以想象,当样本容量增大时,相邻两阶梯的跃度将降低,阶梯的宽度将变窄,这样阶梯状的折线几乎能变成一条曲线,则经验分布函数非常接近总体的分布函数。这就是由样本推断总体其可行性的最基由样本推断总体其可行性的最基本的理论依据本的理论依据.分布拟合检验的理论依据分布拟合检验的理论依据.六六 统计量统计量样本是总体的代表和反映,但在抽取样本后,由于样本只是呈现为一堆“杂乱无章”的数据,虽然通过频率直方图或经验分布函数能够大致了解总体的分布曲线,但无从知道总体-5-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。到底服从什么分布,因此需要对样本的观测值进行加工和提炼.课本例课本例 6 6试对该该工厂的工人周工资的水平和收入悬殊程度做个大致分析。显然,如果不进行加工,面对这大堆大小参差不齐的数据,你很难得出什么印象。但是只要对这些数据稍事加工,便能作出大致分析:如记各工人的周工资数为X1,X2,X30,则考虑它反映了该厂工人周工资的一般水平;收入的差别程度可以考虑这说明收入的差别不大,当然这需要一定的参照资料。由此可见对样本的加工是十分必要的。对样本加工,主要就是构造统计量。定义定义:设X1,X2,Xn为来自总体 X 的一个样本,T T(X1,X2Xn)为一个 n 元连续函数,若T(X1,X2Xn)中不含任何未知参数,则称T(X1,X222Xn)为一个统计量。例例:设总体X 服从正态分布 N(,),其中,未知。X1,X2,Xn是从正态总体 X 中抽取的一个样本,则n1n2Xi,Xi,均是样本的统计量,ni1i11n1而xi,2ni1xi1n2i,都不是统计量.【注 4】:统计量常用大写字母表示,若样本取得一组具体的数字,统计量用小写字母表示。七、常用的统计量七、常用的统计量样本矩样本矩-样本的数字特征样本的数字特征复习:随机变量矩的定义设 X 与 Y 是随机变量。若E(X)(k 1,2,)存在,则称它为 X 的 k k 阶原点矩阶原点矩.若EX E(X)(k 1,2,)存在,则称它为 X 的 k k 阶中心矩阶中心矩.常见的统计量常见的统计量设X1,X2,Xn为总体X的样本,则下列各量均是统计量,它们今后要经常被用到。kk1n(1)X Xi,X称为样本均值样本均值-一阶样本原点矩一阶样本原点矩。(反映总体均值的信息)ni1n21n122(X X)(X nX),S2称为样本方差样本方差。(2)S iin1i1n1i12(反映总体方差的信息)(3)S S2,S称为样本标准差样本标准差。-6-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。1nk(4)AkXi,Ak称为样本样本k阶原点矩阶原点矩)。(反映总体 k 阶矩的信息)ni11nk(5)Bk(Xi X),Bk称为样本样本k阶中心矩阶中心矩。(反映总体 k 阶中心矩的信息)ni1如果取得样本(X1,X2,Xn)的观测值(x1,x2,xn),则由上述的公式可得到相应的样本矩的观测值,分别被称为样本均值、样本方差、样本标准差、样本k阶矩、样本k阶中心矩。(6)顺序统计量将样本中的各分量按由小到大的次序排列成则称X(1),X(2),X(n)为样本的一组顺序统计量,X(i)称为样本的第i个顺序统计量.特别地特别地,称X(1)minX1,X2,称X(n)maxX1,X2,Xn称为最小顺序统计量,也称为样本极小值;,Xn称为最大顺序统计量,也称为样本极大值,称X(n)X(1)为样本的极差.Xn1,n为奇数()2*称M1为样本中位数样本中位数X(n)X(n1),n为偶数222注意,对于简单随机样本X1,X2,Xn,各个观测值X1,X2,Xn是独立并且与总体 X 同分布的随机变量,然而X(1),X(2),X(n)既不独立也不同分布实际上,最小顺序统计量X(1)的分布就是最小分布,最小顺序统计量X(n)的分布就是最大分布.【例 7】设电子元件的寿命X服从参数 0.0015的指数分布,今独立测试n 6个元件,记录它们的失效时间。求(1)没有元件在 800 小时之间失效的概率;(2)没有元件最后超过 3000 小时的概率。1e0.0015x,x 0【解】由题意,F(x)0,other设X1,X2,X6分别表示 6 个元件的寿命,则X1,X2,X6独立同分布于X,,X6800;由题意知,“没有元件在 800 小时之间失效”等价于X(1)minX1,X2,“没有元件最后超过 3000 小时”等价于X(n)maxX1,X2,(1)PX(1)minX1,X2,(2)PX(n)maxX1,X2,X6 3000。所以,X6800,X6 3000我们关心的问题是如何用以上统计量的观测值去推断总体的分布,即总体的数字特征。我们关心的问题是如何用以上统计量的观测值去推断总体的分布,即总体的数字特征。一、一、相关的理论依据相关的理论依据1、样本的样本的 k k 阶原点矩依概率收敛于总体的阶原点矩依概率收敛于总体的 k k 阶原点矩阶原点矩-7-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。1nk定理定理:如果总体 X 的 k 阶原点矩EX uk存在,则有limP|X uk|1nnk1k证明:证明:因为X1.X2.Xn相互独立且与X同分布,所以1nkpuk从而由辛钦大数定律有limP|X uk|1,即:Aknnk12、样本矩的函数以概率收敛于总体矩的函数样本矩的函数以概率收敛于总体矩的函数以上两条是:下一章矩估计法的理论依据。,即可用样本观测值的即可用样本观测值的 k k 阶原点矩去估计总阶原点矩去估计总体的体的 k k 阶原点矩(特别的,可用样本(观测值)的均值去估计总体的均值(数学期望)阶原点矩(特别的,可用样本(观测值)的均值去估计总体的均值(数学期望);参;参数估计的理论依据。数估计的理论依据。3 3、当当 n n 充分大时,可用样本观测值的经验分布函数来近似代替总体分布函数。充分大时,可用样本观测值的经验分布函数来近似代替总体分布函数。第二节第二节 常用统计分布常用统计分布统计量是我们对总体的分布规律或数字特征进行推断的基础。在使用统计量进行推断时必须要知道它的分布。在数理统计中,统计量的分布称为抽样分布,因而确定统计量的分布是数理统计的基本问题之一。下面我们介绍三类重要的分布.一一 分位数分位数设随机变量X的分布函数为F(x),对给定的实数(0 1),若实数F满足不等式PX F,则称F为随机变量X的分布的水平的上侧分位数.若实数T满足不等式P|X|T,则称T为随机变量X的分布的水平的双侧分位数.例例 1 1 设 0.05,求标准正态分布的水平0.05 的上侧分位数和双侧分位数.复习正态分布复习正态分布1 1、定义定义:X1,X2,.Xn来自总体X N(u,),则随机变量2U C1X1C2X2.CnXn服从正态分布U N(Ciu,Ci22),i1i1nnX N(,2n),X N(0,1)/n特别地若若:X1,X2,.Xn来自总体X N(0,1),则X N(0,),nX N(0,1)2 2、密度函数密度函数3 3、图形、图形4 4、性质、性质5 5、上、上分位数:双侧分位数分位数:双侧分位数(二)(二)2 2分布分布1 1、定义定义:设X1,X2,Xn相互独立同分布于标准正态分布,即Xi N(0,1),i 1,2,n,则随机变量 X X X221222n22Xi2服从自由度为n的2分布,记(n)。1nni1-8-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。这里自由度 n 是指独立变量的个数。特别的X(1)2、2 2分布的密度函数分布的密度函数yn1x其中()为函数,其定义为()xedxn402n1022n13 3、图形、图形:给出 n=1,4,10,20 时的2分布的密度函数的曲线。4 4、性质、性质0n20 x222(1 1)数学期望和方差:)数学期望和方差:E(n)n,D(n)2n图6-1 分布证明:因为Xi N(0,1),所以EXi 0,DXi1 EXi2,EXi412所以E(n)E(X X.X)2422而DXi EXi(EXi)31 2nn221222nx4ex22dx 3EXi1n2i1所以D(n)D(X X.X)(2 2)可加性)可加性221222nDXi12iEXi4(EXi2)2 2ni1f(y)若X12(n1),X22(n2),且X1与X2相互独立,则该结论可推广到 n 个独立服从卡方分布随机变量3 3、上侧分位数上侧分位数定定义义:统计量22(n),则称y2(n)2图6-2分布的上分位02P2(n)2(n)2(n)为2(n)分布的上侧分位数。(045 时,用以下近似计算公式:其中z为标准正态分布的上分位点2如:0.025(61)1(z2n1)283.9808,(其中查表得z1.96,n 61)2例例 2 2 设X1,X6是来自总体N(0,1)的样本,又设试求常数 C,使CY服从2分布.(三)(三)t t 分布(学生分布)分布(学生分布)1 1、定义、定义:设X N(0,1),Y(n),且X与Y相互独立,则称随机变量2服从自由度为n的t分布分布,记为t t(n)。n1()n12t2(1)2,t 2 2、密度函数、密度函数:f(t)n nn20f(y)n n 5n 2n 1y3 3、密度函数图形特点:、密度函数图形特点:(1)f(t)是偶函数,图形关于纵轴对称.1x2(2)lim f(x)e,因此当 n 充分大时,其图形近似为标准正态分布的密n2度函数图形。随着n的增大,t(n)的密度曲线与N(0,1)的密度曲线越来越接近,一般若2n 45,就可认为它基本与N(0,1)相差无几了。4 4、分位数分位数(1)上侧分位数定义定义:统计量t t(n),则称Pt t(n)t(n)h(t)dt 的点t(n)为t(n)分布的上侧上侧分位数分位数。(045 时可用正态近似t(n)u,t/2(n)u/2,查正态分布表可得;(2)t(n)为t(n)分布的上侧分位数,则PT t(n)1;PT t(n);P|T|t(n)2.【例 3】(四)(四)F F 分布分布1 1、定义:、定义:设X,Y相互独立,分别服从自由度为n1,n2的分布,则随机变量2服从自由度为(n1,n2)的F分布,记为Fn1,n2n1n121n nn1212y2n2n1n22 2、密度函数、密度函数(y)n1 n2n221y22n20y 0y 0f(y)3 3、图形、图形4 4、性质:如果、性质:如果F F(n1,n2).(1 1)n 10,m n 10,m 10n 10,m 41 F(n2,n1).F2(2 2)如果X t(n),则X F(1,n):5 5、上、上分位数分位数(1 1)定定 义义:满 足0yPF F(n,m)F(n,m)f(y)dy f(y)的 点F(n,m)为F(n,m)分布的上侧分数(2 2)性质:)性质:F1(n,m)1.F(m,n)1 F(m,n),F0F(n,m)证明:事实上,设F F(n,m),则且于是y分图6-7F分布的上11P1,FF(n,m)-11-word格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。由分位点的定义,显然F1(m,n)1成立。F(n,m)(3 3)查表:)查表:例如:课本 133课本例课本例 4 4第三节第三节 抽样分布抽样分布抽样分布,实际上就是随机变量函数的分布,只是强调这一分布是由统计量所产生的。统计量是我们对总体的分布规律或数字特征进行推断的基础。在使用统计量进行推断时必须要知道它的分布。当总体的分布已知时,统计量的分布是确定的,能够求出来,如前面所讲的样本矩,但是要精确求出统计量的分布,一般来说是比较困难的。在数理统计中,统计量的分布称为抽样分布,因而确定统计量的分布是数理统计的基本问题之一。本节我们重点讨论正态总体的抽样分布,即由从正态总体中抽取的样本构造成的统计本节我们重点讨论正态总体的抽样分布,即由从正态总体中抽取的样本构造成的统计量服从何种分布,这是属于小样本统计范畴。量服从何种分布,这是属于小样本统计范畴。下面我们介绍来自正态总体的四类重要的分布。一、来自单个正态总体的抽样分布一、来自单个正态总体的抽样分布2S2定理定理 1 1:设X N(u,),X1,X2,.Xn是来自总体 X 的容量为 n 的样本,X为样本均值,为样本方差,则有以下结论(1)样本均值:XN(u,2n)或U X unN(0,1)。板书证明板书证明(2)样本方差:其中s22(n1)S22(i1nXi X)22(n1)n1n12(Xi X)Xi2nX2n1i1n1i1记住结论,不用证明,注意与(记住结论,不用证明,注意与(4 4)比较)比较(3)样本均值X和样本方差s独立(4)2212(Xi)(2i1i1nnXi2)22(n)板书证明,记住结论,注意与(板书证明,记住结论,注意与(2 2)比较)比较(5)T X usn2 t(n1)板书证明板书证明例题讲解例题讲解课本例课本例 1 1、设X1,X2.,X25为来自总体X N(21,4)的样本,求:(1)样本均值的数学期望与方差;(2)P|X 21|0.24-12-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。例 2、(课后习题 1)已知离散型总体X 的分布律为XP21/341/361/3取容量为 n=54 的样本,求(1)样本均值X落在 4.1 到 4.4 之间的概率;(2)样本均值X超过 4.5 的概率解:由题意EX 4,DX 8/3,EX 4,DX(1)(2)PX 4.51PX 4.51 P例 3、例 4.二、来自两个正态总体的抽样分布二、来自两个正态总体的抽样分布定理定理:设X1,X2.,Xn与Y1,Y2.,Ym分别为来自正态总体N(1,12)和N(2,22)的简单随DX4,DX 2/9n81X 44.541(2.25)0.01222/92/91n1mn机样本,且两样本之间相互独立,设X Xi与Y Yi为样本均值,ni1mi1S12则(1)U m1n122Yi Y(Xi X),S2m 1n 1i1i12为样本方差(X Y)(12)21n22 N(0,1)mS12S22(2)F 2/2 F(n1,m1);12222(3)若进一步假设12,有其中Sw2(n1)S(m1)S2nm2证明证明例题讲解例题讲解:212(Xi1ni X)(YiY)2i12mnm2例例 5 5(课后习题(课后习题 3 3)设X1,X2,.,X16与Y1,Y2,.,Y25分别来自两个独立总体N(0,16)及N(1,9)的样本,以X和Y表示两个样本的均值,求P|X Y|1。解:因为X1,X2,.,X16独立同分布于N(0,16),所以X N(0,1)-13-word 格式支持编辑,如有帮助欢迎下载支持。文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。因为Y1,Y2,.,Y25独立同分布于N(1,9),所以Y N(1,所以X Y N(1,9)25X Y 134 N(0,1),即2534/5所以P|X Y|11 P1 X Y 11(10)(0)0.543134例 6(课后习题 10)分布从方差为 20 和 35 的正态总体中抽取容量为8 和 10 的两个样本,求第一个样本方差不小于第二个方差的两倍的概率。2222解:设1 20,2 35,n 8,m 10,S1和S2分别为两个样本方差。S12/12S12/2035S12因为2 F(n1,m1),即2 F(7,9)22S2/2S2/3520S2S12S12/20S12/2035所以PS 2S P2 2 P2 2 P23.5S2S2/3520S2/35212222因为由F0.05(7,9)3.29,F0.025(7,9)4.20,所以0.025 PS1 2S2 0.05例例 7 7 从正态总体N(,)中抽取容量为 16 的样本,试求:(1)已知22 25;(2)2未知,但已知样本方差S2 20.8的情况下,样本均值x与x 总体均值之差的绝对值小于 2 的概率。解解(1)由于统计量n N(0,1),因此在 2已知时,(2)由于 2未知,但 S2=20.8,这时统计量T x t(n1),Sn因此查 t 分布表得 t0.05(16-1)=1.753,P(t 1.753)=0.05。由此可得以上结论在后面将经常用到,必须记住。另外,对其它总体,虽然很难求到其精确的抽样分布,但我们可以利用中心极限定理等理论得到当n 较大时的近似分布,这就是统计问题中的大样本问题,在此我们不加讨论。三、一般总体抽样分布的极限分布。设总体 X 的期望为,方差为,X为样本均值,S为样本方差,则有下列结论:-14-word 格式支持编辑,如有帮助欢迎下载支持。22文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。当样本容量充分大时,UnX un近似服从N(0,1),TnX u近似服从N(0,1),Sn这属于大样本统计范畴。-15-word 格式支持编辑,如有帮助欢迎下载支持。