概率论与数理统计第五章.pdf
第五章 数理统计的基本概念 第五章 数理统计的基本概念 一、教材说明一、教材说明 本章内容包括:总体与样本,经验分布函数,统计量及其分布,三大抽样分布。本章的基本概念和重要结论是学习数理统计的基础。1、教学目的与教学要求、教学目的与教学要求 1)掌握数理统计的总体、样本、样本经验分布函数、统计量及常用统计量等基本概念。2)掌握三大分布的定义,并能熟练应用来求随机变量的分布。3)牢记 Fisher 定理的内容及其三大推论。4)使学生了解数理统计研究问题的方法与概率论研究问题方法的不同。2、本章重点与难点、本章重点与难点 本章重点是数理统计的基本概念、三大分布的定义、Fisher 定理及其推论。难点是 Fisher定理结合三大分布来求随机变量的分布。二、教学内容二、教学内容 本章共分总体与样本、经验分布函数、样本分布的数字特征、常用分布及分位数、常用抽样分布等 5 节来讲述本章的基本内容。0引言引言 数理统计的研究对象也是随机现象。概率论是从对随机现象的大量观察中提出随机现象的数学模型,然后再研究数学模型的性质,由此来阐述随机现象的统计规律性。而数理统计则从对随机现象的观测所得之资料出发,用概率论的理论来研究随机现象,它主要阐述搜集、整理、分析统计数据,并据以对研究对象进行统计推断的理论和方法。5.1 总体与样本 5.1 总体与样本 一、总体与个体一、总体与个体 定义 5.1定义 5.1 在一个统计问题中,把研究对象的全体称为总体总体,构成总体的每个成员称为个体个体。注:注:对于实际问题,总体中的个体是一些实在的人或物。例例 我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体总体,而每一个学生即是一个个体个体。事实上,每一个学生有许多特征:性别、年龄、身高、体重等等,而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不考虑。这样,每个学生(个体)所具有的数量指标身高就是个体,而所有身高全体看成总体。这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:总体就是一个分布,而其数量指标就是服从这个分布的随机变量总体就是一个分布,而其数量指标就是服从这个分布的随机变量。二、样本与简单随机样本二、样本与简单随机样本 定义 5.2定义 5.2 从总体X中抽出若干个个体称为样本,一般记为1(,)nXX?。n称为样本容量。而对这n个个体的一次具体的观察结果1(,)nxx?是完全确定的一组数值,但它又随着每次抽样观察而改变。1(,)nxx?称为样本观察值。从总体中抽取样本的目的是为了对总体 X 的分布进行各种分析推断,所以要求抽取的样本能很好的反映总体的特征。从总体中抽取样本的目的是为了对总体 X 的分布进行各种分析推断,所以要求抽取的样本能很好的反映总体的特征。83定义 5.3定义 5.3 如果样本1(,n)XX?满足(1)代表性:样本的每个分量iX与X有相同的分布;(2)独立性:12,nXXX?是相互独立的随机变量,则称样本1(,n)XX?为简单随机样本简单随机样本。注:i)注:i)今后所提及的样本都是指简单随机样本。ii)ii)设总体X的分布为F(x),则样本1(,)nXX?的联合分布为 1211221122121(,)(,)()()()()()()nnnnnniiF x xxP Xx XxXxP XxP XxP XxF x F xF xF x=?)n(1)当总体X是离散型时,其分布列为(),1,2,iiP Xxp i=?样本的联合分布列为 112211221(,)()()()(nnnnniiP Xx XxXxP Xx P XxP XxP Xx=?).(2)当总体 X 是连续型时,()Xp x,则样本的联合密度为 121(,)()nniip x xxp x=?。例例 5.1 设总体X服从 0-1 分布,即(1,)XBp,12(,)nXXX为该总体的样本,则样本12(,)nXXX的联合分布列为:11221(,)(nnniiP Xx XxXxP Xx=?)=xnnxnnixxppppii=)1()1(11=niixnx11其中。例例 5.2 假设灯泡的使用寿命X服从指数分布,密度函数为,0()00 xexf xx=,则样本的联合分布密度为:111()(),0,1,niiinnxxnnnxiiiif xeeexi=?n 84 三、统计量三、统计量 样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进行“加工”和“提炼”,将分散于样本中的信息集中起来,为此引入统计量的概念。定义 5.4定义 5.4 如果样本1(,n)XX?的函数中不含有未知参数,则称为 统 计 量。如 果1(,)ng XX?1(,)ng XX?1(,n)XX?的 观 察 值 是1(,)nxx?,则 称 统 计 量的观察值是。1(,)ng XX?1(,)ng xx?例 5.3例 5.3 设是出自总体的样本,其中nXXX,.,21),(2N已知,为未知参数,则211,()niiXX=,12max,nXXX?是统计量,但诸如211(),niiXX=等均不是统计量,因它含有未知参数。5.2 经验分布函数 5.2 经验分布函数 一、经验分布函数的定义一、经验分布函数的定义 定义定义 设是取自总体分布函数为 F(x)的样本的观测值,若将样本观测值从小到大进行排列为,则nxxx,21?)()2()1(,nxxx?)()2()1(nxxx?为有序样本,如下函数(1)()(1)()0,(),1,2,11,nkknxxkF xxxxknnxx+=?当当当 称为经验分布函数经验分布函数。经验分布函数的图形如下图 例例 5.4 某食品厂生产听装饮料,现从生产线上随机抽取 5 听饮料,称得其净重为:351 347 355 344 351,求此样本的经验分布函数。略。二、二、经验分布函数的性质经验分布函数的性质 01 对每一个固定的x,是事件“)(xFnXx”发生的频率,由贝努里大数律:()()()PnF xP XxF=x。850(格里纹科定理)(格里纹科定理)设是取自总体分布函数为 F(x)的样本的观测值,是经验分布函数,有 2nxxx,21?)(xFn1)0)()(suplim(=+=。注:注:n 个独立同服从 N(0,1)分布的随机变量的平方和,为自由度为 n 的2分布。2 2性分布的质:性分布的质:22222222211221212121).(),(),().nnnn+且,独立,则有 222).,2EnDn=。2242222211222110,1,(0,1),1,()3 12,1,2,().()2.iiiiiiinniiiinniiiiEXDXXNEXDXEXEXinEEXEXnDDXDXn=?:所以证证=87二、二、t分布 分布 定理 定理 设随机变量2(0,1),(),TXXNYnX YYn=独立,则 称随机变量 ().ntTt n所服从的分布为自由度是 的分布,记作其概率密度为 1221()2()(1),()2nTnxxxnnn+=+0ET=0 x=对称。当时,2n 2nDTn=;当时,1n=T的密度函数为:211(),.1TxxRx=+(Cauchy分布)当时,n 221(),.2xTxexR,。这说明当n充分大时,随机变量(30)nT近似服从标准正态分布。三、三、分布 分布 F定理 定理 设且U与V独立,则称随机变量22(),()Um Vn/U mFV n=为服从自由度为的分布,记作,其中 m 是分子自由度,n 是分母自由度。其概率密度为(,)m nF(,)FF m n122()2()()(1),0()()()220,0mm nFmnmmmxxxmnxnnnx+=。注注:(1)1221 F(,),1/(,).F n nFF n n若则 (2)若。),1(),(2nFtntt则四四、分位数 分位数 定 义 定 义 设 X 是 具 有 已 知 分 布 函 数的 随 机 变 量,对()F x(0,1),称 满 足()P XF=的常数F为随机变量 X 的分布的水平的上侧分位数,或直接称为分布(函数)的水平()F x的上侧分位数。881.标准正态分布的水平1.标准正态分布的水平的上侧分位数 的上侧分位数 设,对给定的(0,1)XN(01)=的点 2u为 N(0,1)分布的双侧分位数。2.2.2分布的水平分布的水平的上侧分位数 的上侧分位数 设,对 给 定 的22()n(01)。解 解 由于(0,1)0.3XN,于是21021()(10)0.3iX=,故 10102222111.441.44()(10)160.10.30.3iiiiXPXPP=3.3.t分布的水平分布的水平的上侧分位数 的上侧分位数 设,对给定的()Tt n(01)=的点2()tn为 t分布的双侧分位数。注注:由对称性:。1()()tntn=4.分布的水平4.分布的水平F的上侧分位数的上侧分位数 设,对 给 定 的(,)FF m n(01)=所以 212111211/(,)(,)(,)FF n nFn nFn n=又因为,所以 112211(,)(,)Fn nFn n=即 0.950.0511(12,9)0.357(9,12)2.80FF=例:5.5 常用抽样分布 5.5 常用抽样分布 本节当中我们假定总体为服从正态分布的情形。定理 定理 设1,nXX?相互独立,2(,),1,iiiXNi=n?则它们的线性函数 1()niiiia X a=是不全为零的常数也服从正态分布,且221,.niiiiiEaDa=证明:证明:略。推论:推论:21,(,)nXXN?设()是取自正态总体的样本,则有2(1)(,);(2)(0,1).XNnXNn Fisher定理及其推论定理及其推论 1、Fisher定理定理 定理定理 设12,nXXX?是来自正态总体的样本,),(2N*2XS和分别是样本均值与修正的样本方差,则(1)21(,)XNn;(2)*2222221(1)()(niiXXnSnSn=1);(3)*2XS与独立。90证明证明 略。2、三个推论、三个推论 推论推论 1 设12,nXXX?是来自正态总体的样本,),(2N*2,X S为样本均值、修正的样本方差,则*()(1)n XTtS=n。分析分析 按 t分布定义来证。证明证明*222(1)(0,1),(1)/XnSNnn,且它们独立。则由 t-分布的定义:*22(1)(1)(1)/XnSt nnn,*(1)/Xt nSn即:。推论推论 2 设12,mXXX?是来自的样本,是来自的样本,且两样本相互独立,记),(211N12,nY YY?),(222N*22*2211111111,(),(11mmnniXiiYiiiii)XX SXXYY SYYmmnn=,则有*221*222(1,1)XYSFF mnS=。特别当时,2221=*2*2(1,1)XYSFF mnS.=分析分析 根据 F分布的定义结合定理。证明证明 略。推论推论 3 在推论 2 的记号下,设,则有 22221=12*2*2()(2)(1)(1)112XYXYt mnmSnSmnmn+。证明证明 2212(,)XYNmn+。12()()(0,1)1/1/XYNmn+所以。*2*22222(1)(1)(1),(1),XYmSnSmn且它们独立。91*2*2222(1)(1)(2)XYmSnSmn+则。*2*21222()()(1)(1)/(2)(2)1/1/XYtXYmSnSmnt mnmn+由分布的定义:,12*2*2()()(2)(1)(1)112XYXYt mnmSnSmnmn+即:。作业:作业:92