第五章 统计量及其分布精选文档.ppt
第五章 统计量及其分布本讲稿第一页,共二十九页数理统计学:收集带有随机误差的数据数理统计学:收集带有随机误差的数据 对数据进行处理分析对数据进行处理分析 得出信息用以研究问题得出信息用以研究问题 作出统计推断作出统计推断数理统计学:研究大量随机现象的统计规律性的一门学科数理统计学:研究大量随机现象的统计规律性的一门学科概率论是数理统计的基础,数理统计是概率论的应用概率论是数理统计的基础,数理统计是概率论的应用 第五章第五章 统计量及分布统计量及分布 5.1 5.1 数理统计的基本概念数理统计的基本概念 一一 总体和个体总体和个体总体:所研究对象的全体构成的集合。总体:所研究对象的全体构成的集合。个体:总体中的每一个元素。个体:总体中的每一个元素。例:考察某灯泡厂生产的灯泡。总体例:考察某灯泡厂生产的灯泡。总体:全部灯泡。个体全部灯泡。个体:每一个灯泡每一个灯泡例例:考察某大学学生的身体状况考察某大学学生的身体状况.总体总体:全体学生全体学生.个体:每一个学生个体:每一个学生总体和个体具有两重性:一方面指所研究的实体,总体和个体具有两重性:一方面指所研究的实体,另一方面又指实体的数量指标。另一方面又指实体的数量指标。本讲稿第二页,共二十九页 二、二、总体的分布总体的分布总体既是集合,又是随机变量。常用总体既是集合,又是随机变量。常用 X X,Y Y,ZZ表示表示例:考察某灯泡厂生产的灯泡。总体例:考察某灯泡厂生产的灯泡。总体X:X:灯泡的寿命。灯泡的寿命。例例:考察某大学学生的身体状况考察某大学学生的身体状况.总体总体X:X:学生的体温学生的体温.总体的分布:随机变量的分布总体的分布:随机变量的分布总体也可以是二维随机变量,记为(总体也可以是二维随机变量,记为(X X,Y Y)等)等例例:考察某大学学生的身体状况考察某大学学生的身体状况.总体(总体(X X,Y Y):学生的身高、体重学生的身高、体重.总体的分布要借助于总体的分布要借助于随机抽样随机抽样来研究。来研究。以后所研究的总体多是正态总体。以后所研究的总体多是正态总体。本讲稿第三页,共二十九页 简单随机样本:简单随机样本:设总体为设总体为X,如果样本如果样本(X1,X2,Xn)满足满足:(1)代表性代表性:每个每个Xi 与总体与总体X 有相有相同的分布同的分布;(2)独立性独立性:X1,X2,Xn相互独立相互独立;则称则称 样本样本(X1,X2,Xn)为为简单随机样本简单随机样本,简称为简称为简单简单样本样本。样本的二重性:样本的二重性:容量为容量为 n 的样本的样本(X1,X2,Xn)是是 n 次试验次试验的的 结果,因试验是随机的,可把其看成是结果,因试验是随机的,可把其看成是 n 个随机变量。但作了试验个随机变量。但作了试验后,记录下来的是它们在试验中所取的数据后,记录下来的是它们在试验中所取的数据(x1,x2,xn),称为,称为样样本的观察值本的观察值。因此,样本在做具体试验前可理解为一个随机向量,。因此,样本在做具体试验前可理解为一个随机向量,在具体试验后可理解为一组观测值,因此,在具体试验后可理解为一组观测值,因此,样本样本一词具有一词具有二重性二重性。注在有限总体中要得到简单样本在有限总体中要得到简单样本,必须进行重复抽样。但当总体必须进行重复抽样。但当总体中个体数相对于样本容量充分大时,不重复抽样得到的样本也中个体数相对于样本容量充分大时,不重复抽样得到的样本也可近似看作简单样本可近似看作简单样本.随机抽样:随机抽样:从总体从总体X中抽取部分个体。简称中抽取部分个体。简称抽样抽样 样本:样本:抽取的部分个体抽取的部分个体(抽样的结果)抽样的结果).记为记为(X1,X2,Xn)样本容量:样本容量:样本所含个体的个数样本所含个体的个数。三、样本三、样本本讲稿第四页,共二十九页统计推断统计推断:分析分析样本数据样本数据 对总体的分布作出结论对总体的分布作出结论 样本从总体带出的信息样本从总体带出的信息 是是分散的、零乱的分散的、零乱的 小样本和大样本:小样本和大样本:当当容量容量 n 时,研究的是大样本问题。其时,研究的是大样本问题。其 分布是极限分布。分布是极限分布。当当容量容量 n 有限时,样本是小样本。其分布是随机有限时,样本是小样本。其分布是随机向量的精确分布。在理论研究中小样本意味着固定样本容量,不能向量的精确分布。在理论研究中小样本意味着固定样本容量,不能让它趋于无穷。让它趋于无穷。统计量统计量 设总体设总体X的分布函数为的分布函数为F(x),(X1,X2,Xn)是来自总体的是来自总体的样本,样本,Xi的分布函数为的分布函数为F(xi),则,则(X1,X2,Xn)的分布函数为的分布函数为 F(x1,x2,xn)=F(x1)F(x2)F(xn)若若总体总体X的密度函数为的密度函数为f(x),(X1,X2,Xn)是来自总体的是来自总体的样本,样本,Xi的密度函数为的密度函数为f(xi),则,则(X1,X2,Xn)的密度函数为的密度函数为 f(x1,x2,xn)=f(x1)f(x2)f(xn)四、样本的分布四、样本的分布本讲稿第五页,共二十九页 一、一、统计量:统计量:设设(X1,X2,Xn)为来自总体为来自总体 X 的样本的样本,容量为容量为 n,设设h(x1,x2,xn)为一不含未知参数为一不含未知参数的的 n 元连续函数,则元连续函数,则 T=h(X1,X2,Xn)是一个随机变量,称为是一个随机变量,称为统计量统计量。5.2 5.2 统计量统计量 注注:(1)统计量统计量完全由样本决定,不依赖于任何其它未知的量完全由样本决定,不依赖于任何其它未知的量。(2)统计量用于估计时称为估计量,用于检验时称为检验统计量)统计量用于估计时称为估计量,用于检验时称为检验统计量(3)把样本观测值代入统计量,得到统计量的观测值。)把样本观测值代入统计量,得到统计量的观测值。本讲稿第六页,共二十九页 例:例:当总体当总体 XN(,2),其中参数,其中参数 ,2 未知时未知时 不是统计量,因它们都包含了未知参数。不是统计量,因它们都包含了未知参数。例:统计量例:统计量 当参数当参数 已知已知,2 未知时,结论如何?未知时,结论如何?练习:练习:178页第页第1题题本讲稿第七页,共二十九页二、常用统计量二、常用统计量 定义定义5.2 设样本设样本(X1,X2,Xn)来自总体来自总体 X,常用统计量:,常用统计量:样本均值样本均值:样本方差:样本方差:样本样本k阶原点矩:阶原点矩:样本样本k阶中心矩:阶中心矩:样本标准差样本标准差:本讲稿第八页,共二十九页 样本均值和样本方差的性质样本均值和样本方差的性质 定理定理5.1:设总体设总体 X 的均值为的均值为 EX=,方差为,方差为 DX=2,样本样本(X1,X2,Xn)来自总体来自总体 X,则,则 证:由于证:由于(X1,X2,Xn)是简单样本,所以是简单样本,所以EXi=EX=,DXi=DX=2(i=1,2,n),而且有,而且有本讲稿第九页,共二十九页注意到:注意到:本讲稿第十页,共二十九页有:有:本讲稿第十一页,共二十九页 定义定义5.3 设设随机变量随机变量X1,X2,Xn相互独立相互独立,且同服从标准正态分布,且同服从标准正态分布,则它们的平方和则它们的平方和 2=X12+X22+Xn2服从的分布称为服从的分布称为自由度为自由度为 n 的的 2分布分布。记为记为:2 2(n)。注:自由度注:自由度表示独立随机变量的个数表示独立随机变量的个数 5.3 5.3 抽样分布抽样分布 可以证明,可以证明,2 的密度函数为:的密度函数为:1 1、2 分布分布 一、一、数理统计学的三个重要分布数理统计学的三个重要分布 抽样分布抽样分布:统计量的分布统计量的分布本讲稿第十二页,共二十九页 2分布的性质分布的性质 定理定理5.3 若若 X 2(n),Y 2(m),且且X与与Y相互独立相互独立,则则 X+Y 2(n+m)定理定理5.2 若若 X 2(n),则:则:EX=n,DX=2n (2)若若 X1,X2,Xn相互独立相互独立,同服从于正态分布,同服从于正态分布N(i,i2),则,则 推论:(推论:(1)若若 Xi 2(ni),i=1,2,n,且且相互独立相互独立,则:则:例:例:179页(页(B)第)第2题题本讲稿第十三页,共二十九页 2分布的临界值(分布的临界值(分位点)分位点)例:例:本讲稿第十四页,共二十九页 t 分布分布 本讲稿第十五页,共二十九页 t 分布的临界值(分布的临界值(分位点)分位点)例:例:1.397本讲稿第十六页,共二十九页 问题:问题:若若 XN(,2),Y/2 2(n),且,且X与与Y相互独立,则相互独立,则证明:证明:且与且与Y相互独立,则相互独立,则本讲稿第十七页,共二十九页 F 分布分布 其中其中 n1 叫做叫做第一自由度第一自由度,n2 叫做叫做第二自由度第二自由度。本讲稿第十八页,共二十九页 F 分布的临界值(分布的临界值(分位点)分位点)F 分布的性质分布的性质 例:例:本讲稿第十九页,共二十九页判断:判断:如果如果 X与与Y 相互独立,且相互独立,且X/2 2(n),Y/2 2(m),则则 F=(X/Y)(m/n)证:证:如果如果 X与与Y 相互独立,且相互独立,且X/2 2(n),Y/2 2(m),例:例:179页(页(B)第)第4题题解:解:F(n,m)本讲稿第二十页,共二十九页二、正态总体下的抽样分布1 1、样本线性函数的分布、样本线性函数的分布 定理定理5.65.6:设:设Y=a1X1+a2X2+a n X n,则则 以下假设样本(以下假设样本(X1,X2,X n)来自正态总体来自正态总体 XN(,2)其中其中 a1,a2,an 为常数,且不全为为常数,且不全为0。推论推论1:XN(,2/n)其中其中 X 与总体与总体 X 有相同的有相同的均值均值,但,但方差方差小得多。小得多。样本容量样本容量 n 越大,越大,X 向向 越集中。越集中。推论推论:本讲稿第二十一页,共二十九页 推论推论2:若样本:若样本(X1,X2,X n)来自总体来自总体XN(1,12),样本样本 (Y1,Y2,Y m)来自总体来自总体YN(2,22),且,且X与与Y相互独立,则相互独立,则 定理定理:若:若X1,X2,Xn 相互独立相互独立,XiN(i,i2)(i=1,2,n)则则其中其中 Y=a1X1+a2X2+anXn,a1,a2,an 为常数,为常数,且不全为且不全为0。证明:证明:XN(1,12/n)YN(2,22/m),相互独立,相互独立 X-YN(1-2,12/n+22/m)标准化得标准化得UN(0,1)本讲稿第二十二页,共二十九页2 2、样本均值和样本方差的分布、样本均值和样本方差的分布 定理定理5.75.7:设总体:设总体X 服从正态分布服从正态分布N(,2),样本,样本(X1,X2,Xn)来自总体来自总体X,有,有 (1)X 与与 S2 相互独立相互独立;(2)(n-1)S2/2 服从自由度为服从自由度为 n 1 的的 2 分布。分布。本讲稿第二十三页,共二十九页 定理定理5.8:证明:证明:XN(,2/n)(n-1)S2/2 2(n1),相互独立相互独立本讲稿第二十四页,共二十九页 3、两正态总体的抽样、两正态总体的抽样分布分布 设样本设样本(X1,X2,X n)来自正态总体来自正态总体XN(1,12),(Y1,Y2,Y m)来自正态总体来自正态总体YN(2,22),并假定,并假定X 与与 Y 相互独立。记相互独立。记定理定理5.9:本讲稿第二十五页,共二十九页 定理定理5.10:证明:证明:(1)(n-1)S12/1 2 2(n1),(m-1)S22/2 2 2(m1),相互独立,相互独立,由由F-分布定义得分布定义得:证明:证明:XN(1,2/n)YN(2,2/m),相互独立,相互独立 X-YN(1-2,2/m+2/n)(n+m-2)S2/2 2(n+m2),相互独立,相互独立,由由t-分布定义得分布定义得:Tt(n+m-2)本讲稿第二十六页,共二十九页证明:证明:且相互独立且相互独立 例例1:若若 XN(,2),样本,样本(X1,X2,X n+1)来自总体来自总体X。Xn 与与 Sn2 为样本均值和样本方差。求统计量为样本均值和样本方差。求统计量 的分布的分布且相互独立,则且相互独立,则本讲稿第二十七页,共二十九页证明:证明:且相互独立且相互独立 例例2:若若 XN(0,0.5 2),样本,样本(X1,X2,X 10)来自总体来自总体X。求求本讲稿第二十八页,共二十九页基本要求基本要求:1 1 理解总体、个体、样本、统计量和简单样本的理解总体、个体、样本、统计量和简单样本的 概念。概念。2 2 掌握样本均值和样本方差的计算。掌握样本均值和样本方差的计算。3 3 掌握正态总体某些常用统计量的分布。掌握正态总体某些常用统计量的分布。4 4 了解三大了解三大分布的定义,熟练掌握它们的临界值分布的定义,熟练掌握它们的临界值 的查表计算。的查表计算。重点:重点:正态总体某些常用统计量的分布正态总体某些常用统计量的分布。基本要求与重点、难点本讲稿第二十九页,共二十九页