《样本分布.ppt》由会员分享,可在线阅读,更多相关《样本分布.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 样本分布样本分布u总体与样本总体与样本u样本分布函数样本分布函数u样本分布的数字特征样本分布的数字特征u几个常用统计量的分布几个常用统计量的分布引引 言言 随机变量及其所伴随的概率分布全面描述了随机随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。现象的统计性规律。概率论的许多问题中,随机变量的概率分布通常概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。是在这已知是基础上得出来的。但实际中,情况往往并非如此,一个随机现象所但实际中,情况往往并非如此,一个随机
2、现象所服从的分布可能是完全不知道的,或者知道其分布概服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。型,但是其中的某些参数是未知的。例如:例如:某公路上行驶车辆的速度服从什么某公路上行驶车辆的速度服从什么分布是未知的分布是未知的;电视机的使用寿命服从什么电视机的使用寿命服从什么分布是未知的分布是未知的;产品是否合格服从两点分布,但参数产品是否合格服从两点分布,但参数合格率合格率p是是未知的未知的;数理统计的任务则是数理统计的任务则是以概率论为基础,根据试验以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合所得到的数据,对研究对象的客观统计规律性
3、做出合理的推断。理的推断。从第七章开始,我们学习数理统计的基础知从第七章开始,我们学习数理统计的基础知识。数理统计的任务是识。数理统计的任务是以概率论为基础,根据试以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性验所得到的数据,对研究对象的客观统计规律性作出合理的推断作出合理的推断.数理统计所包含的内容十分丰富,数理统计所包含的内容十分丰富,本书介绍其中的本书介绍其中的样本分布、参数估计、假设检验样本分布、参数估计、假设检验等内容等内容.第七章主要介绍数理统计的一些基本术语、第七章主要介绍数理统计的一些基本术语、基本概念、重要的统计量及其分布,它们是后面基本概念、重要的统计量及
4、其分布,它们是后面各章的基础。各章的基础。学习的基本内容学习的基本内容总体与样本总体与样本总体与样本总体与样本 在在数数理理统统计计中中,把把研研究究对对象象的的全全体体称称为为总总体体(population)或或母母体体,而而把把组组成成总总体体的的每每个个单单元元称称为为个个体体。总总体体与与个个体体的的关关系系,即即集集合合中中集集合合与与元元素素的的关关系系;总总体体与与个个体体是是相相对对而而言言的的,同同一一个个事事物物,在在某某些些情情况况下下被被看看作作总总体体,而而在在另另一一种种情情况况下下可可能能被被看看作作个个体体.数量指标数量指标 属性性质的属性性质的 数量化数量化
5、抽样抽样 要要了了解解总总体体的的分分布布规规律律,在在统统计计分分析析工工作作中中,往往往往是是从从总总体体中中抽抽取取一一部部分分个个体体进进行行观观测测,这这个个过过程程称称为为抽抽样样。在在抽抽取取过过程程中中,每每抽抽取取一一个个个个体体,就就是是对对总总体体X进进行行一一次次随随机机试试验验,每每次次抽抽取取的的n个个个个体体 ,称称为为总总体体X的的一一个个容容量量为为n的的样样本本(sample)或或子子样样;其其中中样样本本中中所所包包含含的的个个体体数数量量称称为为样样 本本 容容 量量。随机抽样方法的基本要求随机抽样方法的基本要求 独立性独立性即每次抽样的结果既不影响其余
6、各次抽样的即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。结果,也不受其它各次抽样结果的影响。满足上述两点要求的样本称为满足上述两点要求的样本称为简单随机样本简单随机样本.获得简获得简单随机样本的抽样方法叫单随机样本的抽样方法叫简单随机抽样简单随机抽样.从简单随机样本的含义可知,从简单随机样本的含义可知,样本样本 是来自总体是来自总体 、与总体、与总体 具有相同分布的随机变量具有相同分布的随机变量.代表性代表性-每次抽样都在同一条件下每次抽样都在同一条件下,即每个个体即每个个体 都都 与总体与总体 服从同一概率分布服从同一概率分布简单随机抽样简单随机抽样 例如例如:
7、要通过随机抽样了解一批产品的次品率,:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。这是一个简单随机抽样。但实际抽样中,往往是不再放回产品,则这不是一但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量个简单随机抽样。但当总量N很大时,很大时,可近似看成可近似看成是简单是简单随机抽样。随机抽样。实际问题中常用实际问题中常用抽签法抽签法获得简单随机样本获得简单随机样本l当一次抽样完成后当一次抽样完成后,得到得到n个具体的数据个具体的数据 称为样本称为样本 的一个的一个样本观测值
8、样本观测值.样本的所有可能取值的全体称为样本的所有可能取值的全体称为样本空间样本空间.l样本也可以是多维的样本也可以是多维的.例如某个人群的身高和体例如某个人群的身高和体重重,所考虑的总体就是二维的所考虑的总体就是二维的,样本的观测值就是样本的观测值就是总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观察值,去推断样本观察值,去推断总体的情况总体的情况总体分布。样本是联系两者的桥梁。总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本总体分布决定了样本取值
9、的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去取到样本观察值的规律,因而可以用样本观察值去推断总体推断总体来自总体X的随机样本X X1 1,X Xn n可记为显然,样本联合分布函数或密度函数为或或统计量统计量 则则 例如例如:设设 是从正态总体是从正态总体 中抽取中抽取的一个样本,其中的一个样本,其中 为已知参数为已知参数,为未知参数,为未知参数,是统计量是统计量 不是统计量不是统计量 定义定义:称样本称样本(X1,Xn )的函数的函数f(X1,Xn)是是总体总体X的一个的一个统计量统计量,如果如果f(X1,Xn)不含任何未不含任何未知知 参数参数几个常用的统计量几个常用的
10、统计量 样本均值样本均值(sample mean)样本方差样本方差(sample variance)设设 是总体是总体 的一个样本,的一个样本,样本均方差或标准差样本均方差或标准差 它们的观测值用相应的它们的观测值用相应的小写字母小写字母表示表示.反映总反映总体体X取值的取值的平均平均,或反映,或反映总体总体X取值的离散程度取值的离散程度。几个常用的统计量几个常用的统计量 设设 是总体是总体 的一个样本,的一个样本,样本的样本的K阶(原点)矩阶(原点)矩几个常用的统计量几个常用的统计量 设设 是总体是总体 的一个样本,的一个样本,样本的样本的K阶中心矩阶中心矩性质性质l样本的所有偏差之和为零样
11、本的所有偏差之和为零,l 注注:由此立即可以得到由此立即可以得到样本方差的另一个计算公式样本方差的另一个计算公式 统计量统计量 是样本是样本 的的不含任何未知数不含任何未知数的函数,它是一个随机变量的函数,它是一个随机变量统计量的分布称为统计量的分布称为抽样分布抽样分布。由于正态总体是最常见的总体,因此这里主要讨论由于正态总体是最常见的总体,因此这里主要讨论正态总体下的抽样分布正态总体下的抽样分布.由于这些抽样分布的论证要用到较多的数学知识,由于这些抽样分布的论证要用到较多的数学知识,故在本节中,我们主要给出有关结论,以供应用故在本节中,我们主要给出有关结论,以供应用.正态总体样本均值的分布正
12、态总体样本均值的分布 定理定理1 1设总体设总体 ,是是 的一的一个样本个样本,则则样本均值服从正态分布样本均值服从正态分布U U分布分布 概率分布的分位数概率分布的分位数(分位点分位点)使使PXx =,定义定义对总体对总体X和给定的和给定的 (0 1),若存在,若存在x,则称则称x 为为X分布的分布的上侧上侧 分位数分位数或或上侧临界值上侧临界值.如图如图.x oyxPXx =若存在数若存在数 1、2,使,使PX 1=PX 2 则称则称 1、2为为X分布的分布的双双侧侧 分位数分位数或或双侧临界值双侧临界值.oyx 2 1双侧双侧 分位数或双侧临界值分位数或双侧临界值的特例的特例当当X的分布
13、的分布关于关于y y轴对称轴对称时,时,则称则称 为为X分布的分布的双侧双侧 分位数分位数或或双侧临界值双侧临界值.如图如图.若存在若存在 使使yxOU U分布的上侧分位数分布的上侧分位数 对标准正态分布变量对标准正态分布变量UN(0,1)和给定和给定 的,上侧的,上侧 分位数是由:分位数是由:PUu =即即PUu =1-(u)=1-确定的点确定的点u.如图如图.(x)xOu 例如,例如,=0.05,而而PU1.645=0.05所以,所以,u0.05=1.645.U U分布的双侧分位数分布的双侧分位数 的点的点u/2为标准正态分布的为标准正态分布的双侧双侧 分位数分位数或或双侧临界值双侧临界值
14、.如图如图.u/2可由可由PUu/2=/2 对标准正态分布变量对标准正态分布变量UN(0,1)和给定和给定 的,的,称满足条件称满足条件P|U|u/2=即即 (u /2)=1-/2反查标准正态分布表得到,反查标准正态分布表得到,PU1.96=0.05/2例如,求例如,求u0.05/2,得得u0.05/2=1.96(x)Ou/2 /2-u/2 /2x分布分布 定义定义 设总体设总体 ,是是 的的一个样本一个样本,则称统计量则称统计量 服从自由度服从自由度为为n n的的 分布,记作分布,记作自由度自由度是指独立随机变量的个数,是指独立随机变量的个数,分布的密度函数为分布的密度函数为 0 1 3 5
15、 7 9 11 13 15 17 x0.50.40.30.20.1n=1n=4n=10图图5-4f(y)其图形随自由度的其图形随自由度的不同而有所改变不同而有所改变.2分布表分布表(附表五附表五(P264).分布密度函数的图形分布密度函数的图形满足满足 的数的数 为为 2分布的分布的上上 分位数分位数或或上侧临界值上侧临界值,其几何意义见图其几何意义见图5-5所示所示.其中其中f(y)是是 2-分布的概率密度分布的概率密度.f(y)xO 图图5-5显然,在自由度显然,在自由度n取定以后,取定以后,的值只与的值只与 有关有关.例如,当例如,当n=21,=0.05时,由附表可查得,时,由附表可查得
16、,32.7即即 2 2分布的上分布的上 分位数分位数 2 2分布的双侧分布的双侧 分位数分位数 把满足把满足的数的数称为称为 2分布的分布的双侧双侧 分位数分位数或或双侧临界值双侧临界值.见图见图.f(x)xO图6-4显然,显然,为为 2分布的上分布的上 分位数分位数.为为 2分布的上分布的上 分位数分位数.如当如当n=8,=0.05时,时,2.1817.5 2 2分布的数学期望与方差分布的数学期望与方差设设 2 2(n),则,则E(2)=n,D(2)=2n.2 2分布的可加性分布的可加性设设且且相互独立相互独立,则则定理定理2设设(X1,X2,Xn)为取自正态总体为取自正态总体XN(,2)的
17、样本,则的样本,则证明证明 由已知,有由已知,有XiN(,2)且且X1,X2,Xn相互独立,相互独立,则则且各且各相互独立,相互独立,定理定理3 3 设设(X1,X2,Xn)为来自正态总体为来自正态总体 XN(,2)的样本,则的样本,则(1)样本均值样本均值 与样本方差与样本方差S 2相互独立;相互独立;(2)(*)(*)式的自由度为什么是式的自由度为什么是n-1?从表面上看,从表面上看,是是n个正态随机变量个正态随机变量的平方和,的平方和,但实际上它们不是独立的,但实际上它们不是独立的,它们之间有一种线性约束关系:它们之间有一种线性约束关系:=0这表明,当这个这表明,当这个n个正态随机变量中
18、有个正态随机变量中有n-1个取值给定时,剩下个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这的一个的取值就跟着唯一确定了,故在这n项平方和中只有项平方和中只有n-1项是独立的项是独立的.所以所以(*)式的自由度是式的自由度是n-1.定理定理3 3 设设(X1,X2,Xn)为来自正态总体为来自正态总体 XN(,2)的样本,则的样本,则(1)样本均值样本均值 与样本方差与样本方差S 2相互独立;相互独立;(2)(*)与以下补充性质的结论比较:与以下补充性质的结论比较:性质性质 设设(X1,X2,Xn)为取自正态总体为取自正态总体XN(,2)的样本,则的样本,则t t分布分布定义定义 设随机变
19、量设随机变量XN(0,1),Y 2(n),且且X与与Y相互独立,则称统计量相互独立,则称统计量 服从自由度为服从自由度为n的的t分布分布分布,分布,记作记作t分布的概率密度函数为分布的概率密度函数为t t(n).其其形状类似标准正态分布形状类似标准正态分布的概率密度的图形的概率密度的图形.当当n较大时,较大时,t分布近似于标准正态分布分布近似于标准正态分布.定理定理4设设(X1,X2,Xn)为来自正态总体为来自正态总体 XN(,2)的样本,则统计量的样本,则统计量证证由于由于与与S 2相互独立,且相互独立,且 t t 分布的上分布的上 分位数分位数对于给定的对于给定的 (0 45时,如无详细表格可查,可以用标准正时,如无详细表格可查,可以用标准正态分布代替态分布代替t分布查分布查t(n)的值的值.即即t(n)u ,n45.一般的一般的t分布临界值表中,详列至分布临界值表中,详列至n=30,当,当n30就用标准正态分布就用标准正态分布N(0,1)来近似来近似.例例3 设总体设总体XN(,42),X1,X2,X10是是n=10简单随机样本,简单随机样本,S2为样本方差,已知为样本方差,已知PS2=0.1,求求 .解解 因为因为n=10,n-1=9,2=42,所以所以 2(9).又又PS2 =0.1,所以所以查查表表14.7.故故 14.7x26.105
限制150内