随机样本和统计量.ppt
它们都以随机它们都以随机现象的统计规律为研究对象现象的统计规律为研究对象.数理统计与概率论是两个有密切联系的学科数理统计与概率论是两个有密切联系的学科,但在研究问题的方法上有很大区别:但在研究问题的方法上有很大区别:概率论概率论 已知随机变量服从某分布已知随机变量服从某分布,寻求分布的性质、寻求分布的性质、数字特征、及其应用数字特征、及其应用;数理统计数理统计 通过对实验数据的统计分析通过对实验数据的统计分析,寻找所服从的分寻找所服从的分布和数字特征布和数字特征,从而推断整体的规律性从而推断整体的规律性.数理统计的核心问题数理统计的核心问题由样本推断总体由样本推断总体 第六章第六章 样本及抽样分布样本及抽样分布1 也就是说也就是说,我们获得的只是局部我们获得的只是局部观察资料观察资料.因而从理论上因而从理论上讲,只要对随机现象进行足够多次观察,讲,只要对随机现象进行足够多次观察,但客观上但客观上只允许我们对随机现只允许我们对随机现象进行次数不多的观察试验,象进行次数不多的观察试验,被研究的随机现象的被研究的随机现象的规律性一定能清楚地呈现出来规律性一定能清楚地呈现出来.数理统计就是数理统计就是在概率论的基础上在概率论的基础上研究怎样以研究怎样以有效的有效的方式方式收集、整理和分析可收集、整理和分析可获的有限的获的有限的,带有随机性的数带有随机性的数据据资料资料,由于大量随机现象必然呈现出它的规律性由于大量随机现象必然呈现出它的规律性.对所考察问题的统计性规律对所考察问题的统计性规律尽可能地尽可能地作出作出精确精确而可靠的而可靠的推断或预测,推断或预测,为采取一为采取一定的决策和行动提供依据和建议定的决策和行动提供依据和建议.2这部分内容的重点在于介绍数理统计的一些重要概念和典这部分内容的重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识型的统计方法,它们是实际中最常用的知识.学习统计无须把过多时间化在计算上学习统计无须把过多时间化在计算上,应更有效地把时间应更有效地把时间用在基本概念、方法原理的正确理解上用在基本概念、方法原理的正确理解上.在数理统计中,不是对所研究的对象全体在数理统计中,不是对所研究的对象全体(称称为为总体总体)进行观察,而是抽取其中的部分进行观察,而是抽取其中的部分(称为称为样本样本)进行观察获得数据(进行观察获得数据(抽样抽样),并通过这些数据对),并通过这些数据对总体进行推断总体进行推断.数理统计方法具有数理统计方法具有“部分推断整体部分推断整体”的特征的特征.3总体中的每个元素总体中的每个元素例如例如:某工厂生产的灯泡寿命是一个总体某工厂生产的灯泡寿命是一个总体,每每个灯泡的寿命是一个个体个灯泡的寿命是一个个体;某学校男生的身高的全体是一个总体某学校男生的身高的全体是一个总体,每每个男生的身高是一个个体个男生的身高是一个个体一、总体、个体、随机样本一、总体、个体、随机样本总体总体 研究对象全体元素组成的集合研究对象全体元素组成的集合 所研究的对象的所研究的对象的某个某个(或某些或某些)数量指标数量指标 的全体的全体,它是一个随机变量它是一个随机变量.记为记为X X.X X 的分布函数和数字特征称为总体的分布的分布函数和数字特征称为总体的分布函数和数字特征函数和数字特征.个体个体:6.1 6.1 随机样本和统计量随机样本和统计量4从总体中抽取一部分个体来进行观察从总体中抽取一部分个体来进行观察或试验或试验,称为称为抽样抽样;被抽出的部分个体称为被抽出的部分个体称为总体的一个总体的一个样本样本抽取样本的目的在于对总体的统计规抽取样本的目的在于对总体的统计规律进行推断或估计律进行推断或估计,故要求所抽取的样本故要求所抽取的样本能很好的反映总体的特性能很好的反映总体的特性.最常用的是简最常用的是简单随机样本。单随机样本。总体容量有限的称为总体容量有限的称为有限总体有限总体,称总体中所含个体的数目为称总体中所含个体的数目为总体容量总体容量,总体容量无限的称为总体容量无限的称为无限总体无限总体.5定义定义:设设X1,X2,.,Xn为来自总体为来自总体X的样的样本本,如果如果X1,X2,.,Xn相互独立相互独立,且每一且每一个都是与总体个都是与总体X有相同分布的随机变量有相同分布的随机变量,则称则称X1,X2,.,Xn为总体为总体X的容量为的容量为n的的简单随机样本简单随机样本,简称为简称为随机样本随机样本或或样本样本,其观察值其观察值x1,x2,.,xn称为称为样本值样本值.6 它要求抽取的样本它要求抽取的样本X1,X2,Xn 满满足下面两点足下面两点:2.代表性:代表性:Xi(i=1,2,n)与所考察的总与所考察的总体体X 同分布同分布.1.独立性:独立性:X1,X2,Xn 是相互独立是相互独立的的随机变量随机变量;今后今后,说到说到“X1,Xn 是取自某总体的样是取自某总体的样本本”时时,若不特别说明若不特别说明,就指简单随机样本就指简单随机样本.简单随机样本是应用中最常见的情形简单随机样本是应用中最常见的情形,7由定义知由定义知,若若X1,X2,.,Xn为为X的一个的一个样本样本,X的分布函数为的分布函数为F(x),则则X1,X2,.,Xn的联合分布函数为的联合分布函数为:若若X的概率密度为的概率密度为f(x),则则X1,X2,.,Xn的联合概率密度为的联合概率密度为:8求样本求样本(X1,X2,X3)的的 概率分布概率分布.例例1 设总体设总体 X B(1,p),),即即 P(X=x)=p x(1-(1-p)1-1-x,X=0,1.设设X1,X2,X3为为X 的一个样本的一个样本,解解x i=0,1;i=1,2,3.(X1,X2,X3)的分布列的分布列 P(X1=x1,X2=x2,X3=x3)又又 x1+x2+x3=0,1,2,3,P(X1=x1,X2=x2,X3=x3)k=0,1,2,3.9例例2解解1011二、频率直方图二、频率直方图 这是一种根据样本观察值来近似地求总这是一种根据样本观察值来近似地求总体的概率密度的图解法体的概率密度的图解法.设总体设总体X是一个连续型随机变量,样本是一个连续型随机变量,样本观察值观察值x1,x2,xn,找个区间包括这些观找个区间包括这些观察值,再把区间分成若干部分察值,再把区间分成若干部分.12三、经验分布函数三、经验分布函数1314例如例如,估计一个物体的重量估计一个物体的重量,重复重复n次称重次称重,其结果依次记为其结果依次记为X1,X2,.,Xn通常用样本的算术平均值通常用样本的算术平均值,或其或其它某个由样本计算出来的且看上去合理的它某个由样本计算出来的且看上去合理的量来估计重量量来估计重量在获得了样本之后在获得了样本之后,下一步对样本进行统计分析下一步对样本进行统计分析,即对样本进行加工、整理即对样本进行加工、整理,从中提取有用信息从中提取有用信息.一个有一个有效的方法就是构造一些效的方法就是构造一些样本的函数样本的函数,通过通过样本函数样本函数把样把样本中所含的本中所含的(某一方面某一方面)的信息集中起来的信息集中起来.四、统计量四、统计量15定义定义:设设X1,X2,.,Xn是总体是总体X的一个样本的一个样本,随机随机变量变量g(X1,X2,.,Xn)是是X1,X2,.,Xn的一个的一个连连续函数续函数,且且g中中不包含任何未知参数不包含任何未知参数,则称则称g(X1,X2,.,Xn)为一个为一个统计量统计量统计量是样本的函数统计量是样本的函数,它是一个随机它是一个随机变量变量,统计量的分布称为统计量的分布称为抽样分布抽样分布设设(x1,x2,.,xn)是样本是样本(X1,X2,.,Xn)的样本值的样本值,则称则称g(x1,x2,.,xn)是是g(X1,X2,.,Xn)的一个观察值的一个观察值.这种不含任何未知参数、完全由样本决定的这种不含任何未知参数、完全由样本决定的量称为统计量量称为统计量16例例 是未知参数,若 ,已知,则为统计量是一样本,是统计量,其中则但不是统计量.17C例例3设总体设总体XB(2,p),其中其中p为未知参数为未知参数,(X1,X2,X3)是取自总体是取自总体X的样本的样本,则则_不是统计量不是统计量(A)X1+X2(B)maxX1,X2,X3(C)X3+2p(D)(X2 X1)218设设X1,X2,.,Xn是总体是总体X的一个样本的一个样本,样本平均值样本平均值:样本方差样本方差:样本标准差样本标准差:常用统计量常用统计量:19样本样本k阶阶(原点原点)矩矩:(k=1,2,)样本样本k阶中心矩阶中心矩:(k=1,2,)例如20样本平均值样本平均值:样本方差样本方差:样本样本k阶中心矩阶中心矩:样本样本k阶阶(原点原点)矩矩:(k=1,2,)它们的观察值分别为它们的观察值分别为:21由样本平均值和样本方差的表达式可得由样本平均值和样本方差的表达式可得:22注注 样本方差样本方差 与样本二阶中心矩与样本二阶中心矩 的不同的不同故推导推导关系式关系式1)23例例4 4 从一批机器零件毛坯中随机地抽取10件,测得其重量为(单位:公斤):210,243,185,240,215,228,196,235,200,199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解解令24则则25例例5 5 在总体 中,随机抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.解解故261.标准正态分布标准正态分布2.2分布分布3.t分布分布4.F分布分布6.26.2 数理统计中常用的分布数理统计中常用的分布 正态总体是最常见的总体正态总体是最常见的总体,本节介绍本节介绍的几个抽样分布均对正态总体而言的几个抽样分布均对正态总体而言.27设设XN(0,1),对任给的对任给的,0 z0.05=1 0.05=0.95PX1.64=0.9495PX1.65=0.9505z0.05(1.64+1.65)/2=1.645公式公式:(z)=1 常用数字29设设Xi N(0,1)(i=1,2,.,n),且它们且它们相互独立相互独立,则称随机变量则称随机变量2 2分布分布定义定义:服从自由度为服从自由度为n的的 2分布分布,记为记为 2 2(n)2分布分布最常用的是拟合优度检验最常用的是拟合优度检验30一般其中,在x 0时收敛,称为函数,具有性质的密度函数为自由度为 n 的3110设设Y1 2(m),Y2 2(n),且且Y1,Y2相互独立,相互独立,2 分布的基本性质分布的基本性质则则 2分布的可加性分布的可加性Y1+Y2=?20若若Y 2(n),则则 =n,=2n.EY DY =1=330设设X1,Xn相互独立相互独立,且都服从正态分布且都服从正态分布N(,2),),40若若Y 2分布分布,近似服从近似服从N(0,1).应用中心极限定理可得应用中心极限定理可得则则则当则当n 充分大时充分大时,32o 2(n)x f(x)设设 2 2(n),其密度函数为其密度函数为f(x),对于对于给定的正数给定的正数 (0 1),称满足条件称满足条件的点的点 2(n)为为 2(n)分布的上分布的上 分位点分位点 2分布的上分布的上 分位点分位点:当当n充分大时充分大时,33例例2(练习九练习九.五五)设设XN(,2),(X1,X2,.,X16)是取自总体是取自总体X的样本的样本,求概率求概率:解解:X1,X2,.,X16相互独相互独立立且且34 0.95 0.01=0.9435设设XN(0,1),Y 2(n),且且X与与Y相互相互独立独立,则称随机变量则称随机变量3 t分布分布定义定义:服从自由度为服从自由度为n的的t分布分布,记为记为Tt(n)T 的密度函数为:的密度函数为:37o tf(t)t分布的上分布的上 分位点分位点:设设Tt(n),其密度函数为其密度函数为f(t),对于给定对于给定的正数的正数 (0 45时时,t(n)z 39且且XN(2 ,1),),Y i N(0 ,4),),i=1,2,3,4,设设 X,Y1,Y2,Y3,Y4相互独立相互独立,例例4令令解解 X-2N(0,1),i=1,2,3,4.t(4),即即 Z 服从自由度为服从自由度为4的的t 分布分布.求求Z 的分布的分布.由由t分布的定义分布的定义Y i/2N(0 ,1),),40题题 设随机变量 X 与Y 相互独立,X N(0,16),Y N(0,9),X1,X2,X9 与Y1,Y2,Y16 分别是取自 X 与 Y 的简单随机样本,求统计量所服从的分布.解解41从而42t分布用于在小样本场合下的正态分布分布用于在小样本场合下的正态分布(大样本大样本场合下可以用正态分布来近似场合下可以用正态分布来近似),有时候在信息有时候在信息不足的情况下不足的情况下,只能用只能用t分布分布,比如在整体方差比如在整体方差不知的情况下不知的情况下,对总体均值的估计和检验通常对总体均值的估计和检验通常要用要用t统计量统计量43记作记作F F(m,n).由由F 分布的定义可见,若分布的定义可见,若F F(m,n),定义定义:设随机变量设随机变量X 与与Y 独立,独立,所服从的分布为所服从的分布为第一自由度为第一自由度为m,第二自由度为第二自由度为n的的F 分分布,布,4、F 分布分布则则F 的概率密度为的概率密度为则称统计量则称统计量其图形其图形参见参见172F分布多用于比例的估计和检验分布多用于比例的估计和检验44o xf(x)F分布的上分布的上 分位点分位点:设设FF(m,n),其密度函数为其密度函数为f(x),对于给对于给定的正数定的正数 (0 F1 1 )=0.025,P(F F3 3 )=0.95.1/F F(15(15,24),查附表查附表7知知统计三大分布的定义和基本性质在后面的学习中常用到统计三大分布的定义和基本性质在后面的学习中常用到,要牢记!要牢记!471.单个正态总体的抽样分布单个正态总体的抽样分布2.两个正态总体的抽样分布两个正态总体的抽样分布6.3 抽样分布定理抽样分布定理48设设X1,X2,.,Xn是来自正态总体是来自正态总体N(,2)的样本的样本,则则1.单个正态总体的抽样分布单个正态总体的抽样分布定理定理:(1)(2)与与S2相互独立相互独立(3)(4)49(1)为为n个相互独立的正态个相互独立的正态服从正态分布服从正态分布=随机变量的线性组合随机变量的线性组合50(4)且它们相互独立且它们相互独立由由t分布的定义分布的定义,即即 2(n 1)51例例1(练习九练习九.二二.(1)设设(X1,X2,Xn)是取是取自总体自总体X的样本的样本,是样本均值是样本均值,如果总体如果总体XN(,4),则样本容量则样本容量n应取多大应取多大,才能使才能使解解:520.95n1536.64n15375354设总体设总体XN(1,12),总体总体YN(2,22).X1,X2,.,是总体是总体X的样的样本本,Y1,Y2,.,是总体是总体Y的样本的样本,且这两且这两个样本相互独立个样本相互独立.则则2.两个正态总体的抽样分布两个正态总体的抽样分布定理定理:(1)(2)55其中其中称为混合样本方差称为混合样本方差进一步进一步,若若 12=22=2,有有56 2(n1 1),2(n2 1)且它们相互独立且它们相互独立 2(n1+n2 2)57由由t分布的定义分布的定义,即即t(n1+n2 2)t(n1+n2 2)58小结小结1.理解总体、个体、样本和统计量的概理解总体、个体、样本和统计量的概念念,掌握样本均值和样本方差的计算及掌握样本均值和样本方差的计算及基本性质基本性质2.掌握掌握 2分布、分布、t分布、分布、F分布分布的定义的定义,会会查表计算查表计算3.理解正态总体的某些统计量的分布理解正态总体的某些统计量的分布59