第六章 统计量及其抽样分布精选文档.ppt
第六章 统计量及其抽样分布本讲稿第一页,共四十三页第 6 章 统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布6.6 两个样本平均值之差的分布两个样本平均值之差的分布6.7 关于样本方差的分布关于样本方差的分布 本讲稿第二页,共四十三页学习目标1.了解统计量及其分布的几个概念了解统计量及其分布的几个概念2.了解由正态分布导出的几个重要分布了解由正态分布导出的几个重要分布 3.理解样本均值的分布与中心极限定理理解样本均值的分布与中心极限定理4.掌握单样本比例和样本方差的抽样分布掌握单样本比例和样本方差的抽样分布本讲稿第三页,共四十三页统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量例如:样本均值例如:样本均值例如:样本均值、比例、方差、比例、方差、比例、方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等本讲稿第四页,共四十三页6.1 统计量6.1.1 统计量的概念统计量的概念6.1.2 常用统计量常用统计量6.1.3 次序统计量次序统计量 6.1.4 充分统计量充分统计量 本讲稿第五页,共四十三页统计量统计量(statistic)1.设设X1,X2,Xn是是从从总总体体X中中抽抽取取的的容容量量为为n的的一一个个样样本本,如如果果由由此此样样本本构构造造一一个个函函数数T(X1,X2,Xn),不不依依赖赖于于任任何何未未知知参参数数,则则称函数称函数T(X1,X2,Xn)是一个统计量是一个统计量 -样本均值、样本比例、样本方差等都是统计量样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数统计量是样本的一个函数3.统计量是统计推断的基础统计量是统计推断的基础本讲稿第六页,共四十三页次序统计量次序统计量1.一一组样本观测值组样本观测值X1,X2,Xn由小到大的排序由小到大的排序 X(1)X(2)X(i)X(n)后,称后,称X(1),X(2),X(n)为次序统计量为次序统计量 2.中位数、分位数、四分位数等都是次序统计中位数、分位数、四分位数等都是次序统计量量本讲稿第七页,共四十三页6.2 关于分布的几个概念6.2.1 抽样分布抽样分布6.2.2 渐进分布渐进分布6.2.3 随机模拟获得的近似分布随机模拟获得的近似分布 本讲稿第八页,共四十三页1.总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 2.分布通常是未知的分布通常是未知的3.可以假定它服从某种分布可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体本讲稿第九页,共四十三页1.一个样本中各观察值的分布一个样本中各观察值的分布 2.也称经验分布也称经验分布 3.当样本容量当样本容量n逐渐增大时,样本分布逐渐逐渐增大时,样本分布逐渐接近总体的分布接近总体的分布 样本分布样本分布(sample distribution)样样本本本讲稿第十页,共四十三页抽样分布(sampling distribution)总体总体计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量例如:样本均值例如:样本均值例如:样本均值例如:样本均值例如:样本均值例如:样本均值、比例、方差、比例、方差、比例、方差、比例、方差、比例、方差、比例、方差样样本本本讲稿第十一页,共四十三页1.样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布在重复选取容量为在重复选取容量为n的样本时,由该统计量的所有可能的样本时,由该统计量的所有可能取值形成的相对频数分布取值形成的相对频数分布 2.随机变量是随机变量是 样本统计量样本统计量样本均值样本均值,样本比例,样本方差等样本比例,样本方差等3.结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据论基础,也是抽样推断科学性的重要依据 抽样分布抽样分布(sampling distribution)本讲稿第十二页,共四十三页6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.3.1 2分布分布6.3.2 t 分布分布6.3.3 F 分布分布本讲稿第十三页,共四十三页 2 分布分布本讲稿第十四页,共四十三页1.由由阿阿贝贝(Abbe)于于1863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(Hermert)和和卡卡皮皮尔尔逊逊(KPearson)分分别别于于1875年年和和1900年推导出来年推导出来2.设设 ,则,则3.令令 ,则,则 Y 服从自由度为服从自由度为1的的 2分布,即分布,即4.5.当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则的样本,则 2分布分布(2 distribution)本讲稿第十五页,共四十三页1.分布的变量值始终为正分布的变量值始终为正 2.分分布布的的形形状状取取决决于于其其自自由由度度n的的大大小小,通通常常为为不不对对称称的正偏分布,但随着自由度的增大逐渐趋于对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:期望为:E(2)=n,方差为:,方差为:D(2)=2n(n为自由度为自由度)4.可可加加性性:若若U和和V为为两两个个独独立立的的 2分分布布随随机机变变量量,U 2(n1),V 2(n2),则则U+V这这一一随随机机变变量量服服从从自自由由度为度为n1+n2的的 2分布分布 2分布分布(性质和特点性质和特点)本讲稿第十六页,共四十三页c2分布(图示)不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20本讲稿第十七页,共四十三页t 分布本讲稿第十八页,共四十三页t 分布1.高高 塞塞 特特(W.S.Gosset)于于1908年年 在在 一一 篇篇 以以“Student”(学生学生)为笔名的论文中首次提出为笔名的论文中首次提出2.t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常要比正态分布平坦和分散常要比正态分布平坦和分散3.一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着自由度的增大,分布也逐渐趋于正态分布着自由度的增大,分布也逐渐趋于正态分布 本讲稿第十九页,共四十三页t 分布图示x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z本讲稿第二十页,共四十三页F 分布本讲稿第二十一页,共四十三页1.由由统统计计学学家家费费希希尔尔(R.A.Fisher)提提出出的的,以以其其姓姓氏氏的的第一个字母来命名第一个字母来命名2.设设若若U为为服服从从自自由由度度为为n1的的 2分分布布,即即U 2(n1),V为为服服从从自自由由度度为为n2的的 2分分布布,即即V 2(n2),且且U和和V相相互互独独立立,则称则称F为服从自由度为服从自由度n1和和n2的的F分布,记为分布,记为F分布分布(F distribution)本讲稿第二十二页,共四十三页F分布(图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)本讲稿第二十三页,共四十三页6.4 样本均值的分布与中心极限定理 本讲稿第二十四页,共四十三页1.在重复选取容量为在重复选取容量为n的样本时,由样本均的样本时,由样本均值的所有可能取值形成的相对频数分布值的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布本讲稿第二十五页,共四十三页样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N N=4 4。4 4 个个个个个个个个体体体体分分分分别别别别为为为为x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 。总总总总体体体体的的的的均均均均值值值值、方差及分布如下方差及分布如下方差及分布如下方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差本讲稿第二十六页,共四十三页样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)现现从从总总体体中中抽抽取取n n2 2的的的的简简简简单单单单随随随随机机机机样样样样本本本本,在在在在重重重重复复复复抽抽抽抽样样样样条条条条件下,共有件下,共有件下,共有件下,共有4 42 2=16个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)本讲稿第二十七页,共四十三页样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计计计计算算算算出出出出各各各各样样样样本本本本的的的的均均均均值值值值,如如如如下下下下表表表表。并并并并给给给给出出出出样样样样本本本本均均均均值值值值的的的的抽抽抽抽样分布样分布样分布样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5本讲稿第二十八页,共四十三页样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.5 2 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X本讲稿第二十九页,共四十三页样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布xn n=16=16当当当当总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N(,2 2)时时时时,来来来来自自自自该该该该总总总总体体体体的的的的所所所所有有有有容容容容量量量量为为为为n的的的的样样样样本本本本的的的的均均均均值值值值 x x也也也也服服服服从从从从正正正正态态态态分分分分布布布布,x x 的的的的数数数数学学学学期期期期望望望望为为为为,方差为方差为方差为方差为 2 2/n。即。即。即。即 xN N(,2 2/n n)本讲稿第三十页,共四十三页中心极限定理(central limit theorem)当样本容量足够当样本容量足够当样本容量足够当样本容量足够大时大时大时大时(n n 30)30),样本均值的抽样样本均值的抽样样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正态分布态分布态分布态分布从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n的的的的样样样样本本本本,当当当当n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽抽抽抽样样样样分分分分布布布布近近近近似似似似服服服服从从从从均均均均值值值值为为为为、方方方方差差差差为为为为 2 2/n n的正态分布的正态分布的正态分布的正态分布一个任意分一个任意分一个任意分一个任意分布的总体布的总体布的总体布的总体x x本讲稿第三十一页,共四十三页中心极限定理中心极限定理(central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的的的的过过过过程程程程本讲稿第三十二页,共四十三页6.5 样本比例的抽样分布样本比例的抽样分布 本讲稿第三十三页,共四十三页1.总体总体(或样本或样本)中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数之比之比不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为 比例比例(proportion)本讲稿第三十四页,共四十三页1.在重复选取容量为在重复选取容量为n的样本时,由样本比的样本时,由样本比例的所有可能取值形成的相对频数分布例的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.当样本容量很大时,样本比例的抽样分布当样本容量很大时,样本比例的抽样分布可用正态分布近似可用正态分布近似 4.推断总体比例推断总体比例 的理论基础的理论基础样本比例的抽样分布样本比例的抽样分布本讲稿第三十五页,共四十三页1.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差重复抽样重复抽样不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)本讲稿第三十六页,共四十三页6.6 两个两个样本均值之差的抽样分布样本均值之差的抽样分布 本讲稿第三十七页,共四十三页1.两个总体都为正态分布,即两个总体都为正态分布,即 ,2.两两个个样样本本均均值值之之差差 的的抽抽样样分分布布服服从从正正态态分分布,其分布的数学期望为两个总体均值之差布,其分布的数学期望为两个总体均值之差3.方差为各自的方差之和方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布本讲稿第三十八页,共四十三页6.7 关于关于样本方差的分布样本方差的分布 6.7.1 样本方差的分布样本方差的分布 6.7.2 两个样本方差比的分布两个样本方差比的分布 本讲稿第三十九页,共四十三页样本方差的分布样本方差的分布1.在在重重复复选选取取容容量量为为n的的样样本本时时,由由样样本本方方差差的的所所有可能取值形成的相对频数分布有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为的抽样分布服从自由度为(n-1)的的 2 2分布,即分布,即分布,即分布,即本讲稿第四十页,共四十三页两个样本方差比的分布两个样本方差比的分布1.两两个个总总体体都都为为正正态态分分布布,即即X1 1 N N(1,1 12 2),X X2 2 N N(2 2,2 22 2)2.2.从两从两从两从两个总体中分别抽取容量为个总体中分别抽取容量为个总体中分别抽取容量为个总体中分别抽取容量为n n1和和和和n n2 2的独立样本的独立样本的独立样本的独立样本3.两两个个个个样样样样本本本本方方方方差差差差比比比比的的的的抽抽抽抽样样样样分分分分布布布布,服服服服从从从从分分分分子子子子自自自自由由由由度度度度为为为为(n n1 1-1),分母自由度为,分母自由度为,分母自由度为,分母自由度为(n n2 2-1)的的的的F F分布,即分布,即 本讲稿第四十一页,共四十三页本章小结1.统计量及其分布统计量及其分布2.由正态分布导出的几个重要分布由正态分布导出的几个重要分布3.样本均值的分布与中心极限定理样本均值的分布与中心极限定理4.样本比例的抽样分布样本比例的抽样分布5.两个样本平均值之差的分布两个样本平均值之差的分布6.关于样本方差的分布关于样本方差的分布本讲稿第四十二页,共四十三页结结 束束本讲稿第四十三页,共四十三页