(06)第6章++统计量及其抽样分布28.pptx
6-1第第 6 章章 统计量及其抽样分布统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布 6-2学习目标学习目标1.了解统计量及其分布的几个概念了解统计量及其分布的几个概念2.了解由正态分布导出的几个重要分布了解由正态分布导出的几个重要分布 3.理解样本均值的分布与中心极限定理理解样本均值的分布与中心极限定理4.掌握样本比例的抽样分布掌握样本比例的抽样分布6-36.1 统计量统计量6.1.1 统计量的概念统计量的概念6.1.2 常用统计量常用统计量6.1.3 次序统计量次序统计量 6.1.4 充分统计量充分统计量 6-4统计量统计量(statistic)1.设设设设X X1 1,X X2 2,X Xn n是是是是从从从从总总总总体体体体X X中中中中抽抽抽抽取取取取的的的的容容容容量量量量为为为为n n的的的的一一一一个个个个样样样样 本本本本,如如如如 果果果果 由由由由 此此此此 样样样样 本本本本 构构构构 造造造造 一一一一 个个个个 函函函函 数数数数T T(X X1 1,X X2 2,X Xn n),不不不不依依依依赖赖赖赖于于于于任任任任何何何何未未未未知知知知参参参参数数数数,则则则则称称称称函函函函数数数数T T(X X1 1,X X2 2,X Xn n)是是是是一一一一个个个个统统统统计计计计量量量量,其其其其作作作作用用用用是是是是把把把把样本中有关总体的信息汇集起来。样本中有关总体的信息汇集起来。样本中有关总体的信息汇集起来。样本中有关总体的信息汇集起来。n n样本均值、样本比例、样本方差等都是统计量样本均值、样本比例、样本方差等都是统计量样本均值、样本比例、样本方差等都是统计量样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数统计量是样本的一个函数统计量是样本的一个函数统计量是样本的一个函数3.统计量是统计推断的基础统计量是统计推断的基础统计量是统计推断的基础统计量是统计推断的基础6-5常用统计量常用统计量样本均值、样本方差、样本变异系数等样本均值、样本方差、样本变异系数等矩矩:在统计学中,矩是指以期望值为基础:在统计学中,矩是指以期望值为基础而定义的数字特征。矩可以分为原点而定义的数字特征。矩可以分为原点矩和中心距两种。矩和中心距两种。样本均值为一阶原点矩;样本均值为一阶原点矩;样本方差为二阶中心距。样本方差为二阶中心距。6-6次序统计量(顺序统计量)次序统计量(顺序统计量)1.一一组样本观测值组样本观测值X1,X2,Xn由小到大的排由小到大的排序序 X(1)X(2)X(i)X(n)后,称后,称X(1),X(2),X(n)为次序统为次序统计量计量 2.中位数、分位数、四分位数等都是次序统中位数、分位数、四分位数等都是次序统计量计量6-7充分统计量充分统计量1.定义:统计量加工过程中一点信息都不损定义:统计量加工过程中一点信息都不损失的统计量通常称为充分统计量失的统计量通常称为充分统计量 2.例:例:P1596-86.2 关于分布的几个概念关于分布的几个概念6.2.1 总体分布总体分布6.2.2 样本分布样本分布6.2.3 抽样分布抽样分布6.2.4 渐进分布渐进分布6.2.5 随机模拟获得的近似分布随机模拟获得的近似分布 6-91.总体:是我们所关心的若干个元素(个体)总体:是我们所关心的若干个元素(个体)的集合。总体中每个元素的取值是不同的,的集合。总体中每个元素的取值是不同的,这些观察值所形成的分布就是总体分布。这些观察值所形成的分布就是总体分布。2.总体分布总体分布:总体中各元素的观察值所形成:总体中各元素的观察值所形成的相对频数分布,称为总体分布。的相对频数分布,称为总体分布。总体分布总体分布(population distribution)6-101.总体:是我们所关心的若干个元素(个体)总体:是我们所关心的若干个元素(个体)的集合。总体中每个元素的取值是不同的,的集合。总体中每个元素的取值是不同的,这些观察值所形成的分布就是总体分布。这些观察值所形成的分布就是总体分布。2.总体分布总体分布:总体中各元素的观察值所形成:总体中各元素的观察值所形成的相对频数分布,称为总体分布。的相对频数分布,称为总体分布。总体分布总体分布(population distribution)6-111.样本样本:是从总体中所抽取的部分元素的集合是从总体中所抽取的部分元素的集合 2.样本分布样本分布:从总体中抽取一个容量为:从总体中抽取一个容量为n的样的样本,由这本,由这n个观察值形成的相对频数分布,个观察值形成的相对频数分布,称为样本分布。称为样本分布。3.注意注意:样本来自总体,其中包含着总体:样本来自总体,其中包含着总体的一些信息和特征,因此样本分布也称为的一些信息和特征,因此样本分布也称为经验分布。注意与抽样分布是不同的概念。经验分布。注意与抽样分布是不同的概念。样本分布样本分布(sample distribution)6-121.抽样分布:某个样本统计量的抽样分布,抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为从理论上说就是在重复选取容量为n的样本的样本时,由该统计量的所有可能取值形成的相时,由该统计量的所有可能取值形成的相对频数分布。对频数分布。2.从一般意义上,抽样分布就是指样本从一般意义上,抽样分布就是指样本统计量的概率分布。例如,样本均值的分统计量的概率分布。例如,样本均值的分布、样本比例的分布、样本方差的分布等布、样本比例的分布、样本方差的分布等都称为抽样分布。下面重点介绍样本均值都称为抽样分布。下面重点介绍样本均值的抽样分布。的抽样分布。抽样分布抽样分布(sampling distribution)6-13渐近分布渐近分布P160近似分布近似分布P160(了解了解)6-146.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.3.1 2分布分布6.3.2 t 分布分布6.3.3 F 分布分布6-15 2 分布分布6-161.1.由由阿阿贝贝(AbbeAbbe)于于18631863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(HermertHermert)和和 卡卡 皮皮 尔尔 逊逊(KPearsonKPearson)分分 别别 于于18751875年和年和19001900年推导出来年推导出来2.2.设设 ,则,则3.3.令令 ,则,则 Y Y 服从自由度为服从自由度为1 1的的 2 2分布,即分布,即4.4.5.5.当总体当总体 ,从中抽取容量为,从中抽取容量为n n的样本,则的样本,则 2分布分布(2 distribution)6-171.分布的变量值始终为正分布的变量值始终为正分布的变量值始终为正分布的变量值始终为正 2.分分分分布布布布的的的的形形形形状状状状取取取取决决决决于于于于其其其其自自自自由由由由度度度度n n的的的的大大大大小小小小,通通通通常常常常为为为为不不不不对对对对称称称称的的的的正正正正偏偏偏偏分分分分布布布布,但但但但随随随随着着着着自自自自由由由由度度度度的的的的增增增增大大大大逐逐逐逐渐渐渐渐趋趋趋趋于对称于对称于对称于对称 3.期期期期望望望望为为为为:E E(2 2)=)=n n,方方方方差差差差为为为为:D D(2 2)=2)=2n n(n n为为为为自自自自由度由度由度由度)4.可可可可加加加加性性性性:若若若若U U和和和和V V为为为为两两两两个个个个独独独独立立立立的的的的 2 2分分分分布布布布随随随随机机机机变变变变量量量量,U U 2 2(n(n1 1),V V 2 2(n n2 2),),则则则则U U+V V这这这这一一一一随随随随机机机机变变变变量量量量服服服服从自由度为从自由度为从自由度为从自由度为n n1 1+n n2 2的的的的 2 2分布分布分布分布 2分布分布(性质和特点性质和特点)6-18c c2分布分布(图示图示)不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=206-19t 分布分布6-20t 分布分布1.高高塞塞特特(W.S.Gosset)于于1908年年在在一一篇篇以以“Student”(学学生生)为为笔笔名名的的论论文文中中首首次次提提出出2.t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它通常要比正态分布平坦和分散它通常要比正态分布平坦和分散3.一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋趋于于正态分布正态分布 6-21t 分布图示分布图示x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z6-22F 分布分布6-231.1.由由由由统统统统计计计计学学学学家家家家费费费费希希希希尔尔尔尔(R.A.FisherR.A.Fisher)提提提提出出出出的的的的,以以以以其其其其姓姓姓姓氏氏氏氏的第一个字母来命名的第一个字母来命名的第一个字母来命名的第一个字母来命名2.2.设设设设若若若若U U为为为为服服服服从从从从自自自自由由由由度度度度为为为为n n1 1的的的的 2 2分分分分布布布布,即即即即U U 2 2(n n1 1),V V为为为为服服服服从从从从自自自自由由由由度度度度为为为为n n2 2的的的的 2 2分分分分布布布布,即即即即V V 2 2(n n2 2),),且且且且U U和和和和V V相相相相互互互互独独独独立立立立,则则则则称称称称F F为为为为服服服服从从从从自自自自由由由由度度度度n n1 1和和和和n n2 2的的的的F F分分分分布布布布,记为记为记为记为F分布分布(F distribution)6-24F分布分布(图示图示)不同自由度的不同自由度的F分布分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)6-256.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理 6-261.在重复选取容量为在重复选取容量为n的样本时,由样本均的样本时,由样本均值的所有可能取值形成的相对频数分布值的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布6-27样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N N=4 4。4 4 个个个个个个个个体体体体分分分分别别别别为为为为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4 。总总总总体的均值、方差及分布如下体的均值、方差及分布如下体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2 2.3.3均值和方差均值和方差均值和方差均值和方差6-28样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)现现现现从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n2 2的的的的简简简简单单单单随随随随机机机机样样样样本本本本,在在在在重重重重复复复复抽抽抽抽样条件下,共有样条件下,共有样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值所有可能的所有可能的所有可能的所有可能的n n=2 =2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)6-29样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.56-30样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x6-31样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16当当当当总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N(,2 2)时时时时,来来来来自自自自该该该该总总总总体体体体的的的的所所所所有有有有容容容容量量量量为为为为n n的的的的样样样样本本本本的的的的均均均均值值值值 x x也也也也服服服服从从从从正正正正态态态态分分分分布布布布,x x 的的的的数数数数学期望为学期望为学期望为学期望为,方差为,方差为,方差为,方差为 2 2/n n。即。即。即。即 x xN N(,2 2/n n)6-32中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够当样本容量足够当样本容量足够大时大时大时大时(n n 30)30),样本均值的抽样样本均值的抽样样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正态分布态分布态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设设设从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n的的的的样样样样本本本本,当当当当n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽抽抽抽样分布近似服从均值为样分布近似服从均值为样分布近似服从均值为样分布近似服从均值为、方差为、方差为、方差为、方差为 2 2/n n的正态分布的正态分布的正态分布的正态分布一个任意分一个任意分一个任意分一个任意分布的总体布的总体布的总体布的总体x x6-33中心极限定理中心极限定理(central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的过程的过程的过程的过程6-34抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本大样本大样本小样本小样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布样样样样本本本本6-35样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)1.样本均值的数学期样本均值的数学期望望2.样本均值的方差样本均值的方差n n重复抽样重复抽样不重复抽样不重复抽样6-36样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)比较及结论:比较及结论:比较及结论:比较及结论:1.1.样本均值的均值样本均值的均值(数学期望数学期望)等于总体均值等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n6-37均值的抽样标准误差均值的抽样标准误差1.所有可能的样本均值的标准差,测度所所有可能的样本均值的标准差,测度所有样本均值的离散程度有样本均值的离散程度2.也称标准误差也称标准误差2.小于总体标准差小于总体标准差3.计算公式为计算公式为6-38样本比例的抽样分布样本比例的抽样分布6-391.1.定义:总体定义:总体定义:总体定义:总体(或样本或样本或样本或样本)中具有某种属性的单位与中具有某种属性的单位与中具有某种属性的单位与中具有某种属性的单位与全部单位总数之比全部单位总数之比全部单位总数之比全部单位总数之比n n不同性别的人与全部人数之比不同性别的人与全部人数之比不同性别的人与全部人数之比不同性别的人与全部人数之比n n合格品合格品合格品合格品(或不合格品或不合格品或不合格品或不合格品)与全部产品总数之比与全部产品总数之比与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为样本比例可表示为样本比例可表示为4.比例比例(proportion)6-40样本样本比例比例(即(即成数成数)的抽样分布(简称比例分布)的抽样分布(简称比例分布)抽样抽样 比例比例比例比例 =Ni/N 所有可能的样本的比例(所有可能的样本的比例()所形成的分)所形成的分布,称为样本比例的抽样分布。布,称为样本比例的抽样分布。6-411.在重复选取容量为的样本时,由样本比例在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分布的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.当样本容量很大时,样本比例的抽样分布当样本容量很大时,样本比例的抽样分布可用正态分布近似可用正态分布近似 4.推断总体比例推断总体比例 的理论基础的理论基础样本比例的抽样分布样本比例的抽样分布6-421.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差n n重复抽样重复抽样重复抽样重复抽样根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,的分布的分布的分布的分布就近似正态分布。(即就近似正态分布。(即就近似正态分布。(即就近似正态分布。(即npnp和和和和nqnq大于大于大于大于5 5时)时)时)时)样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)6-43本章重点本章重点1、概念:统计量、抽样分布、概念:统计量、抽样分布、t分布、中分布、中心极限定理心极限定理2、样本均值的抽样分布、样本比例的抽样、样本均值的抽样分布、样本比例的抽样分布分布6-44练习题练习题1 1、设、设X X1 1,X X2 2,X Xn n是是是是从某总体从某总体X X中抽取的一个样中抽取的一个样本,下面哪个不是统计量(本,下面哪个不是统计量()A A、B B、C C、D D、2 2、抽样分布是指(、抽样分布是指()A A、一个样本各观察值的分布;、一个样本各观察值的分布;B B、总体中各观察值的分布、总体中各观察值的分布 C C、样本统计量的分布、样本统计量的分布 D D、样本数量的分布、样本数量的分布6-451 1、大样本的样本比例的抽样分布服从(、大样本的样本比例的抽样分布服从()A A、正态分布正态分布 B B、F F分布分布 C C、t t分布分布 D D、卡方分布卡方分布2 2、某班学生的龄是右偏分布,均值为、某班学生的龄是右偏分布,均值为2222,标准,标准差为差为4.45.4.45.若采取重复抽样的方法从该班抽取容量若采取重复抽样的方法从该班抽取容量为为100100的样本,则样本均值的抽样分布是(的样本,则样本均值的抽样分布是()A A、正态分布,均值为、正态分布,均值为2222,标准差为,标准差为4.454.45;B B、分布形状未知,均值为、分布形状未知,均值为2222,标准差为,标准差为4.454.45 C C、正态分布,均值为、正态分布,均值为2222,标准差为,标准差为0.4450.445 D D、分布形状未知,均值为、分布形状未知,均值为2222,标准差为,标准差为0.4450.4456-46练习题答案练习题答案1A 2C 3A 4C6-47谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH