抽样分布优秀PPT.ppt
本章章节本章章节6.1 6.1 三种不同性质的分布三种不同性质的分布 6.2 6.2 一个总体参数推断时样本统计量分布一个总体参数推断时样本统计量分布6.3 6.3 两个总体参数推断时样本统计量分布两个总体参数推断时样本统计量分布学习目标学习目标1.1.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布2.2.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系3.3.驾驭单总体参数推断时样本统计量的分布驾驭单总体参数推断时样本统计量的分布4.4.驾驭双总体参数推断时样本统计量的分布驾驭双总体参数推断时样本统计量的分布6.1 6.1 三种不同性质的分布三种不同性质的分布总体分布总体分布样本分布样本分布抽样分布抽样分布1.1.总体中各元素的视察值所形成的分布总体中各元素的视察值所形成的分布 2.2.分布通常是未知的分布通常是未知的3.3.可以假定它听从某种分布可以假定它听从某种分布 总体分布总体分布(population distribution)总体总体1.1.一个样本中各视察值的分布一个样本中各视察值的分布 2.2.也称阅历分布也称阅历分布 3.3.当样本容量当样本容量n n渐渐增大时,样本分布渐渐接近总渐渐增大时,样本分布渐渐接近总体的分布体的分布 样本分布样本分布(sample distribution)样样本本1.1.样本统计量的概率分布样本统计量的概率分布2.2.是一种理论概率分布是一种理论概率分布3.3.随机变量是样本统计量随机变量是样本统计量4.4.样本均值样本均值,样本比例,样本方差等样本比例,样本方差等5.5.结果来自容量相同的全部可能样本结果来自容量相同的全部可能样本6.6.是进行推断的理论基础,也是抽样推断科学性的重要依是进行推断的理论基础,也是抽样推断科学性的重要依据据 抽样分布抽样分布 (sampling distribution)抽样分布抽样分布 (sampling distribution)总体总体总体总体计算样本统计量计算样本统计量计算样本统计量计算样本统计量例如:样本均值、例如:样本均值、例如:样本均值、例如:样本均值、比例、方差比例、方差比例、方差比例、方差样样样样本本本本6.2 6.2 样本统计量的抽样分布样本统计量的抽样分布 (一个总体参数推断时一个总体参数推断时)样本均值的抽样分布样本均值的抽样分布样本比例的抽样分布样本比例的抽样分布抽样方差的抽样分布抽样方差的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布u容量相同的全部可能样本的样本均值的概率分容量相同的全部可能样本的样本均值的概率分布布u一种理论概率分布一种理论概率分布u进行推断总体均值进行推断总体均值的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例】设设一一个个总总体体,含含有有4个个元元素素(个个体体),即即总总体体单单位位数数N=4。4 个个个个体体分分别别为为x1=1、x2=2、x3=3、x4=4。总总体体的的均值、方差及分布如下均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)现现现现从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n2 2的的的的简简简简洁洁洁洁随随随随机机机机样样样样本本本本,在在在在重重重重复复复复抽抽抽抽样条件下,共有样条件下,共有样条件下,共有样条件下,共有42=1642=16个样本。全部样本的结果为个样本。全部样本的结果为个样本。全部样本的结果为个样本。全部样本的结果为3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n n=2 =2 的样本(共的样本(共1616个)个)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)计计计计算算算算出出出出各各各各样样样样本本本本的的的的均均均均值值值值,如如如如下下下下表表表表。并并并并给给给给出出出出样样样样本本本本均均均均值值值值的抽样分布的抽样分布的抽样分布的抽样分布3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值(个样本的均值(x x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析)=2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n=16=16当当总总体体听听从从正正态态分分布布N(,2)时时,来来自自该该总总体体的的全全部部容容量量为为n的的样样本本的的均均值值X也也听听从从正正态态分分布布,X 的的数数学学期期望望为为,方方差为差为2/n。即。即XN(,2/n)中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布渐渐趋于正分布渐渐趋于正态分布态分布中中心心极极限限定定理理:设设从从均均值值为为,方方差差为为 2的的一一个个随随意意总总体体中中抽抽取取容容量量为为n的的样样本本,当当n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近似听从均值为近似听从均值为、方差为、方差为2/n的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X中心极限定理中心极限定理 (central limit theorem)的分的分的分的分布趋布趋布趋布趋于正于正于正于正态分态分态分态分布的布的布的布的过程过程过程过程抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本大样本大样本小样本小样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布1.1.样本均值的数学期望样本均值的数学期望2.2.样本均值的方差样本均值的方差重复抽样重复抽样不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)均值的抽样标准误均值的抽样标准误1.1.全部可能的样本均值的标准差,测度全部全部可能的样本均值的标准差,测度全部样本均值的离散程度样本均值的离散程度2.2.小于总体标准差小于总体标准差3.3.计算公式为计算公式为英国统计学家英国统计学家W.S.Gosset(1908)W.S.Gosset(1908)给出了统计给出了统计量量t t的分布规律,并称统计量的分布规律,并称统计量 的分布规律为的分布规律为t t分布,自由度为分布,自由度为v v,记为,记为t(v)t(v)分分布。由于每个自由度布。由于每个自由度v v对应一个分布,因此对应一个分布,因此t t分分布是一簇分布。布是一簇分布。T分布分布自由度不同的三条t分布密度曲线v=1 v=5v=v=1 t t分布的图形特征和分布的图形特征和t t界值界值分布特征分布特征:t:t分布曲线是单峰的,且以分布曲线是单峰的,且以t=0t=0左右对称。左右对称。t t分布是随自由度分布是随自由度v v而变更的一簇分布。而变更的一簇分布。t t分布与正态分布的关系分布与正态分布的关系:自由度自由度v v 较小时,较小时,t t 分布与分布与标准正态分布相差较大,随着自由度标准正态分布相差较大,随着自由度v v的增大,的增大,t t 分布曲分布曲线越来越接近于标准正态分布曲线。线越来越接近于标准正态分布曲线。当当 时,时,t t分布的极限分布就是标准正态分布。分布的极限分布就是标准正态分布。t t分布的界值分布的界值:-t/2,vt/2,v t t界值示意图界值示意图:t t界值示意图界值示意图:样本比例的抽样分布样本比例的抽样分布样本比例的抽样分布样本比例的抽样分布1.1.总体总体(或样本或样本)中具有某种属性的单位与全部单位中具有某种属性的单位与全部单位总数之比总数之比不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.2.总体比例可表示为总体比例可表示为3.3.样本比例可表示为样本比例可表示为比例比例(proportion)1.1.容量相同的全部可能样本的样本比例的概率分容量相同的全部可能样本的样本比例的概率分布布2.2.当样本容量很大时,样本比例的抽样分布可用当样本容量很大时,样本比例的抽样分布可用正态分布近似正态分布近似 3.3.一种理论概率分布一种理论概率分布4.4.推断总体比例推断总体比例的理论基础的理论基础样本比例的抽样分布样本比例的抽样分布1.1.样本比例的数学期望样本比例的数学期望2.2.样本比例的方差样本比例的方差重复抽样重复抽样不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)样本方差的抽样分布样本方差的抽样分布样本方差的抽样分布样本方差的抽样分布样本方差的分布样本方差的分布对于来自正态总体的简洁随机样本,则比值对于来自正态总体的简洁随机样本,则比值 的抽样分布听从自由度为的抽样分布听从自由度为(n-1)的的2分布,即分布,即1.1.由由阿阿贝贝(Abbe)(Abbe)于于18631863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(Hermert)(Hermert)和和卡卡 皮皮尔尔逊逊(KPearson)(KPearson)分分别别于于18751875年和年和19001900年推导出来年推导出来2.2.设设 ,则,则3.3.令令 ,则,则 Y Y 听从自由度为听从自由度为1 1的的2 2分布,即分布,即 4.4.当总体当总体 ,从中抽取容量为,从中抽取容量为n n的样本,则的样本,则 2分布分布(2 distribution)1.1.分布的变量值始终为正分布的变量值始终为正 2.2.分分布布的的形形态态取取决决于于其其自自由由度度n n的的大大小小,通通常常为为不不对对称称的的正正偏偏分分布布,但但随随着着自自由由度度的的增增大大渐渐渐渐趋趋于于对对称称 3.3.期期望望为为:E(E(2)=n2)=n,方方差差为为:D(D(2)=2n(n2)=2n(n为为自自由由度度)4.4.可可加加性性:若若U U和和V V为为两两个个独独立立的的2 2分分布布随随机机变变量量,UU2(n1)2(n1),VV2(n2),2(n2),则则U+VU+V这这一一随随机机变变量量听听从从自由度为自由度为n1+n2n1+n2的的2 2分布分布 2分布分布(性质和特点性质和特点)c c2 2分布分布(图示图示)选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体6.3 样本统计量的抽样分布样本统计量的抽样分布 (两个总体参数推断时两个总体参数推断时)一一.两个样本均值之差的抽样分布两个样本均值之差的抽样分布二二.两个样本比例之差的抽样分布两个样本比例之差的抽样分布三三.两个样本方差比的抽样分布两个样本方差比的抽样分布两个样本均值之差的抽样两个样本均值之差的抽样两个样本均值之差的抽样两个样本均值之差的抽样分布分布分布分布1.1.两个总体都为正态分布,即两个总体都为正态分布,即 ,2.2.两两个个样样本本均均值值之之差差 的的抽抽样样分分布布听听从从正正态态分分布布,其其分布的数学期望为两个总体均值之差分布的数学期望为两个总体均值之差3.3.方差为各自的方差之和方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布 m m m m1 1 1 1s s s s1 1 1 1总体总体1总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m m m1-1-1-1-m m m m2 22 2抽样分抽样分抽样分抽样分布布布布s s s s2 2 2 2 m m m m2 2 2 2两个样本比例之差的抽样两个样本比例之差的抽样两个样本比例之差的抽样两个样本比例之差的抽样分布分布分布分布1.1.两个总体都听从二项分布两个总体都听从二项分布2.2.分分别别从从两两个个总总体体中中抽抽取取容容量量为为n1n1和和n2n2的的独独立立样样本本,当当两两个个样样本本都都为为大大样样本本时时,两两个个样样本本比比例例之之差差的的抽抽样样分分布布可可用正态分布来近似用正态分布来近似3.3.分布的数学期望为分布的数学期望为4.4.方差为各自的方差之和方差为各自的方差之和 两个样本比例之差的抽样分布两个样本比例之差的抽样分布两个样本方差比的抽样两个样本方差比的抽样两个样本方差比的抽样两个样本方差比的抽样分布分布分布分布两个样本方差比的抽样分布两个样本方差比的抽样分布1.两两两两个个个个总总总总体体体体都都都都为为为为正正正正态态态态分分分分布布布布,即即即即X1N(1,12)X1N(1,12)的的的的一一一一个个个个样样样样本本本本,Y1Y1,Y2Y2,Yn2Yn2是是是是来来来来自自自自正正正正态态态态总总总总体体体体X2N(2,22)X2N(2,22)2.从从从从两两两两个个个个总总总总体体体体中中中中分分分分别别别别抽抽抽抽取取取取容容容容量量量量为为为为n1n1和和和和n2n2的的的的独独独独立立立立样样样样本本本本3.两两两两个个个个样样样样本本本本方方方方差差差差比比比比的的的的抽抽抽抽样样样样分分分分布布布布,听听听听从从从从分分分分子子子子自自自自由由由由度度度度为为为为(n1-1)(n1-1),分母自由度为,分母自由度为,分母自由度为,分母自由度为(n2-1)F(n2-1)F分布,即分布,即分布,即分布,即 1.1.由由统统计计学学家家费费舍舍(R.A.Fisher)(R.A.Fisher)提提出出的的,以以其其姓姓氏的第一个字母来命名氏的第一个字母来命名2.2.设设 若若 U U为为 听听 从从 自自 由由 度度 为为 n1n1的的 2 2分分 布布,即即UU2(n1)2(n1),V V为为听听从从自自由由度度为为n2n2的的2 2分分布布,即即VV2(n2),2(n2),且且U U和和V V相互独立,则相互独立,则3.3.称称F F为听从自由度为听从自由度n1n1和和n2n2的的F F分布,记为分布,记为F分布分布(F distribution)F分布分布(图示图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)本章小结本章小结1.1.总体分布、样本分布、抽样分布总体分布、样本分布、抽样分布2.2.单总体单总体参数推断时样本统计量的分布参数推断时样本统计量的分布3.3.双总体双总体参数推断时样本统计量的分布参数推断时样本统计量的分布