第5章 概率分布与统计量抽样分布PPT讲稿.ppt
第第5 5章章 概率分布与统概率分布与统计量抽样分布计量抽样分布第1页,共65页,编辑于2022年,星期一随机变量的概念随机变量的概念第3页,共65页,编辑于2022年,星期一随机变量随机变量(random variables)(random variables)1.1.一次试验的结果的数值性描述一次试验的结果的数值性描述2.2.一般一般用用 X X、Y Y、Z Z 来表示来表示3.3.例如例如:投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量4.4.根据根据取值情况的不同分为离散型随机变取值情况的不同分为离散型随机变量和连续型随机变量量和连续型随机变量第4页,共65页,编辑于2022年,星期一离散型随机变量离散型随机变量(discrete random variables)(discrete random variables)1.1.随随机机变变量量 X X 取取有有限限个个值值或或所所有有取取值值都都可可以以逐逐个个列列举举出来出来 X X1 1,X X2 2,2.2.以确定的概率取这些不同的值以确定的概率取这些不同的值3.3.离散离散型随机变量的一些例子型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查100100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾顾客数客数销销售量售量顾顾客性客性别别0,1,2,1000,1,2,1000,1,2,0,1,2,0,1,2,0,1,2,男性男性为为0,0,女性女性为为1 1第5页,共65页,编辑于2022年,星期一连续型随机变量连续型随机变量(continuous random variables)(continuous random variables)1.1.随机变量随机变量 X X 取无限个值取无限个值2.2.所所有有可可能能取取值值不不可可以以逐逐个个列列举举出出来来,而而是是取取数轴上某一区间内的任意点数轴上某一区间内的任意点3.3.连续型随机变量的一些例子连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查一批一批电电子元件子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长长度度使用寿命使用寿命(小小时时)半年后工程完成的百分比半年后工程完成的百分比测测量量误误差差(cm)(cm)X X 0 00 0 X X 100100X X 0 0第6页,共65页,编辑于2022年,星期一离散型随机变量的概率分布离散型随机变量的概率分布第7页,共65页,编辑于2022年,星期一离散型随机变量的概率分布离散型随机变量的概率分布1.1.列出离散型随机变量列出离散型随机变量X X的所有可能取值的所有可能取值2.2.列出随机变量取这些值的概率列出随机变量取这些值的概率3.3.通常用下面的表格来表示通常用下面的表格来表示X=xix1,x2,xnP(X=xi)=pip1,p2,pn4.P P P P(X X X X=x xi i i i)=)=p p p pi i称为离散型随机变量的概率函数称为离散型随机变量的概率函数称为离散型随机变量的概率函数称为离散型随机变量的概率函数 p p p pi i i i 0 0 0 0第8页,共65页,编辑于2022年,星期一离散型随机变量的概率分布离散型随机变量的概率分布 (例题分析例题分析)【例例】如如规规定定打打靶靶中中域域得得3 3分分,中中域域得得2 2分分,中中域域得得1 1分分,中中域域外外得得0 0分分。今今某某射射手手每每100100次次射射击击,平平均均有有3030次次中中域域,5555次次中中域域,1010次次中中,5 5次次中中域域外外。则则考考察察每每次次射射击击得得分分为为0,1,2,30,1,2,3这这一一离离散散型型随随机机变变量,其概率分布为量,其概率分布为X=xi0 1 2 3P(X=xi)pi0.05 0.10 0.55 0.30第9页,共65页,编辑于2022年,星期一离散型随机变量的数学期望和方差离散型随机变量的数学期望和方差第10页,共65页,编辑于2022年,星期一离散型随机变量的数学期望离散型随机变量的数学期望(expected value)(expected value)1.1.在在离离散散型型随随机机变变量量X X的的一一切切可可能能取取值值的的完完备备组组中中,各可能取值各可能取值x xi i与其与其取相对应的取相对应的概率概率p pi i乘积之和乘积之和2.2.描述离散型随机变量取值的集中程度描述离散型随机变量取值的集中程度3.3.计算计算公式为公式为第11页,共65页,编辑于2022年,星期一离散型随机变量的方差离散型随机变量的方差(variance)(variance)1.1.随随随随机机机机变变变变量量量量X X X X的的的的每每每每一一一一个个个个取取取取值值值值与与与与期期期期望望望望值值值值的的的的离离离离差差差差平平平平方方方方和和和和的的的的数学数学数学数学期望,记为期望,记为D D D D(X X X X)2.2.描述离散型随机变量取值的分散程度描述离散型随机变量取值的分散程度3.3.3.3.计算公式为计算公式为计算公式为计算公式为第12页,共65页,编辑于2022年,星期一离散型随机变量的方差离散型随机变量的方差 (例题分析例题分析)【例例例例】投投投投掷掷掷掷一一一一枚枚枚枚骰骰骰骰子子子子,出出出出现现现现的的的的点点点点数数数数是是是是个个个个离离离离散散散散型型型型随随随随机机机机变变变变量量量量,其概率分布为如下。计算数学期望和方差其概率分布为如下。计算数学期望和方差其概率分布为如下。计算数学期望和方差其概率分布为如下。计算数学期望和方差X=xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/6解:解:解:解:数学期望为数学期望为:方差为:方差为:第13页,共65页,编辑于2022年,星期一连续型随机变量的概率分布连续型随机变量的概率分布第14页,共65页,编辑于2022年,星期一连续型随机变量的概率分布连续型随机变量的概率分布1.1.连连续续型型随随机机变变量量可可以以取取某某一一区区间间或或整整个个实数轴上的任意一个值实数轴上的任意一个值2.2.它取任何一个特定的值的概率都等于它取任何一个特定的值的概率都等于0 03.3.不能列出每一个值及其相应的概率不能列出每一个值及其相应的概率4.4.通常研究它取某一区间值的概率通常研究它取某一区间值的概率5.5.用用数数学学函函数数的的形形式式和和分分布布函函数数的的形形式式来来描述描述第15页,共65页,编辑于2022年,星期一概率密度函数概率密度函数(probability density function)(probability density function)1.1.设设X X为为一一连连续续型型随随机机变变量量,x x 为为任任意意实实数数,X X的概率密度函数记为的概率密度函数记为f f(x x),它满足条件,它满足条件2.f f(x x)不是概率不是概率第16页,共65页,编辑于2022年,星期一概率密度函数概率密度函数 在在在在平平平平面面面面直直直直角角角角坐坐坐坐标标标标系系系系中中中中画画画画出出出出f f f f(x x x x)的的的的图图图图形形形形,则则则则对对对对于于于于任任任任何何何何实实实实数数数数 x x x x1 1 1 1 x x x x2 2 2 2,P P P P(x x x x1 1 1 1 X X X X x x x x2 2 2 2)是该曲线下从是该曲线下从是该曲线下从是该曲线下从x x x x1 1 1 1 到到到到 x x x x2 2 2 2的面积的面积的面积的面积f f(x x)x xa ab b概率是曲线下的面积概率是曲线下的面积第17页,共65页,编辑于2022年,星期一分布函数分布函数 (distribution function)(distribution function)1.1.连连续续型型随随机机变变量量的的概概率率可可以以用用分分布布函函数数F F(x x)来来表示表示2.2.分分布函数定义为布函数定义为3.3.根根据分布函数,据分布函数,P P(a a X X b b)可以写为可以写为第18页,共65页,编辑于2022年,星期一分布函数与密度函数的图示分布函数与密度函数的图示1.1.密度函数曲线下的面积等于密度函数曲线下的面积等于1 12.2.分布函数是曲线下小于分布函数是曲线下小于 x x0 0 的面积的面积f(x)xx0F F F F(x x x x0 0 0 0 )第19页,共65页,编辑于2022年,星期一连续型随机变量的期望和方差连续型随机变量的期望和方差1.1.连续型随机变量的数学期望为连续型随机变量的数学期望为2.2.方差为方差为第20页,共65页,编辑于2022年,星期一正态分布正态分布第21页,共65页,编辑于2022年,星期一正态分布正态分布(normal distribution)(normal distribution)1.1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布2.2.2.2.可用于近似离散型随机变量的分布可用于近似离散型随机变量的分布可用于近似离散型随机变量的分布可用于近似离散型随机变量的分布n n例如例如例如例如:二项分布二项分布二项分布二项分布3.3.3.3.经典统计推断的基础经典统计推断的基础经典统计推断的基础经典统计推断的基础x x x xf f f f(x x x x)第22页,共65页,编辑于2022年,星期一概率密度函数概率密度函数f f f f(x x x x)=)=随机变量随机变量 X X X X 的频数的频数的频数的频数 =总体方差总体方差总体方差总体方差 =3.14159=3.14159=3.14159=3.14159;e=;e=;e=;e=2.718282.718282.718282.71828x x x x=随机变量的取值随机变量的取值随机变量的取值随机变量的取值(-(-(-(-x x x x 0)0)0)02.2.2.2.正态正态正态正态曲线的最高点在均值曲线的最高点在均值曲线的最高点在均值曲线的最高点在均值 ,它也是分布的中位数和众数,它也是分布的中位数和众数,它也是分布的中位数和众数,它也是分布的中位数和众数3.3.3.3.正正正正态态态态分分分分布布布布是是是是一一一一个个个个分分分分布布布布族族族族,每每每每一一一一特特特特定定定定正正正正态态态态分分分分布布布布通通通通过过过过均均均均值值值值 和和和和标标标标准准准准差差差差 来来来来区区区区分分分分。决决决决定定定定了了了了图图图图形形形形的的的的中中中中心心心心位位位位置置置置,决决决决定定定定曲曲曲曲线线线线的的的的平平平平缓缓缓缓程程程程度度度度,即即即即宽度宽度宽度宽度4.4.4.4.曲曲曲曲线线线线f f f f(x x x x)相相相相对对对对于于于于均均均均值值值值 对对对对称称称称,尾尾尾尾端端端端向向向向两两两两个个个个方方方方向向向向无无无无限限限限延延延延伸伸伸伸,且且且且理理理理论论论论上永远不会与横轴相交上永远不会与横轴相交上永远不会与横轴相交上永远不会与横轴相交5.5.5.5.正态正态正态正态曲线下的总面积等于曲线下的总面积等于曲线下的总面积等于曲线下的总面积等于1 1 1 16.6.6.6.随机随机随机随机变量的概率由曲线下的面积给出变量的概率由曲线下的面积给出变量的概率由曲线下的面积给出变量的概率由曲线下的面积给出第24页,共65页,编辑于2022年,星期一 和和 对对正态曲线的影响正态曲线的影响x xf f(x x)C CA AB B第25页,共65页,编辑于2022年,星期一正态分布的概率正态分布的概率概率是曲线下的概率是曲线下的概率是曲线下的概率是曲线下的面积面积!a ab bx xf f(x x)第26页,共65页,编辑于2022年,星期一标准正态分布标准正态分布(standard normal distribution)(standard normal distribution)1.1.一般的正态分布取决于均值一般的正态分布取决于均值 和标准差和标准差 2.2.计计算算概概率率时时 ,每每一一个个正正态态分分布布都都需需要要有有自自己己的的正正态态概概率率分分布布表表,这这种种表表格格是是无无穷穷多的多的3.3.若若能能将将一一般般的的正正态态分分布布转转化化为为标标准准正正态态分分布,计算概率时只需要查一张表布,计算概率时只需要查一张表第27页,共65页,编辑于2022年,星期一标准正态分布函数标准正态分布函数2.2.标准正态分布标准正态分布标准正态分布标准正态分布的概率密度函数的概率密度函数1.1.1.1.任任任任何何何何一一一一个个个个一一般般的的正正态态分分布布,可可通通过过下下面面的的线线性性变变换转化为标准正态分布换转化为标准正态分布3.标准正态分布标准正态分布标准正态分布标准正态分布的分布函数的分布函数第28页,共65页,编辑于2022年,星期一标准正态分布表的使用标准正态分布表的使用1.1.将一个一般的转换为标准正态分布将一个一般的转换为标准正态分布2.2.计算概率时计算概率时 ,查标准正态概率分布表,查标准正态概率分布表3.3.对于负对于负的的 x x ,可由,可由 (-(-x x)x x 得到得到4.4.对对于标准正态分布,即于标准正态分布,即X X N N(0,1)(0,1),有,有n nP P P P(a a a a X X X X b b b b)b b b b a a a a n nP P P P(|X|(|X|(|X|(|X|a a a a)2 2 2 2 a a a a 1 1 1 15.5.对对于一般正态分布,即于一般正态分布,即X X N N(,),有,有第29页,共65页,编辑于2022年,星期一标准化的例子标准化的例子 P P(5(5 X X 6.2)6.2)x x 55 00一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.26.2 Z Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0 0 0.120.12.0478.0478.0478.0478第30页,共65页,编辑于2022年,星期一5.25.2 统计量和几个重要分布统计量和几个重要分布5.2.1 5.2.1 统计量的概念统计量的概念5.2.2 5.2.2 抽样分布抽样分布5.2.3 5.2.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 第31页,共65页,编辑于2022年,星期一统计量统计量(statisticstatistic)1.1.设设X X1 1,X X2 2,X Xn n是是从从总总体体X X中中抽抽取取的的容容量量为为n n的的一一个个样样本本,如如果果由由此此样样本本构构造造一一个个函函数数T T(X X1 1,X X2 2,X Xn n),不不依依赖赖于于任任何何未未知知参参数数,则称函数则称函数T T(X X1 1,X X2 2,X Xn n)是一个统计量是一个统计量n n样样本本均均值值、样样本本比比例例、样样本本方方差差等等都都是是统统计计量量2.2.统计量是样本的一个函数统计量是样本的一个函数3.3.统计量是统计推断的基础统计量是统计推断的基础4.4.常用统计量有样本均值和样本方差常用统计量有样本均值和样本方差第32页,共65页,编辑于2022年,星期一次序统计量次序统计量1.1.一一组样本观测值组样本观测值X X1 1,X X2 2,X Xn n由小到大的排由小到大的排序序 X X(1 1)X X(2 2)X X(i i)X X(n n)后,称后,称X X(1 1),X X(2 2),X X(n n)为次序统为次序统计量计量 2.2.中位数、分位数、四分位数等都是次序统中位数、分位数、四分位数等都是次序统计量计量第33页,共65页,编辑于2022年,星期一充分统计量充分统计量1.1.统计量加工过程中一点信息都不损失的统统计量加工过程中一点信息都不损失的统计量称为充分统计量计量称为充分统计量 2.2.当当X=X=(X X1 1,X X2 2,X Xn n)是来自正态分布)是来自正态分布N N(m m,)的一个样本时,)的一个样本时,若若m m已知,则已知,则S S2 2是是 的充分统计量;的充分统计量;若若 已知,则已知,则X X是是m m的充分统计量。的充分统计量。第34页,共65页,编辑于2022年,星期一1.1.1.1.样本统计量的概率分布,样本统计量的概率分布,样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布是一种理论分布是一种理论分布n n在重复选取容量为在重复选取容量为在重复选取容量为在重复选取容量为n n n n的样本时,由该统计量的所有可能取的样本时,由该统计量的所有可能取的样本时,由该统计量的所有可能取的样本时,由该统计量的所有可能取值形成的相对频数分布值形成的相对频数分布值形成的相对频数分布值形成的相对频数分布 2.2.2.2.随机变量是随机变量是随机变量是随机变量是 样本统计量样本统计量n n样本均值样本均值样本均值样本均值,样本比例,样本方差等样本比例,样本方差等样本比例,样本方差等样本比例,样本方差等3.3.结果来自结果来自容量相同容量相同的的的的所有所有所有所有可能样本可能样本4.4.4.4.提供了样本统计量长远而稳定的信息,是进行推断的理提供了样本统计量长远而稳定的信息,是进行推断的理提供了样本统计量长远而稳定的信息,是进行推断的理提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据论基础,也是抽样推断科学性的重要依据论基础,也是抽样推断科学性的重要依据论基础,也是抽样推断科学性的重要依据5.5.统计三大分布为统计三大分布为统计三大分布为统计三大分布为c c c c 分布,分布,分布,分布,t t t t分布和分布和分布和分布和F F F F分布分布分布分布抽样分布抽样分布 (sampling distributionsampling distribution)第35页,共65页,编辑于2022年,星期一 2 2 分布分布第36页,共65页,编辑于2022年,星期一1.1.1.1.由由由由阿阿阿阿贝贝贝贝(AbbeAbbeAbbeAbbe)于于于于1863186318631863年年年年首首首首先先先先给给给给出出出出,后后后后来来来来由由由由海海海海尔尔尔尔墨墨墨墨特特特特(HermertHermertHermertHermert)和和和和卡卡卡卡 皮皮皮皮尔尔尔尔逊逊逊逊(KPearsonKPearsonKPearsonKPearson)分分分分别别别别于于于于1875187518751875年年年年和和和和1900190019001900年推导出来年推导出来年推导出来年推导出来2.2.2.2.设设设设 ,则,则,则,则3.3.3.3.令令令令 ,则,则,则,则 Y Y Y Y 服从自由度为服从自由度为服从自由度为服从自由度为1 1 1 1的的的的 2 2 2 2分布,即分布,即分布,即分布,即4.4.4.4.5.5.5.5.当总体当总体当总体当总体 ,从中抽取容量为,从中抽取容量为,从中抽取容量为,从中抽取容量为n n n n的样本,则的样本,则的样本,则的样本,则 2 2分布分布(2 2 distributiondistribution)第37页,共65页,编辑于2022年,星期一1.1.1.1.分布的变量值始终为正分布的变量值始终为正分布的变量值始终为正分布的变量值始终为正 2.2.2.2.分分分分布布布布的的的的形形形形状状状状取取取取决决决决于于于于其其其其自自自自由由由由度度度度n n n n的的的的大大大大小小小小,通通通通常常常常为为为为不不不不对对对对称称称称的正偏分布,但随着自由度的增大逐渐趋于对称的正偏分布,但随着自由度的增大逐渐趋于对称的正偏分布,但随着自由度的增大逐渐趋于对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.3.3.3.期望为:期望为:期望为:期望为:E E E E(2 2 2 2)=)=)=)=n n n n,方差为:,方差为:D D(2 2)=2)=2)=2)=2n n n n(n n n n为自由度为自由度为自由度为自由度)4.4.可可可可加加加加性性性性:若若若若U U U U和和V V V V为为为为两两两两个个个个独独独独立立立立的的的的 2 2 2 2分分分分布布布布随随随随机机机机变变变变量量量量,U U 2 2 2 2(n(n(n(n1 1),V V V V 2 2 2 2(n n n n2 2 2 2),),则则U U+V V这这一一随随机机变变量量服服从从自自由度为由度为n n n n1 1 1 1+n n n n2 2 2 2的的的的 2 2 2 2分布分布分布分布 2 2分布分布(性质和特点性质和特点)第38页,共65页,编辑于2022年,星期一c c2 2分布分布(图示图示)不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 n n=1=1n n=4=4n n=10=10n n=20=20第39页,共65页,编辑于2022年,星期一t t 分布分布第40页,共65页,编辑于2022年,星期一t t 分布分布1.1.高高 塞塞 特特(W.S.Gosset)(W.S.Gosset)于于 19081908年年 在在 一一 篇篇 以以“Student”(“Student”(学生学生)为笔名的论文中首次提出为笔名的论文中首次提出2.2.t t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通常要比正态分布平坦和分散通常要比正态分布平坦和分散3.3.一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着自由度的增大,分布也逐渐趋于正态分布着自由度的增大,分布也逐渐趋于正态分布 第41页,共65页,编辑于2022年,星期一t t 分布图示分布图示x x x x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z z z第42页,共65页,编辑于2022年,星期一F F 分布分布第43页,共65页,编辑于2022年,星期一1.1.1.1.由由由由统统统统计计计计学学学学家家家家费费费费希希希希尔尔尔尔(R.A.FisherR.A.FisherR.A.FisherR.A.Fisher)提提提提出出出出的的的的,以以以以其其其其姓姓姓姓氏氏氏氏的的的的第第第第一个字母来命名一个字母来命名一个字母来命名一个字母来命名2.2.2.2.设设设设若若若若U U U U为为为为服服服服从从从从自自自自由由由由度度度度为为为为n n n n1 1 1 1的的的的 2 2 2 2分分分分布布布布,即即即即U U U U 2 2 2 2(n n n n1 1 1 1),V V V V为为为为服服服服从从从从自自自自由由由由度度度度为为为为n n n n2 2 2 2的的的的 2 2 2 2分分分分布布布布,即即即即V V V V 2 2 2 2(n n n n2 2 2 2),),),),且且且且U U U U和和和和V V V V相相相相互互互互独独独独立立立立,则称则称则称则称F F F F为服从自由度为服从自由度为服从自由度为服从自由度n n n n1 1 1 1和和和和n n n n2 2 2 2的的的的F F F F分布,记为分布,记为分布,记为分布,记为F F分布分布(F F distributiondistribution)第44页,共65页,编辑于2022年,星期一F F分布分布(图示图示)不同自由度的F分布F F F F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)第45页,共65页,编辑于2022年,星期一5.3 5.3 样本均值的分布与中心极限定理样本均值的分布与中心极限定理 5.3.1 5.3.1 样本均值的抽样分布样本均值的抽样分布5.3.2 5.3.2 中心极限定理中心极限定理第46页,共65页,编辑于2022年,星期一1.1.在重复选取容量为在重复选取容量为n n的样本时,由样本均的样本时,由样本均值的所有可能取值形成的相对频数分布值的所有可能取值形成的相对频数分布2.2.一种理论概率分布一种理论概率分布3.3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布第47页,共65页,编辑于2022年,星期一样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4 4 4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N N N N=4 4 4 4。4 4 4 4 个个个个个个个个体体体体分分分分别别别别为为为为x x x x1 1 1 1=1=1=1=1,x x x x2 2 2 2=2=2=2=2,x x x x3 3 3 3=3=3=3=3,x x x x4 4 4 4=4=4=4=4 。总总总总体体体体的的的的均均均均值值值值、方差及分布如下方差及分布如下方差及分布如下方差及分布如下总体分布总体分布总体分布总体分布1 1 1 14 4 4 42 2 2 23 3 3 30 0 0 0.1.1.1.1.2 2 2 2.3.3.3.3均值和方差均值和方差均值和方差均值和方差第48页,共65页,编辑于2022年,星期一样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)现现现现从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n n n2 2 2 2的的的的简简简简单单单单随随随随机机机机样样样样本本本本,在在在在重重重重复复复复抽抽抽抽样样样样条条条条件下,共有件下,共有件下,共有件下,共有4 4 4 42 2=16=16=16=16个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为3,43,43,43,43,33,33,33,33,23,23,23,23,13,13,13,13 3 3 32,42,42,42,42,32,32,32,32,22,22,22,22,12,12,12,12 2 2 24,44,44,44,44,34,34,34,34,24,24,24,24,14,14,14,14 4 4 41,41,41,41,44 4 4 41,31,31,31,33 3 3 32 2 2 21 1 1 11,21,21,21,21,11,11,11,11 1 1 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值所有可能的所有可能的所有可能的所有可能的n n n n=2 =2 =2 =2 的样本(共的样本(共的样本(共的样本(共16161616个)个)个)个)第49页,共65页,编辑于2022年,星期一样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.53.53.53.03.03.03.02.52.52.52.52.02.02.02.03 3 3 33.03.03.03.02.52.52.52.52.02.02.02.01.51.51.51.52 2 2 24.04.04.04.03.53.53.53.53.03.03.03.02.52.52.52.54 4 4 42.52.52.52.54 4 4 42.02.02.02.03 3 3 32 2 2 21 1 1 11.51.51.51.51.01.01.01.01 1 1 1第二个观察值第二个观察值第二个观察值第二个观察值第一个第一个第一个第一个观察值观察值观察值观察值16161616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x x x)x x x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.01.01.00 0 0 00.10.10.10.10.20.20.20.20.30.30.30.3P P P P (x x x x)1.51.51.51.53.03.03.03.04.04.04.04.03.53.53.53.52.02.02.02.02.52.52.52.5第50页,共65页,编辑于2022年,星期一样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 =2.5 2=1.25总体分布总体分布1 1 1 14 4 4 42 2 2 23 3 3 30 0 0 0.1.1.1.1.2.2.2.2.3.3.3.3抽样分布抽样分布P P P P(x x x x)1.01.01.01.00 0 0 0.1.1.1.1.2.2.2.2.3.3.3.31.51.51.51.53.03.03.03.04.04.04.04.03.53.53.53.52.02.02.02.02.52.52.52.5x x x x第51页,共65页,编辑于2022年,星期一样本均值的抽样分布样本均值的抽样分布比较和结论:比较和结论:1.1.样本均值的均值样本均值的均值(数学期望数学期望)等于总体均等于总体均值值2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n第52页,共65页,编辑于2022年,星期一样本均值的抽样分布样本均值的抽样分布 =50=50=50=50=50=50 =10=10=10=10=10=10X X X XX X总体分布总体分布总体分布总体分布n n n n=4=4=4=4抽样分布抽样分布抽样分布抽样分布x xn n n n=16=16=16=16当当当当总总总总体体体体服服服服从从从从正正正正态态态态分分分分布布布布N N(,2 2 2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n n n的的的的样样样样本本本本的的的的均均均均值值值值 x x x x也也服服从从正正态态分分布布,x x 的的的的数数数数学学学学期期期期望望望望为为为为,方差为,方差为,方差为,方差为 2 2/n n n n。即。即 x x x xN N(,2 2 2 2/n n n n)第53页,共65页,编辑于2022年,星期一中心极限定理中心极限定理(central limit theoremcentral limit theorem)当样本容量足够当样本容量足够当样本容量足够当样本容量足够大时大时大时大时(n n n n 30)30)30)30),样本均值的抽样样本均值的抽样样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正态分布态分布态分布态分布从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n n n的的的的样样样样本本本本,当当当当n n n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽抽抽抽样样样样分分分分布布布布近近近近似似似似服服服服从从从从均均均均值值值值为为为为 、方方方方差差差差为为为为 2 2 2 2/n n n n的正态分布的正态分布的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x x x第54页,共65页,编辑于2022年,星期一中心极限定理中心极限定理 (central limit theoremcentral limit theorem)x x x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的的的的过过过过程程程程第55页,共65页,编辑于2022年,星期一5.4 5.4 样本比例的抽样分布样本比例的抽样分布 第56页,共65页,编辑于2022年,星期一1.1.1.1.总体总体总体总体(或样本或样本或样本或样本)中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数之比之比之比之比n n不同性别的人与全部人数之比不同性别的人与全部人数之比不同性别的人与全部人数之比不同性别的人与全部人数之比n n合格品合格品合格品合格品(或不合格品或不合格品或不合格品或不合格品)与全部产品总数之比与全部产品总数之比与全部产品总数之比与全部产品总数之比2.2.2.2.总体比例可表示为总体比例可表示为总体比例可表示为总体比例可表示为3.3.样本比例可表示为样本比例可表示为样本比例可表示为样本比例可表示为 比例比例(proportion)(proportion)第57页,共65页,编辑于2022年,星期一1.1.在重复选取容量为在重复选取容量为n n的样本时,由样本比的样本时,由样本比例的所有可能取值形成的相对频数分布例的所有可能取值形成的相对频数分布2.2.一种理论概率分布一种理论概率分布3.3.当样本容量很大时,样本比例的抽样分布当样本容量很大时,样本比例的抽样分布可用正态分布近似可用正态分布近似 4.4.推断总体比例推断总体比例 的理论基础的理论基础样本比例的抽样分布样本比例的抽样分布第58页,共65页,编辑于2022年,星期一1.1.样本比例的数学期望样本比例的数学期望2.2.样本比例的方差样本比例的方差n n重复抽样重复抽样n n不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)第59页,共65页,编辑于2022年,星期一5.5 5.5 两个两个样本均值之差的抽样分布样本均值之差的抽样分布 第60页,共65页,编辑于2022年,星期一1.1.两个总体都为正态分布,即两个总体都为正态分布,即 ,2.2.两两两两个个个个样样样样本本本本均均均均值值值值之之之之差差差差 的的的的抽抽抽抽样样样样分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布,其分布的数学期望为两个总体均值之差其分布的数学期望为两个总体均值之差其分布的数学期望为两个总体均值之差其分布的数学期望为两个总体均值之差 方差为各自的方差之和方差为各自的方差之和方差为各自的方差之和方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布第61页,共65页,编辑于2022年,星期一5.6 5.6 关于关于样本方差的分布样本方差的分布 5.6.1 5.6.1 样本方差的分布样本方差的分布 5.6.2 5.6.2 两个样本方差比的分布两个样本方差比的分布 第62页,共65页,编辑于2022年,星期一样本方差的分布样本方差的分布1.1.在在重重复复选选取取容容量量为为n n的的样样本本时时,由由样样本本方方差差的的所所有可能取值形成的相对频数分布有可能取值形成的相对频数分布2.2.对于来自正态总体的简单随机样本,则比值对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为的抽样分布服从自由度为(n n-1)-1)的的 2 2分布,即分布,即第63页,共65页,编辑于2022年,星期一两个样本方差比的分布两个样本方差比的分布1.两两两两个个个个总总总总体体体体都都都都为为为为正正正正态态态态分分分分布布布布,即即即即X X1 1 1 1 N N N N(1 1 1 1,1 1 1 12 2