第四章统计数的分布精选PPT.ppt
《第四章统计数的分布精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章统计数的分布精选PPT.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章统计数的分布第1页,此课件共40页哦研究总体与从中抽取的样本之间的关研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系系是统计学的中心内容。对这种关系的研究可从两方面着手,的研究可从两方面着手,一是从总体到样本,这就是研究抽样一是从总体到样本,这就是研究抽样分布分布(sampling distribution)的问题;的问题;二是从样本到总体,这就是统计推断二是从样本到总体,这就是统计推断(statistical inference)问题。问题。第2页,此课件共40页哦 由总体中随机地抽取若干个体组成样本,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统
2、计即使每次抽取的样本含量相等,其统计量也将随样本的不同而有所不同。因而量也将随样本的不同而有所不同。因而样本统计量也是随机变量,也有其概率样本统计量也是随机变量,也有其概率分布,我们把统计量的概率分布称为抽分布,我们把统计量的概率分布称为抽样分布。样分布。第3页,此课件共40页哦一、抽样试验与无偏估计一、抽样试验与无偏估计抽样试验抽样试验由总体随机抽样由总体随机抽样(random sampling)的的方法可分为有方法可分为有返置抽样返置抽样和和不返置抽样不返置抽样两种。对于无限总体,返置与否都可两种。对于无限总体,返置与否都可保证各个体被抽到的机会相等。对于保证各个体被抽到的机会相等。对于有
3、限总体,就应该采取返置抽样,否有限总体,就应该采取返置抽样,否则各个体被抽到的机会就不相等。则各个体被抽到的机会就不相等。第4页,此课件共40页哦100份样本的均数和标准差份样本的均数和标准差第5页,此课件共40页哦 将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图4-1。随机抽样所得随机抽样所得随机抽样所得随机抽样所得100100个样本均数的分布个样本均数的分布个样本均数的分布个样本均数的分布第6页,此课件共40页哦 100个个样本均数的抽样分布特点:样本均数的抽样分布特点:100个个样样本本均均数数中中,各各样样本本均均数数间间存存在在差差异异
4、,但但各样本均数在总体均数周围波动。各样本均数在总体均数周围波动。样样本本均均数数的的分分布布曲曲线线为为中中间间高高,两两边边低低,左左右对称,近似服从正态分布。右对称,近似服从正态分布。第7页,此课件共40页哦无偏估计无偏估计在统计学上,如果所有可能样本的某在统计学上,如果所有可能样本的某一统计数的平均数等于总体的相应一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参参数,则称该统计数为总体相应参数的数的无偏估计值。无偏估计值。第8页,此课件共40页哦设有一设有一N=3的近似正态总体,具有变量的近似正态总体,具有变量3,4,5;求得;求得=4,2=0.6667,=0.8165现以
5、现以n=2作独立的有回放抽样,总共得作独立的有回放抽样,总共得Nn=32=9个样本。个样本。抽样结果列入下表:抽样结果列入下表:第9页,此课件共40页哦N=3 n=2时抽样的平均数 方差 标准差样本编号样本值平均数方差标准差1234567893,33,43,54,34,44,55,35,45,53.03.54.03.54.04.54.04.55.00.00.52.00.50.00.52.00.50.00.00000.70711.41420.70710.00000.70711.41420.70710.000036.06.05.6567第10页,此课件共40页哦从上表的资料可以求出从上表的资料可以
6、求出:样本平均数的平均数样本平均数的平均数x=4样本方差的平均数样本方差的平均数S2=0.6667=2样本标准差的平均数样本标准差的平均数S=0.62850.8165=所以,所以,惟有样本标准差惟有样本标准差s的平均数不是总的平均数不是总体标准差体标准差的无偏差估计值。的无偏差估计值。其余两个其余两个参数为无偏差估计值。参数为无偏差估计值。第11页,此课件共40页哦二、样本平均数抽样分布二、样本平均数抽样分布设有一个总体设有一个总体,总体平均数为,总体平均数为,方差为方差为2,总体中各变数为,总体中各变数为x,将,将 此总体称为此总体称为原总体。现从这个总体中随机抽取含量原总体。现从这个总体中
7、随机抽取含量为为n的样本,样本平均数记为的样本,样本平均数记为 。可以。可以设想,从原总体中可抽出很多甚至无设想,从原总体中可抽出很多甚至无穷多个含量为穷多个含量为n的样本。的样本。第12页,此课件共40页哦由这些样本算得的平均数与原总体平均数由这些样本算得的平均数与原总体平均数相比往往表现出不同程度的差异。这相比往往表现出不同程度的差异。这种差异是由随机抽样造成的,称为抽样种差异是由随机抽样造成的,称为抽样误差误差(sampling error)。显然,样本平均数。显然,样本平均数也是一个随机变量,其概率分布叫做样本也是一个随机变量,其概率分布叫做样本平均数的抽样分布。平均数的抽样分布。由样
8、本平均数构成的总体称为样本平均由样本平均数构成的总体称为样本平均数的抽样总体,其平均数和标准差分别数的抽样总体,其平均数和标准差分别记为记为 和和 。第13页,此课件共40页哦 是样本平均数抽样总体的标准差,简是样本平均数抽样总体的标准差,简称标准误称标准误(standard error),它表示平均,它表示平均数抽样误差的大小。统计学上已证明总数抽样误差的大小。统计学上已证明总体的两个参数与体的两个参数与x 总体的两个参数有如下总体的两个参数有如下关系:关系:第14页,此课件共40页哦即即样样本本均均数数的的标标准准差差,可可用用于于衡衡量量抽抽样样误误差差的的大小。大小。因通常未知,计算标
9、准误采用下式:标准误标准误(standard error,SE)通过增加样本含量通过增加样本含量n来降低抽样误差。来降低抽样误差。第15页,此课件共40页哦设有一个设有一个N=4的有限总体,变数为的有限总体,变数为2,3,3,4。根据。根据=xN和和2=(x-)2N求求得该总体的得该总体的、2、为:为:=3,2=12,=(1/2)1/2=0.707第16页,此课件共40页哦从有限总体作返置随机抽样,所有可能从有限总体作返置随机抽样,所有可能的样本数为的样本数为Nn其中其中n为样本含量为样本含量。以上述。以上述总体而论,如果从中抽取总体而论,如果从中抽取n=2的样本,共可的样本,共可得得 42=
10、16 个样本;如果样本含量个样本;如果样本含量n为为4,则一共可抽得则一共可抽得44=256个样本。分别求这些个样本。分别求这些样本的平均数样本的平均数 ,其次数分布如下表,其次数分布如下表所示。所示。在在n=2的试验中,样本平均数抽样总体的的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:平均数、方差与标准差分别为:因是返置式抽样,因此抽样因是返置式抽样,因此抽样4个个体个个体组成一个样本,这个样本可能都为组成一个样本,这个样本可能都为A或或B或这或这4个个体和任意组合。个个体和任意组合。第17页,此课件共40页哦 =4/16=1/4=(1/2)/2=2/n第18页,此课件共40页哦
11、表 N=4,n=2和n=4时的次数分布第19页,此课件共40页哦 同理,可得同理,可得n=4时:时:验证了验证了 的正确性。的正确性。也可以将表中两个样本平均数的抽样总也可以将表中两个样本平均数的抽样总体作次数分布图。体作次数分布图。第20页,此课件共40页哦由以上模拟抽样试验可以看出,虽然原总由以上模拟抽样试验可以看出,虽然原总体并非正态分布,但从中随机抽取样本,体并非正态分布,但从中随机抽取样本,即使样本含量很小,样本平均数的分布却即使样本含量很小,样本平均数的分布却趋向于正态分布形式。随着样本含量趋向于正态分布形式。随着样本含量 n 的的增大,样本平均数的分布愈来愈从不连续增大,样本平均
12、数的分布愈来愈从不连续趋向于连续的正态分布。当趋向于连续的正态分布。当n30时,时,的的分布就近似正态分布了。分布就近似正态分布了。X变量与变量与 变量变量概率分布间的关系可由下列两个定理说明:概率分布间的关系可由下列两个定理说明:第21页,此课件共40页哦1.若随机变量若随机变量x服从正态分布服从正态分布N(,2);x1、x2、xn,是由,是由x 总体得来的随机样本,则统计总体得来的随机样本,则统计量量 =xn的概率分布也是正态分布,且有的概率分布也是正态分布,且有 ,即服从正态分布即服从正态分布N(,2n)。2.若随机变量若随机变量x服从平均数是服从平均数是,方差是,方差是2的分的分布布(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 分布 精选 PPT
限制150内