第四章统计数的分布精选文档.ppt
《第四章统计数的分布精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章统计数的分布精选文档.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章统计数的分布本讲稿第一页,共四十页研究总体与从中抽取的样本之间的关系研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研是统计学的中心内容。对这种关系的研究可从两方面着手,究可从两方面着手,一是从总体到样本,这就是研究抽样分一是从总体到样本,这就是研究抽样分布布(sampling distribution)的问题;的问题;二是从样本到总体,这就是统计推断二是从样本到总体,这就是统计推断(statistical inference)问题。问题。本讲稿第二页,共四十页 由总体中随机地抽取若干个体组成样本,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量
2、即使每次抽取的样本含量相等,其统计量也将随样本的不同而有所不同。因而样本也将随样本的不同而有所不同。因而样本统计量也是随机变量,也有其概率分布,统计量也是随机变量,也有其概率分布,我们把统计量的概率分布称为抽样分布。我们把统计量的概率分布称为抽样分布。本讲稿第三页,共四十页一、抽样试验与无偏估计一、抽样试验与无偏估计抽样试验抽样试验由总体随机抽样由总体随机抽样(random sampling)的的方法可分为有方法可分为有返置抽样返置抽样和和不返置抽样不返置抽样两种。对于无限总体,返置与否都可保两种。对于无限总体,返置与否都可保证各个体被抽到的机会相等。对于有限证各个体被抽到的机会相等。对于有限
3、总体,就应该采取返置抽样,否则各个总体,就应该采取返置抽样,否则各个体被抽到的机会就不相等。体被抽到的机会就不相等。本讲稿第四页,共四十页100份样本的均数和标准差份样本的均数和标准差本讲稿第五页,共四十页 将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图4-1。随机抽样所得随机抽样所得随机抽样所得随机抽样所得100100个样本均数的分布个样本均数的分布个样本均数的分布个样本均数的分布本讲稿第六页,共四十页 100个个样本均数的抽样分布特点:样本均数的抽样分布特点:100个个样样本本均均数数中中,各各样样本本均均数数间间存存在在差差异异,但但各样本
4、均数在总体均数周围波动。各样本均数在总体均数周围波动。样样本本均均数数的的分分布布曲曲线线为为中中间间高高,两两边边低低,左左右右对称,近似服从正态分布。对称,近似服从正态分布。本讲稿第七页,共四十页无偏估计无偏估计在统计学上,如果所有可能样本的在统计学上,如果所有可能样本的某一统计数的平均数等于总体的相某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应应参数,则称该统计数为总体相应参数的参数的无偏估计值。无偏估计值。本讲稿第八页,共四十页设有一设有一N=3的近似正态总体,具有变量的近似正态总体,具有变量3,4,5;求得;求得=4,2=0.6667,=0.8165现以现以n=2作独立
5、的有回放抽样,总共得作独立的有回放抽样,总共得Nn=32=9个样本。个样本。抽样结果列入下表:抽样结果列入下表:本讲稿第九页,共四十页N=3 n=2时抽样的平均数 方差 标准差样本编号样本值平均数方差标准差1234567893,33,43,54,34,44,55,35,45,53.03.54.03.54.04.54.04.55.00.00.52.00.50.00.52.00.50.00.00000.70711.41420.70710.00000.70711.41420.70710.000036.06.05.6567本讲稿第十页,共四十页从上表的资料可以求出从上表的资料可以求出:样本平均数的平均
6、数样本平均数的平均数x=4样本方差的平均数样本方差的平均数S2=0.6667=2样本标准差的平均数样本标准差的平均数S=0.62850.8165=所以,所以,惟有样本标准差惟有样本标准差s的平均数不是总的平均数不是总体标准差体标准差的无偏差估计值。的无偏差估计值。其余两个其余两个参数为无偏差估计值。参数为无偏差估计值。本讲稿第十一页,共四十页二、样本平均数抽样分布二、样本平均数抽样分布设有一个总体设有一个总体,总体平均数为,总体平均数为,方差方差为为2,总体中各变数为,总体中各变数为x,将,将 此总体称此总体称为原总体。现从这个总体中随机抽取含为原总体。现从这个总体中随机抽取含量为量为n的样本
7、,样本平均数记为的样本,样本平均数记为 。可。可以设想,从原总体中可抽出很多甚至以设想,从原总体中可抽出很多甚至无穷多个含量为无穷多个含量为n的样本。的样本。本讲稿第十二页,共四十页由这些样本算得的平均数与原总体平由这些样本算得的平均数与原总体平均数均数相比往往表现出不同程度的差异。相比往往表现出不同程度的差异。这种差异是由随机抽样造成的,称为抽这种差异是由随机抽样造成的,称为抽样误差样误差(sampling error)。显然,样本平均。显然,样本平均数也是一个随机变量,其概率分布叫做样数也是一个随机变量,其概率分布叫做样本平均数的抽样分布。本平均数的抽样分布。由样本平均数构成的总体称为样本
8、平均由样本平均数构成的总体称为样本平均数的抽样总体,其平均数和标准差分别记数的抽样总体,其平均数和标准差分别记为为 和和 。本讲稿第十三页,共四十页 是样本平均数抽样总体的标准差,是样本平均数抽样总体的标准差,简称标准误简称标准误(standard error),它表示平,它表示平均数抽样误差的大小。统计学上已证明总均数抽样误差的大小。统计学上已证明总体的两个参数与体的两个参数与x 总体的两个参数有如下总体的两个参数有如下关系:关系:本讲稿第十四页,共四十页即即样样本本均均数数的的标标准准差差,可可用用于于衡衡量量抽抽样样误误差差的的大小。大小。因通常未知,计算标准误采用下式:标准误标准误(s
9、tandard error,SE)通过增加样本含通过增加样本含量量n来降低抽样来降低抽样误差。误差。本讲稿第十五页,共四十页设有一个设有一个N=4的有限总体,变数为的有限总体,变数为2,3,3,4。根据。根据=xN和和2=(x-)2N求得求得该总体的该总体的、2、为:为:=3,2=12,=(1/2)1/2=0.707本讲稿第十六页,共四十页从有限总体作返置随机抽样,所有可能的从有限总体作返置随机抽样,所有可能的样本数为样本数为Nn其中其中n为样本含量为样本含量。以上述总。以上述总体而论,如果从中抽取体而论,如果从中抽取n=2的样本,共可的样本,共可得得 42=16 个样本;如果样本含量个样本;
10、如果样本含量n为为4,则,则一共可抽得一共可抽得44=256个样本。分别求这些样个样本。分别求这些样本的平均数本的平均数 ,其次数分布,其次数分布如下表如下表所示。所示。在在n=2的试验中,样本平均数抽样总体的的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:平均数、方差与标准差分别为:因是返置式抽样,因此抽样因是返置式抽样,因此抽样4个个个体组成一个样本,这个样本可个体组成一个样本,这个样本可能都为能都为A或或B或这或这4个个体和任意个个体和任意组合。组合。本讲稿第十七页,共四十页 =4/16=1/4=(1/2)/2=2/n本讲稿第十八页,共四十页表 N=4,n=2和n=4时的次数分
11、布本讲稿第十九页,共四十页 同理,可得同理,可得n=4时:时:验证了验证了 的正确性。的正确性。也可以将表中两个样本平均数的抽样总也可以将表中两个样本平均数的抽样总体作次数分布图。体作次数分布图。本讲稿第二十页,共四十页由以上模拟抽样试验可以看出,虽然原总由以上模拟抽样试验可以看出,虽然原总体并非正态分布,但从中随机抽取样本,体并非正态分布,但从中随机抽取样本,即使样本含量很小,样本平均数的分布却即使样本含量很小,样本平均数的分布却趋向于正态分布形式。随着样本含量趋向于正态分布形式。随着样本含量 n 的的增大,样本平均数的分布愈来愈从不连续增大,样本平均数的分布愈来愈从不连续趋向于连续的正态分
12、布。当趋向于连续的正态分布。当n30时,时,的的分布就近似正态分布了。分布就近似正态分布了。X变量与变量与 变量变量概率分布间的关系可由下列两个定理说明:概率分布间的关系可由下列两个定理说明:本讲稿第二十一页,共四十页1.若随机变量若随机变量x服从正态分布服从正态分布N(,2);x1、x2、xn,是由,是由x 总体得来的随机样本,则统计量总体得来的随机样本,则统计量 =xn的概率分布也是正态分布,且有的概率分布也是正态分布,且有 ,即服从正态分布即服从正态分布N(,2n)。2.若随机变量若随机变量x服从平均数是服从平均数是,方差是,方差是2的分布的分布(不是正态分布不是正态分布);x1、x2、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 分布 精选 文档
限制150内