统计学第5章++抽样分布.ppt
《统计学第5章++抽样分布.ppt》由会员分享,可在线阅读,更多相关《统计学第5章++抽样分布.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 5章章 抽样分布抽样分布1、常、常见的抽的抽样方法方法2、三种不同性质的分布三种不同性质的分布 3、一个总体参数推断时样本统计量分布一个总体参数推断时样本统计量分布4、两个总体参数推断时样本统计量分布、两个总体参数推断时样本统计量分布学习目标学习目标1.了解常见的抽样方法了解常见的抽样方法2.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布3.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布5.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布5.1 常见的抽样方法常
2、见的抽样方法 指样本单位的抽取不受主指样本单位的抽取不受主观因素及其他系统性因素观因素及其他系统性因素的影响,每个总体单位都的影响,每个总体单位都有均等的被抽中机会有均等的被抽中机会一、抽样推断一、抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一从全部研究对象中抽取一部分单位进行调查,并以调查结果对总部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方计与推断,从而认识总体的一种统计方法。法。并非所有的抽样估计都按随机原并非所有的抽样估计都按随机原则抽取样本,也有则抽取样本,也有非随机抽样非随机抽样总体
3、总体随机样本随机样本非随机样本非随机样本与总体分布与总体分布特征相同特征相同与总体分布与总体分布特征不同特征不同q按按随机原则随机原则抽取样本单位抽取样本单位q以以样本样本的数量特征推断的数量特征推断总体总体的数量特征的数量特征q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可,但抽样误差可以事先以事先计算并控制计算并控制二、抽样推断的特点二、抽样推断的特点 与全面调查相比,抽样调查既节省了人力、物力、与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。财力和时间,又达到了认识总体数量特征的目的。我我国在国在19941994年确立了以周期性普查为基础,
4、以经常性抽年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以样调整为主体,同时辅之以重点调查、科学核算等综重点调查、科学核算等综合运用的统计调查方法体系。合运用的统计调查方法体系。三、抽样推断的理论基础三、抽样推断的理论基础大数大数定律定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性的性质。质。大数定律论证了如果独立随机变量总体大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的存在有限的平均数和方差,则对于充分大的样本可以近乎样本可以近乎100%100%的概率,期望样本平均的概率,期望样本平均数与总体平均数的
5、绝对离差数与总体平均数的绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方如果变量总体存在有限的平均数和方差,那么不论这差,那么不论这个总体的分布如何,个总体的分布如何,随着样本容量的增加,样本平均数的随着样本容量的增加,样本平均数的分布,便趋近于分布,便趋近于正态分布正态分布。q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用1、根据取样方式、根据取样方式重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容个单位中
6、随机抽取一个样本容量为量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新并把结果登记下来,又放回总体中重新参加下一次的抽选。又称参加下一次的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又再将其放回参加下一次的抽选。又称称不放回抽样不放回抽样.总体单位数总体单位数N N不变,同一单位可能不变,同一单位可能多次被抽中。多次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能同一单位只可能被抽中一次。被抽中一次。四、抽样方法分类四、抽样方法分类2、根据
7、对样本的要求不同、根据对样本的要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有综合起来共有四种抽样方法四种抽样方法样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽
8、样简单随机抽样简单随机抽样分层抽样分层抽样系统抽样系统抽样整群抽样整群抽样3、根据抽取的原则、根据抽取的原则(抽样调查的组织形式抽样调查的组织形式)(1)它要求被抽取样本的总体的个体数)它要求被抽取样本的总体的个体数有限有限;(2)它是从总体中)它是从总体中逐个逐个进行抽取;进行抽取;(3)它是一种)它是一种等概率等概率抽样。抽样。简简单单随随机机抽抽样样是是在在特特定定总总体体中中抽抽取取样样本本,总总体体中中每每一一个个体体被被抽抽取取的的可可能能性性是是等等同同的的,而而且且任任何何个个体体之之间间彼彼此此被被抽抽取取的的机机会会是是独独立立的的。如如果果用用从从个个体体数数为为N的的总
9、总体体中中抽抽取取一一个个容量为容量为n的样本,那么每个个体被抽取的概卒等于的样本,那么每个个体被抽取的概卒等于 简单随机抽样简单随机抽样(纯随机抽样纯随机抽样)简单随机抽样的方法简单随机抽样的方法练习练习:先先将将总体中的所有个体(共总体中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),),并把号码写在形状、大小相同的号签上(号签可以用并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,
10、连续个号签,连续抽取抽取n次,就得到一个容量为次,就得到一个容量为n的样本。对个体编号时,也可的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。以利用已有的编号。例如学生的学号,座位号等。抽签法抽签法 随随机机抽抽样样并并不不是是随随意意或或随随便便抽抽取取,因因为为随随意或随便抽取都会带有主观或客观的影响因素意或随便抽取都会带有主观或客观的影响因素随随机机数数表表是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证证表中的每个位置上的数字是等可能出现的。表中的每个位置上的数字是等可能出现的。随随机机数数表表并并不不是是唯唯一一的的,因因此此可可以以
11、任任选选一一个个数数作作为为开开始始,读读数的方向可以向左,也可以向右、向上、向下等等。数的方向可以向左,也可以向右、向上、向下等等。用用随随机机数数表表进进行行抽抽样样的的步步骤骤:将将总总体体中中个个体体编编号号;选选定定开开始的数字;获取样本号码。始的数字;获取样本号码。由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样样本本保保证了被抽取个体的概率是相等的。证了被抽取个体的概率是相等的。随机数表法随机数表法如何用随机数表来抽取样本。如何用随机数表来抽取样本。为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件产品中抽取件产品中抽取10
12、件进件进行检查,利用随机数表抽取这个样本行检查,利用随机数表抽取这个样本16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07
13、44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28注将总体中的注将总体中的N个个体编号时可以从个个体编号时可以从0开始,例如开始,例如N100时编号可以是时编号可以是00,01,02,99,这样总体中的所,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数有个体均可用两位数字号码表示,便于运用随机数表。表。计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随
14、机数字编制为程序存储在计算机计算机计算机计算机中,需要时中,需要时中,需要时中,需要时将总体中各单位编上号码,启用将总体中各单位编上号码,启用将总体中各单位编上号码,启用将总体中各单位编上号码,启用随机数字发生器随机数字发生器随机数字发生器随机数字发生器输输输输出随机数字,然后从总体中找到相应总体单位形成出随机数字,然后从总体中找到相应总体单位形成出随机数字,然后从总体中找到相应总体单位形成出随机数字,然后从总体中找到相应总体单位形成样本。样本。样本。样本。由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是 ,因,因而第而第1排被抽取前,其他各
15、排中各号码被抽取哪率也是排被抽取前,其他各排中各号码被抽取哪率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简单随机抽样,这种,每排的抽样也是简单随机抽样,这种抽样的方法是系统抽样。抽样的方法是系统抽样。(1)一一个个礼礼堂堂有有30排排座座位位,每每排排有有40个个座座位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听听众众。会会后后为为听听取取意意见见留留下下了了座座位位号号为为20的的30名名听听众众进行座谈。进行座谈。当当总总体体的的个个数数较较多多时时,将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从每每一一部部分分
16、中中抽抽取取1个个个个体体,得得到到所需要的样本,称为所需要的样本,称为系统抽样系统抽样。系统抽样系统抽样(机械抽样、等距抽样机械抽样、等距抽样 )系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;l
17、nk 系系统统抽抽样样时时,将将总总体体中中的的个个体体均均分分后后的的每每一一段段进进行行抽抽样样时时,采采用用简简单单随随机机抽抽样样;系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是是相相等等的的;如如总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随随机机抽抽样样从从总总体体中中剔剔除除几几个个个个体体,然然后后再再按按系系统统抽抽样样进进行行。需需要要说说明明的是整个抽样过程中每个个体被抽到的概率仍然相等。的是整个抽样过程中每个个体被抽到的概率仍然相等。例如例如,为了了解参加某种知识竞赛的,为了
18、了解参加某种知识竞赛的1000名学生的成绩,名学生的成绩,打算从中抽取一个容量为打算从中抽取一个容量为50的样本。假定这的样本。假定这1000名学生名学生的编号是的编号是1,2,1000,由于,由于50:10001:20,我们,我们将总体均分成将总体均分成50个部分,其中每一部分包括个部分,其中每一部分包括20个个体,个个体,例如第例如第1部分的个体编号是部分的个体编号是1,2,20。然后在第一。然后在第一部分随机抽取一个号码,这样得到一个容量为部分随机抽取一个号码,这样得到一个容量为50的样本:的样本:18,38,58,978,998在上面的抽样中,由于在第在上面的抽样中,由于在第1部分(个
19、体编号部分(个体编号120)中的起始号码是随机确定的,每个号码被抽取的概率中的起始号码是随机确定的,每个号码被抽取的概率都等于都等于0.05,所以在抽取第,所以在抽取第1部分的个体前部分的个体前,其他各部其他各部分中每个号码被抽取的概率也都是分中每个号码被抽取的概率也都是0.05.就是说就是说,在这个在这个系统抽样中系统抽样中,每个个体被抽到的概率都是每个个体被抽到的概率都是0.05.排列次序用的标志有两种:排列次序用的标志有两种:选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称称无关标志排队。无关标志排队。选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内
20、容有关,称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)示意图:示意图:对对称等距抽样
21、称等距抽样示意图:示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)分层抽样分层抽样(分类抽样分类抽样)当当已已知知总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本充充分分地地反反映映总总体体的的情情况况,按按照照各各部部分分所所占比例进行抽样。各部分叫做占比例进行抽样。各部分叫做层层。分分层层抽抽样样适适用用于于总总体体由由差差异异明明显显的的几几部部分分组组成成的的情情况况,每每一一部部分分称称为为层层,在在每每一一层层中中实实行行简简单单随随机机抽抽样样。这这种种方方法法较较充充分分地地利利用用了了总总体己有信息,是一种实用、操作
22、性强的方法体己有信息,是一种实用、操作性强的方法。分分层层抽抽样样的的一一个个重重要要问问题题是是一一个个总总体体如如何何分分层层。分分层层抽抽样样中中分分多多少少层层,要要视视具具体体情情况况而而定定。总总的的原原则则是是:层层内内样样本本的的差差异异要要小小,而而层层与与层层之之间间的的差异尽可能地大,差异尽可能地大,否则将失去分层的意义否则将失去分层的意义。类型的划分类型的划分类型的划分类型的划分:必须有清楚的划类界限;必须有清楚的划类界限;必须知道各类中的单位数目和比例;必须知道各类中的单位数目和比例;分类型的数目不宜太多。分类型的数目不宜太多。类型抽样的好处是:类型抽样的好处是:类型
23、抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽样调查本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。抽样数目可以减少。例例2、一一个个单单位位的的职职工工有有500人人,其其中中不不到到35岁岁的的有有125人人,3549岁岁的的有有280人人,50岁岁以以上上的的有有95人人。为为了了了了解解该该单单位位职职工工年年龄龄与与身身体体状状况况的的有有关关指指标标,从从中中抽抽取取100名名职工作为样本,应该怎样抽取?职工作为样本,应该怎样抽取?分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体与样本容
24、量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。整群抽样整群抽样 整群抽样整群抽样即从全及总体中成群地抽取即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进样本单位,对抽中的群内的所有单位都进行观察。行观察。整群抽样的好处:整群抽样的好处:组织工作比较简组织工作比较简单方便,适用于一些特殊的研究对象。单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的其
25、不足之处是,一般比其它抽样方式的抽样误差大。抽样误差大。三种抽样方法的比较三种抽样方法的比较 5.2 三种不同性质的分布三种不同性质的分布一一.总体分布总体分布二二.样本分布样本分布三三.抽样分布抽样分布1.总体中各元素的观察值所形成的分布 2.分布通常是未知的3.可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布(sample distribution)样样本本复习:复习:总体总体的性质的性质一个统计问题总有它明确的研究对象。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 分布
限制150内