统计学第5章抽样分布精品文稿.ppt
《统计学第5章抽样分布精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学第5章抽样分布精品文稿.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学第统计学第5 5章抽样分布章抽样分布第1页,本讲稿共90页学习目标学习目标1.了解常见的抽样方法了解常见的抽样方法2.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布3.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布5.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布第2页,本讲稿共90页5.1 常见的抽样方法常见的抽样方法第3页,本讲稿共90页 指样本单位的抽取不受主观因指样本单位的抽取不受主观因指样本单位的抽取不受主观因指样本单位的抽取不受主观因素及其他系统性
2、因素的影响,素及其他系统性因素的影响,素及其他系统性因素的影响,素及其他系统性因素的影响,每个总体单位都有均等的被抽每个总体单位都有均等的被抽每个总体单位都有均等的被抽每个总体单位都有均等的被抽中机会中机会中机会中机会一、抽样推断一、抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一从全部研究对象中抽取一部分单位进行调查,并以调查结果对总部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方计与推断,从而认识总体的一种统计方法。法。第4页,本讲稿共90页并非所有的抽样估计都按随机原并非所有的抽样估计都按随机
3、原并非所有的抽样估计都按随机原并非所有的抽样估计都按随机原则抽取样本,也有则抽取样本,也有则抽取样本,也有则抽取样本,也有非随机抽样非随机抽样非随机抽样非随机抽样总体总体总体总体随机样本随机样本非随机样本非随机样本与总体分布与总体分布特征相同特征相同与总体分布特与总体分布特与总体分布特与总体分布特征不同征不同征不同征不同第5页,本讲稿共90页q按按随机原则随机原则抽取样本单位抽取样本单位q以以样本样本的数量特征推断的数量特征推断总体总体的数量特征的数量特征q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可以事,但抽样误差可以事先先计算并控制计算并控制二、抽样推断的特点二、抽样推断的特点
4、与全面调查相比,抽样调查既节省了人力、物力、财力与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。和时间,又达到了认识总体数量特征的目的。我国在我国在19941994年确立了以周期性普查为基础,以经常性抽样调整为主体,年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以同时辅之以重点调查、科学核算等综合运用的统计调查方法体重点调查、科学核算等综合运用的统计调查方法体系。系。第6页,本讲稿共90页三、抽样推断的理论基础三、抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的
5、性质。的性质。大数定律论证了如果独立随机变量总体存在大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本有限的平均数和方差,则对于充分大的样本可以近乎可以近乎100%100%的概率,期望样本平均数与总的概率,期望样本平均数与总体平均数的绝对离差体平均数的绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方差,如果变量总体存在有限的平均数和方差,那么不论这那么不论这个总体的分布如何,随着样本个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近容量的增加,样本平均数的分布,便趋近于于正态分布正态分布。第7页,本讲稿共90页q不可能不可能进行全面调查时进行全
6、面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用第8页,本讲稿共90页1、根据取样方式、根据取样方式重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量为个单位中随机抽取一个样本容量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果登并把结果登记下来,又放回总体中重新参加下一次的抽记下来,又放回总体中重新参加下一次的抽选。又称选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再每次从总体中抽选一个单位后就不
7、再将其放回参加下一次的抽选。又称将其放回参加下一次的抽选。又称不不放回抽样放回抽样.总体单位数总体单位数N N不变,同一单位可能多次不变,同一单位可能多次被抽中。被抽中。总体单位数减少总体单位数减少n n,同一单位只可能被,同一单位只可能被抽中一次。抽中一次。四、抽样方法分类四、抽样方法分类第9页,本讲稿共90页2、根据对样本的要求不同、根据对样本的要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不
8、重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有四综合起来共有四种抽样方法种抽样方法第10页,本讲稿共90页样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样第11页,本讲稿共90页简单随机抽样简单随机抽样分层抽样分层抽样系统抽样系统抽样整群抽样整群抽样3、根据抽取的原则、根据抽取的原则(抽样调查的组织形式抽样调查的组织形式)第12页,本讲稿共90页(1)它要求被抽取样本的总体的个体数)它要求被抽取样本的总
9、体的个体数有限有限;(2)它是从总体中)它是从总体中逐个逐个进行抽取;进行抽取;(3)它是一种)它是一种等概率等概率抽样。抽样。简简单单随随机机抽抽样样是是在在特特定定总总体体中中抽抽取取样样本本,总总体体中中每每一一个个体体被被抽抽取取的的可可能能性性是是等等同同的的,而而且且任任何何个个体体之之间间彼彼此此被被抽抽取取的的机机会会是是独独立立的的。如如果果用用从从个个体体数数为为N的的总总体体中中抽抽取取一一个个容量为容量为n的样本,那么每个个体被抽取的概卒等于的样本,那么每个个体被抽取的概卒等于 简单随机抽样简单随机抽样(纯随机抽样纯随机抽样)第13页,本讲稿共90页 简单随机抽样的方法
10、简单随机抽样的方法练习练习:先将总体中的所有个体(共先将总体中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),并把号码写在形状、大小相同的号签上(号签可以用),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续个号签,连续抽取抽取n次,就得到一个容量为次,就得到一个容量为n的样本。对个体编号时,也可的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。以利用已有的编号
11、。例如学生的学号,座位号等。抽签法抽签法第14页,本讲稿共90页 随随机机抽抽样样并并不不是是随随意意或或随随便便抽抽取取,因因为为随随意意或或随便抽取都会带有主观或客观的影响因素随便抽取都会带有主观或客观的影响因素随随机机数数表表是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证证表表中的每个位置上的数字是等可能出现的。中的每个位置上的数字是等可能出现的。随随机机数数表表并并不不是是唯唯一一的的,因因此此可可以以任任选选一一个个数数作作为为开开始始,读读数数的的方方向可以向左,也可以向右、向上、向下等等。向可以向左,也可以向右、向上、向下等等。用用随随机机数数表表进
12、进行行抽抽样样的的步步骤骤:将将总总体体中中个个体体编编号号;选选定定开开始始的的数字;获取样本号码。数字;获取样本号码。由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样样本本保保证证了了被被抽抽取取个体的概率是相等的。个体的概率是相等的。随机数表法随机数表法第15页,本讲稿共90页如何用随机数表来抽取样本。如何用随机数表来抽取样本。为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件产品中抽取件产品中抽取10件进行件进行检查,利用随机数表抽取这个样本检查,利用随机数表抽取这个样本16 22 77 94 39 49 54 43 54 82
13、17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54
14、49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第16页,本讲稿共90页注将总体中的注将总体中的N个个体编号时可以从个个体编号时可以从0开始,例如开始,例如N100时编号可以是时编号可以是00,01,02,99,这样总体中的所有个体,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。均可用两位数字号码表示,便于运用随机数表。第17页,本讲稿共90页计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算机计算机计算机计算机中,需要时将总中,需要时将总中,需要时
15、将总中,需要时将总体中各单位编上号码,启用体中各单位编上号码,启用体中各单位编上号码,启用体中各单位编上号码,启用随机数字发生器随机数字发生器随机数字发生器随机数字发生器输出随机数字,输出随机数字,输出随机数字,输出随机数字,然后从总体中找到相应总体单位形成样本。然后从总体中找到相应总体单位形成样本。然后从总体中找到相应总体单位形成样本。然后从总体中找到相应总体单位形成样本。第18页,本讲稿共90页由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是 ,因,因而第而第1排被抽取前,其他各排中各号码被抽取哪率也是排被抽取前,其他各排中各号码被抽取哪
16、率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简单随机抽样,这种,每排的抽样也是简单随机抽样,这种抽样的方法是系统抽样。抽样的方法是系统抽样。(1)一一个个礼礼堂堂有有30排排座座位位,每每排排有有40个个座座位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听听众众。会会后后为为听听取取意意见见留留下下了了座座位位号号为为20的的30名名听听众众进行座谈。进行座谈。当当总总体体的的个个数数较较多多时时,将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从每每一一部部分分中中抽抽取取1个个个个体体,得得到到所所需需要要的的样样本,
17、称为本,称为系统抽样系统抽样。系统抽样系统抽样(机械抽样、等距抽样机械抽样、等距抽样 )第19页,本讲稿共90页系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk 系系统统抽抽样样时时,将将总总
18、体体中中的的个个体体均均分分后后的的每每一一段段进进行行抽抽样样时时,采采用用简简单单随随机机抽抽样样;系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是是相相等等的的;如如总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随随机机抽抽样样从从总总体体中中剔剔除除几几个个个个体体,然然后后再再按按系系统统抽抽样样进进行行。需需要要说说明明的的是是整整个个抽抽样样过程中每个个体被抽到的概率仍然相等。过程中每个个体被抽到的概率仍然相等。第20页,本讲稿共90页例如例如,为了了解参加某种知识竞赛的,为了了解参加某种
19、知识竞赛的1000名学生的成绩,名学生的成绩,打算从中抽取一个容量为打算从中抽取一个容量为50的样本。假定这的样本。假定这1000名学生的编名学生的编号是号是1,2,1000,由于,由于50:10001:20,我们将总体均分,我们将总体均分成成50个部分,其中每一部分包括个部分,其中每一部分包括20个个体,例如第个个体,例如第1部分的个部分的个体编号是体编号是1,2,20。然后在第一部分随机抽取一个号。然后在第一部分随机抽取一个号码,这样得到一个容量为码,这样得到一个容量为50的样本:的样本:18,38,58,978,998在上面的抽样中,由于在第在上面的抽样中,由于在第1部分(个体编号部分(
20、个体编号120)中的起)中的起始号码是随机确定的,每个号码被抽取的概率都等于始号码是随机确定的,每个号码被抽取的概率都等于0.05,所以在抽取第,所以在抽取第1部分的个体前部分的个体前,其他各部分中每个号码被抽其他各部分中每个号码被抽取的概率也都是取的概率也都是0.05.就是说就是说,在这个系统抽样中在这个系统抽样中,每个个体被每个个体被抽到的概率都是抽到的概率都是0.05.第21页,本讲稿共90页排列次序用的标志有两种:排列次序用的标志有两种:排列次序用的标志有两种:排列次序用的标志有两种:选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称无称无关标志排队。关标志排队。选
21、选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关,称有关称有关标志排队。标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例第22页,本讲稿共90页机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:第2
22、3页,本讲稿共90页半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)示意图:示意图:第24页,本讲稿共90页对对称等距抽样称等距抽样示意图:示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)第25页,本讲稿共90页分层抽样分层抽样(分类抽样分类抽样)当当已已知知总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本充充分分地地反反映映总总体体的的情情况况,按按照照各各部部分分所所占占比比例例进进行抽样。各部分叫做行抽样。各部分叫做层层。分分层层抽抽样样适适用用于于总总体体由由差差异异明明显显的的几几部部分分组组成成的的情情况况,每
23、每一一部部分分称称为为层层,在在每每一一层层中中实实行行简简单单随随机机抽抽样样。这这种种方方法法较较充充分分地地利利用用了了总总体体己己有有信信息息,是是一一种实用、操作性强的方法种实用、操作性强的方法。分分层层抽抽样样的的一一个个重重要要问问题题是是一一个个总总体体如如何何分分层层。分分层层抽抽样样中中分分多多少少层层,要要视视具具体体情情况况而而定定。总总的的原原则则是是:层层内内样样本本的的差差异异要要小小,而而层层与与层层之之间间的的差差异异尽可能地大,尽可能地大,否则将失去分层的意义否则将失去分层的意义。第26页,本讲稿共90页类型的划分类型的划分类型的划分类型的划分:必须有清楚的
24、划类界限;必须有清楚的划类界限;必须知道各类中的单位数目和比例;必须知道各类中的单位数目和比例;分类型的数目不宜太多。分类型的数目不宜太多。第27页,本讲稿共90页类型抽样的好处是:类型抽样的好处是:类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽样调查成本本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目较低。如果抽样误差的要求相同的话则抽样数目可以减少。可以减少。第28页,本讲稿共90页例例2、一一个个单单位位的的职职工工有有500人人,其其中中不不到到35岁岁的的有有125人人,3549岁岁的的有有280人人,50岁岁以以上上的的有有95人人
25、。为为了了了了解解该该单单位位职职工工年年龄龄与与身身体体状状况况的的有有关关指指标标,从从中中抽抽取取100名名职职工工作作为为样样本本,应该怎样抽取?应该怎样抽取?第29页,本讲稿共90页分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。第30页,本讲稿共90页整群抽样整群抽样 整群抽样整群抽样即从全及总体中成群地抽取样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 分布 精品 文稿
限制150内