简单随机抽样系统抽样.ppt
抽样方法抽样方法 -简单随机抽样简单随机抽样/系统抽样系统抽样问题的提出问题的提出 数理统计是研究如何有效地收集,整理,数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议断或预测,直至为采取决策和行动提供依据和建议的一门学科的一门学科.它是一门应用性很强的学科,凡是有大它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计量数据出现的地方,都要用到数理统计.现在,数理现在,数理统计的内容已异常丰富,成为数学中最活跃的学科统计的内容已异常丰富,成为数学中最活跃的学科之一之一.教科书选择了数理统计中最基本问题来介绍这教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法门学科的思想与方法.数理统计所要解决的问题是如何根据样本来推数理统计所要解决的问题是如何根据样本来推断总体,第一个问题就是断总体,第一个问题就是如何采集样本如何采集样本,只有合理,只有合理科学地采集样本科学地采集样本,然后才能作出客观的统计推断然后才能作出客观的统计推断.阅读课本第阅读课本第55页:一个著名的案例页:一个著名的案例思考:预测结果出错原因在哪里呢?总体:总体:所要考察对象的全体所要考察对象的全体 个体:个体:总体中的每一个考察对象总体中的每一个考察对象 样本:样本:从总体中抽取的一部分个体叫做这个总体的一个样本从总体中抽取的一部分个体叫做这个总体的一个样本 样本容量:样本容量:样本中个体的数目样本中个体的数目 几个概念几个概念课本第课本第55页探究页探究一般地,检查对个体具有破坏性,需要从中抽取一定数量的个体作为检验的样本.如何才能抽取出代表性好的样本呢?注意以下点:注意以下点:(1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;)它是一种不放回抽样;(4)它是一种等概率抽样)它是一种等概率抽样.简简单单随随机机抽抽样样是是在在特特定定总总体体中中抽抽取取样样本本,总总体体中中每每一一个个体体被被抽抽取取的的可可能能性性是是等等同同的的,而而且且任任何何个个体体之之间间彼彼此此被被抽抽取取的的机机会会是是独独立立的的.如如果果用用从从个个体体数数为为N的的总总体体中中抽抽取取一一个个容容量量为为n的的样本,那么每个个体被抽取的概卒等于样本,那么每个个体被抽取的概卒等于 .Nn 一一般般地地,设设一一个个总总体体的的个个体体数数为为N,如如果果通通过过逐逐个个不不放放回回地地抽抽取取的的方方法法从从中中抽抽取取一一个个样样本本,且且每每次次抽抽取取时时各各个个个个体体被抽到的被抽到的概率相等概率相等,就称这样的抽样为,就称这样的抽样为简单随机抽样简单随机抽样.简单随机抽样简单随机抽样随机抽样方法随机抽样方法抽签法抽签法(抓阄法抓阄法)先将总体中的所有个体(共先将总体中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),),并把号码写在形状、大小相同的号签上(并把号码写在形状、大小相同的号签上(号签可号签可以用小球、卡片、纸条等制作),然后将这些号签放在同以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行一个箱子里,进行均匀搅拌均匀搅拌。抽签时,每次从中抽出。抽签时,每次从中抽出1 个个号签,连续抽取号签,连续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。的样本。对个体编号时,也可以利用已有的编号。例如学生的对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。学号,座位号等。抽签法的步骤抽签法的步骤:1、把总体中的、把总体中的N个个体编号;个个体编号;2、把号码写在号签上,将号签放在一个不透明把号码写在号签上,将号签放在一个不透明的容器中搅拌均匀;的容器中搅拌均匀;3、每次从中抽取一个号签,连续抽取、每次从中抽取一个号签,连续抽取n次,就得次,就得到一个容量为到一个容量为n的样本。的样本。例:某单位对口支援西部开发,现从报名的例:某单位对口支援西部开发,现从报名的18名志愿者中选取名志愿者中选取6人组成志愿小组到西藏工作人组成志愿小组到西藏工作3年,请用抽签法设计抽样方案。年,请用抽签法设计抽样方案。第一步:将第一步:将18名志愿者名志愿者编号编号,号码是,号码是01,02,18;第二步:将号码分别写在一张纸上,第二步:将号码分别写在一张纸上,制成号签制成号签;第三步:将得到的号签第三步:将得到的号签放入放入一个一个容器容器中,并中,并充分搅匀充分搅匀;第四步:从容器中第四步:从容器中逐个不放回逐个不放回地地依次抽取依次抽取6个号签,并记个号签,并记录上面的编号;录上面的编号;第五步:所得的号码对应的志愿者就是支援小组的成员。第五步:所得的号码对应的志愿者就是支援小组的成员。抽签法的优缺点抽签法的优缺点:优点:能保证每个个体入选样本的机会都相等优点:能保证每个个体入选样本的机会都相等.缺点:缺点:总体的个数较多时,制作号签的成本增大,费时费力;总体的个数较多时,制作号签的成本增大,费时费力;号签很多时,把它们号签很多时,把它们“搅拌均匀搅拌均匀”比较困难,结果很比较困难,结果很难保证每个个体入样的可能性相等,从而产生坏样本难保证每个个体入样的可能性相等,从而产生坏样本的可能性增加的可能性增加下面举例说明如何用随机数表来抽取样本下面举例说明如何用随机数表来抽取样本为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件产品中抽取件产品中抽取10件进行检查,件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:在利用随机数表抽取这个样本时,可以按下面的步骤进行:第一步,先将第一步,先将40件产品编号,可以编为件产品编号,可以编为00,01,02,38,39。第二步,在附录第二步,在附录1随机数表中任选一个数作为开始,例如从第随机数表中任选一个数作为开始,例如从第8行行第第9列的数列的数5开始,为便于说明,我们将附录开始,为便于说明,我们将附录1中的第中的第6行至第行至第10行行摘录如下摘录如下:16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28随机抽样方法随机抽样方法用随机数表法进行抽取用随机数表法进行抽取第三步,从选定的数第三步,从选定的数5开始向右读下去,得到一个两开始向右读下去,得到一个两位数字号码位数字号码59,由于,由于5939,将它去掉;继续向右,将它去掉;继续向右读,得到读,得到16,将它取出;继续下去,又得到,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,由于它在前面已经取出,将它去掉,再继续下去,得到得到34。至此,。至此,10个样本号码已经取满,于是,所个样本号码已经取满,于是,所要抽取的样本号码是要抽取的样本号码是16191012073938332134随机抽样方法随机抽样方法用随机数表法进行抽取用随机数表法进行抽取随机抽样方法随机抽样方法用随机数表法进行抽取用随机数表法进行抽取(1)随随机机数数表表由由数数字字组组成成,是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证证表表中中的的每每个个位位置置上上的的数数字字是是等等可可能能出现的。出现的。(3)用用随随机机数数表表抽抽取取样样本本,可可以以任任选选一一个个数数作作为为开开始始,读读数数的的方方向向可可以以向向左左,也也可可以以向向右右、向向上上、向向下下等等等等。因因此此并并不是唯一的不是唯一的.(2)用用随随机机数数表表进进行行抽抽样样的的步步骤骤:将将总总体体中中个个体体编编号号;在在随随机机数数表表中中任任选选一一个个数数作作为为开开始始;规规定定读读取取数数字字的的方方向向;开开始始读读取取数数字字,若若不不在在编编号号中中,则则跳跳过过,若若在在编编号号中中则则取取出,依次取下去,直到取满为止;获取样本号码。出,依次取下去,直到取满为止;获取样本号码。(4)由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样样本保证了每个个体被抽取的概率是相等的。本保证了每个个体被抽取的概率是相等的。课本第课本第57页思考:页思考:N100时,分别以时,分别以0,1,3,6为起点对总体编为起点对总体编号,再利用随机数表抽取号,再利用随机数表抽取10个号码,你能说出个号码,你能说出从从0开始对总体编号的好处吗?开始对总体编号的好处吗?随机数法优缺点:随机数法优缺点:节省人力、物力和时间,但产生的样本并不是真正节省人力、物力和时间,但产生的样本并不是真正的简单样本,只是近似程度很高的简单随机样本的简单样本,只是近似程度很高的简单随机样本.将总体中的将总体中的N个个体编号时可以从个个体编号时可以从0开始,例如开始,例如N100时编号可以是时编号可以是00,01,02,99,这样总体中的所有个,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表体均可用两位数字号码表示,便于运用随机数表.为了了解某批零件的长度为了了解某批零件的长度,从中抽查了从中抽查了100个个零件的长度零件的长度,在这个问题中在这个问题中,这这100个零件的长个零件的长度是度是()A.总体总体B.个体个体C.总体的一个样本总体的一个样本D.样本容量样本容量练习练习某校期中考试后某校期中考试后,为了分析该校高一年级为了分析该校高一年级800名学生的学习成绩名学生的学习成绩,从中随机抽取了从中随机抽取了100名学名学生的成绩单生的成绩单,就这个问题来说就这个问题来说,下面说法正确下面说法正确的是的是()A.800名学生是总体名学生是总体B.每名学生是个体每名学生是个体C.每名学生的成绩是所抽取的一个样本每名学生的成绩是所抽取的一个样本D.样本容量样本容量100练习练习关于简单随机抽样的特点关于简单随机抽样的特点,有以下几种说有以下几种说法法,其中不正确的是其中不正确的是()A.要求总体的个体数有限要求总体的个体数有限B.从总体中逐个抽取从总体中逐个抽取C.每个个体被抽到的机会不一样每个个体被抽到的机会不一样D.这是一种不放回的抽样这是一种不放回的抽样练习练习用抽签法进行抽样有以下几个步骤用抽签法进行抽样有以下几个步骤:将总体中的个体编号将总体中的个体编号把号码写在形状、大小相同的号签上把号码写在形状、大小相同的号签上将这些号签放在一个容器内并搅拌均匀将这些号签放在一个容器内并搅拌均匀从这个容器中逐个不放回地抽取号签从这个容器中逐个不放回地抽取号签,将取出号签所对应地个体作为样本将取出号签所对应地个体作为样本这些步骤地先后顺序应该是这些步骤地先后顺序应该是_练习练习下面抽取样本的方式是简单随机抽样吗下面抽取样本的方式是简单随机抽样吗?为什么为什么?A.从无限多个个体中抽取从无限多个个体中抽取50个个体作为样本个个体作为样本B.箱子里共有箱子里共有100个零件个零件,今从中选取今从中选取10个零件进行个零件进行检验检验,在抽样操作时在抽样操作时,从中任意地拿出一个零件进行从中任意地拿出一个零件进行质量检验后质量检验后,再把它放回箱子里再把它放回箱子里C.从从50个个体中一次性抽取个个体中一次性抽取5个个体作为样本个个体作为样本D.某班某班45名同学指定个子最高的名同学指定个子最高的5名同学参加学校名同学参加学校组织的某项活动组织的某项活动练习练习小结小结小结1 1、什么是简单随机抽样?、什么是简单随机抽样?3 3、简单随机抽样的、简单随机抽样的适用范围是什么适用范围是什么?总体的个体数不多总体的个体数不多 一一般般地地,设设一一个个总总体体含含有有N个个个个体体,从从中中逐逐个个不不放放回回地地抽抽取取n个个个个体体作作为为样样本本 ,如如果果每每次次抽抽取取时时总总体体内内的的各各个个个个体体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。2 2、简单随机抽样简单随机抽样有什么特点?有什么特点?(1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;)它是一种不放回抽样;(4)它是一种等可能抽样。)它是一种等可能抽样。解解:(1)对全体学生的数学成绩进行编号对全体学生的数学成绩进行编号:1,2,3,12000.(2)分段分段:由于样本容量与总体容量的比是由于样本容量与总体容量的比是1:100,我们将总体我们将总体平均分为平均分为120个部分个部分,其中每一部分包含其中每一部分包含100个个体个个体.(3)在第一部分即在第一部分即1号到号到100号用简单随机抽样号用简单随机抽样,抽取一个号码抽取一个号码,比如是比如是50.(4)以以50作为起始数作为起始数,然后每间隔然后每间隔100抽取抽取一个号码,这抽取抽取一个号码,这样就得到容量为样就得到容量为120的一个样本的一个样本:50,150,250,350,.11950.提出问题提出问题:为了了解高一年级为了了解高一年级12000名学生的数学成绩名学生的数学成绩,需要抽需要抽 取容量为取容量为120的样本的样本,请用合适的方法抽取请用合适的方法抽取.在总体个数不多情况下,简单随机抽样行之有效。总体个数很多的情况下,在总体个数不多情况下,简单随机抽样行之有效。总体个数很多的情况下,对个体编号的工作量太大,即使使用随机数法操作也不方便快捷对个体编号的工作量太大,即使使用随机数法操作也不方便快捷.为此,为了操作上方面快捷,在不降低样本的代表性的前提下,可采用以为此,为了操作上方面快捷,在不降低样本的代表性的前提下,可采用以下的抽样方法下的抽样方法当当总总体体的的个个数数较较多多时时,将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从每每一一部部分分中中抽抽取取1个个个个体体,得得到到所所需需要要的的样样本,这种抽样称为系统抽样。本,这种抽样称为系统抽样。系统抽样系统抽样(1)当总体容量N比较大时,采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段 的间隔要求相等;(3)是等可能抽样,每个个体被抽到的可能性都是n/N;(4)是不放回抽样。注意以下点:注意以下点:例、为了了解参加某种知识竞赛的例、为了了解参加某种知识竞赛的10031003名学生的成绩,名学生的成绩,打算抽取容量打算抽取容量为为5050的一个样本进行了解。如何采用系统抽样方法完成这一抽样的一个样本进行了解。如何采用系统抽样方法完成这一抽样?解:(解:(1 1)随机将这)随机将这10031003个个体进行编号个个体进行编号1 1,2 2,3 3,1003.1003.(2 2)利用简单随机抽样,先从总体中剔除)利用简单随机抽样,先从总体中剔除3 3个个体(可以随机数表个个体(可以随机数表 法),剩下的个体数法),剩下的个体数10001000通通被通通被5050整除,然后按系统抽样的方整除,然后按系统抽样的方 法进行法进行.问题:问题:如果总体容量如果总体容量N N不能被样本容量不能被样本容量n n整除时该怎么办?整除时该怎么办?答:先从总体中随机地剔除余数(可用随机数表),再按系统答:先从总体中随机地剔除余数(可用随机数表),再按系统抽样方法往下进行。抽样方法往下进行。由于总体中的每个个体被剔除的可能性相等,也就是每个个由于总体中的每个个体被剔除的可能性相等,也就是每个个体不被剔除的可能性也相等,所以在整个抽样过程中每个个体不被剔除的可能性也相等,所以在整个抽样过程中每个个体被抽取的机会仍然都相等。体被抽取的机会仍然都相等。系统抽样系统抽样此时每个被抽到的概率是否一样?此时每个被抽到的概率是否一样?系统抽样的步骤:系统抽样的步骤:(1)先将总体中的先将总体中的N个体编号个体编号.有时可直接利用个体自身所带的号码有时可直接利用个体自身所带的号码.(2)确定分段间隔)确定分段间隔k。对编号均衡地分段,。对编号均衡地分段,是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;l(n-1)k例题例题例例1 填空填空:为了了解某地区参加数学竞赛的为了了解某地区参加数学竞赛的1005名学生的数学成绩名学生的数学成绩,打算从中抽取一个容量为打算从中抽取一个容量为50的样本的样本,现用系统抽样的方法现用系统抽样的方法,需要需要用用 方法先从总体中剔除方法先从总体中剔除 个个体个个体,然后按编然后按编号顺序每间隔号顺序每间隔_个号码抽取一个个号码抽取一个.简单随机抽样简单随机抽样520请归纳系统抽样方法的步骤:请归纳系统抽样方法的步骤:1 编号编号;2 确定组距确定组距k;3 在第一组用简单随机抽样方法确定第一个编号在第一组用简单随机抽样方法确定第一个编号x;4 编号为编号为 x、x+k、x+2k、x+(n-1)k作为样本作为样本.例题例题例例2 某校小礼堂举行心理讲座某校小礼堂举行心理讲座,有有500人参加听课人参加听课,坐坐满小礼堂,现从中选取满小礼堂,现从中选取25名同学了解有关情况名同学了解有关情况,选取选取怎样的抽样方式更为合适怎样的抽样方式更为合适.分析:宜采用系统抽样的方法,请写出具体的操作步骤。分析:宜采用系统抽样的方法,请写出具体的操作步骤。2 把第一组的把第一组的120号写成标签号写成标签,用抽签的方法从中抽出用抽签的方法从中抽出第一个号码第一个号码.设这个号码为设这个号码为x3 号码为号码为 x、x+20、x+40、x+480作为样本作为样本 1 把把500人的座位号按从小到大的顺序平均分成人的座位号按从小到大的顺序平均分成25组组,组距为组距为20 P59 练习1系统抽样与简单随机抽样比较系统抽样与简单随机抽样比较,有何优、缺点?有何优、缺点?1、系统抽样比简单随机抽样更容易实施;2、系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;3、系统抽样比简单随机抽样的应用范围广。小结小结小结小结系统抽样所得样本的代表性与具体编号有关。若编号的个体特征随编号的变系统抽样所得样本的代表性与具体编号有关。若编号的个体特征随编号的变化呈现一定周期性,可能致使样本代表性差。化呈现一定周期性,可能致使样本代表性差。P59 练习3(1)当总体容量当总体容量较小较小,样本容量也,样本容量也较小较小时,制签简单,号时,制签简单,号签容易搅匀,可采用抽签法(也可采用随机数表法);签容易搅匀,可采用抽签法(也可采用随机数表法);(2)当总体容量当总体容量较大较大,样本容量,样本容量较小较小时可用随机数表法;时可用随机数表法;(3)当总体容量当总体容量较大较大,样本容量也,样本容量也较大较大时可用系统抽样法;时可用系统抽样法;共同特点:共同特点:均为不放回抽样,在抽样过程中每一个个体被抽取的机均为不放回抽样,在抽样过程中每一个个体被抽取的机会是相等的。会是相等的。小结小结小结小结系统抽样与简单随机抽样比较系统抽样与简单随机抽样比较,有何优、缺点?有何优、缺点?1、系统抽样比简单随机抽样更容易实施;2、系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;3、系统抽样比简单随机抽样的应用范围广。从总体容量为从总体容量为503的总体中的总体中,用系统抽样的方用系统抽样的方法抽取样本容量为法抽取样本容量为50的样本的样本,抽样距是抽样距是_,首先要剔除的个体数是首先要剔除的个体数是_练习练习某校学术报告厅有某校学术报告厅有25排座位排座位,每排有每排有20个座位个座位,一次心理讲座一次心理讲座,报告厅中坐满了学生报告厅中坐满了学生,会后为了会后为了了解有关情况了解有关情况,留下了座位号为留下了座位号为15的的25名学生名学生进行测试进行测试,这里运用的抽样方法是这里运用的抽样方法是_练习练习