简单随机抽样和系统抽样(使用)PPT.pptx
2.1 随机抽样和系统抽样随机抽样和系统抽样问题问题1 :1 :为了了解全国高中生的视为了了解全国高中生的视力情况,需要将全中国所有高中生力情况,需要将全中国所有高中生逐一进行检查吗?逐一进行检查吗?问题问题2 :2 :要检查某超市销售的牛奶要检查某超市销售的牛奶含菌量是否合格,需要将该超市含菌量是否合格,需要将该超市的所有牛奶的包装袋都打开逐一的所有牛奶的包装袋都打开逐一检查吗?检查吗?容量大!容量大!有破坏性!有破坏性!问题问题3:假设你作为一名食品卫生工作人员,假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎么做?达标检验,你准备怎么做? 将这批小包装饼干放入一个不透明将这批小包装饼干放入一个不透明的袋子中,的袋子中,搅拌均匀搅拌均匀,然后,然后不放回的不放回的摸取(这样可以保证每一袋饼干被抽摸取(这样可以保证每一袋饼干被抽取的机会相等),这样我们就可以得取的机会相等),这样我们就可以得到一个简单随机样本,相应的抽样方到一个简单随机样本,相应的抽样方法就是法就是简单随机抽样。简单随机抽样。 一般地,设一个总体的个体数为一般地,设一个总体的个体数为N,从中,从中逐个逐个不放回不放回地抽取地抽取n个个体作为一个样本,如个个体作为一个样本,如果每次抽取时总体内的各个个体被抽到的机会果每次抽取时总体内的各个个体被抽到的机会相等相等,就称这样的抽样为简单随机抽样。,就称这样的抽样为简单随机抽样。简单随机抽样简单随机抽样n/N问题:每个个体被抽到的几率为多少?问题:每个个体被抽到的几率为多少?说明:说明:(1)被抽取样本的总体的个体数)被抽取样本的总体的个体数有限有限; (2)从总体中)从总体中逐个逐个进行抽取;进行抽取; (3)一种)一种不放回的不放回的抽样;抽样;(4)每个个体能被选入样本的)每个个体能被选入样本的可能性是相同可能性是相同的的。下面的抽样方法是简单随机抽样吗?为什么?下面的抽样方法是简单随机抽样吗?为什么?(1)某班)某班45名同学,指定个子最高的名同学,指定个子最高的5名同学参加名同学参加 学校组织的某项活动;学校组织的某项活动;(2)从)从20个零件中一次性抽出个零件中一次性抽出3个进行质量检验;个进行质量检验;(3)一儿童从玩具箱中的)一儿童从玩具箱中的20件玩具中随意拿出一件玩具中随意拿出一 件来玩,玩后放回再拿下一件,连续玩了件来玩,玩后放回再拿下一件,连续玩了5件。件。 (1)不是不是(2)不是不是(3)不是不是1.1.抽签法抽签法( (抓阄法抓阄法) ) 把总体中的把总体中的N N个个体个个体编号编号,并把号,并把号码写在形状、大小相同的号签上,将码写在形状、大小相同的号签上,将号签放在同一个容器里,号签放在同一个容器里,搅拌均匀搅拌均匀后,后,每次从中抽出每次从中抽出1 1 个号签,连续抽取个号签,连续抽取n n次,次,得到一个容量为得到一个容量为n n的样本。的样本。简单随机抽样简单随机抽样抽抽签签法法开始42名同学从名同学从1到到42编号编号制作制作1到到42个号签个号签将将42个号签搅拌均匀个号签搅拌均匀随机从中抽出随机从中抽出10个签个签对号码一致的学生检查对号码一致的学生检查结束例例1.1.为了解高一(为了解高一(9 9)班)班4242名同学的视力,从中抽名同学的视力,从中抽取取1010名同学进行检查。名同学进行检查。抽签法的一般步骤:抽签法的一般步骤:(1)将总体中的)将总体中的N个个体个个体编号编号(号码从号码从1到到N);(2)将这)将这N个号码个号码写写在形状、大小相同的在形状、大小相同的号签号签上;上;(3)将号签放在同一箱中,并)将号签放在同一箱中,并搅拌均匀搅拌均匀;(4)从箱中每次)从箱中每次抽抽出出1个个号签号签,并记录其编号,并记录其编号,连续抽出连续抽出n次;次;(总体个数(总体个数N,样本容量,样本容量n)思考思考:你认为抽签法有什么优点和缺点?你认为抽签法有什么优点和缺点?优点:抽签法能够保证每个个体入选样优点:抽签法能够保证每个个体入选样本的本的机会都相等,且简单易行。机会都相等,且简单易行。缺点缺点:(1 1)当总体的个数较多时,制作号签当总体的个数较多时,制作号签的的成本成本将会增加。将会增加。(2 2)号签很多时)号签很多时, ,“搅拌均匀搅拌均匀”比较困比较困难难,结果很难保证每个个体入选样本的,结果很难保证每个个体入选样本的可能性相同。可能性相同。简单随机抽样简单随机抽样 2.2.随机数法随机数法利用随机数表、利用随机数表、随机数骰子、随机数骰子、计算机产生的随机数进行抽样。计算机产生的随机数进行抽样。例2:假设我们要考察某公司生产的袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行:先将先将800800袋牛奶编号,可以编为袋牛奶编号,可以编为000,001000,001,799799;在随机数表中任选一个数;在随机数表中任选一个数;从选定的数开始向右从选定的数开始向右( (读数的方向可以是向读数的方向可以是向左,向上,向下等左,向上,向下等) ),得到满足的数将它取出,得到满足的数将它取出,继续向右读,直到样本的继续向右读,直到样本的6060个号码全部取出。个号码全部取出。将总体中的所有个体将总体中的所有个体编号编号(每个号码位数一致);(每个号码位数一致);在随机数表中在随机数表中任选一个数任选一个数作为开始;作为开始;从选定的数开始按从选定的数开始按一定方向一定方向读下去,得到的数码若读下去,得到的数码若不在编号中,则不在编号中,则跳过跳过;若在编号中则;若在编号中则取出取出,得到的数,得到的数码若在前面已经取出,也跳过。如此进行下去,直到码若在前面已经取出,也跳过。如此进行下去,直到取满为止取满为止;根据选定的号码根据选定的号码抽取样本抽取样本。随机数表法抽取样本的步骤:随机数表法抽取样本的步骤:说明: (1). 关于编号:位数相同 (2).关于选首数:随意选取 (3).关于读数:方向事先设定好例例3:高一(9)班有42名学生,学号从01到42,数学老师在上统计课时,应用随机数表法选5名学生,先选定随机数表中第21行第29个数2,得到一个两位数26,然后依次提问,那么被提问的5个学生是_.随机数表的第随机数表的第21行和第行和第22行如下行如下68 34 30 13 70 55 74 30 77 40 44 22 78 84 26 04 33 46 09 52 68 07 97 06 5774 57 25 65 76 59 29 97 68 60 71 91 38 67 54 13 58 18 24 76 15 54 55 95 5226号号04号号33号号09号号07号号问题问题4: 某学校为了了解高一年级学生对教师教某学校为了了解高一年级学生对教师教学的意见,打算从高一年级学的意见,打算从高一年级500名学生中抽取名学生中抽取50名进行调查。除了用简单随机抽样获取样本外,名进行调查。除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?你能否设计其他抽取样本的方法?分析:分析:我们按这样的方法来抽样:首先将这我们按这样的方法来抽样:首先将这名学生从开始进行编号,然后按号码顺序以一定名学生从开始进行编号,然后按号码顺序以一定的间隔进行抽取。由于的间隔进行抽取。由于,这个间隔可以,这个间隔可以定为,即从号码为的第一个间隔中随定为,即从号码为的第一个间隔中随机地抽取一个号码,假如抽到的是号,然后从机地抽取一个号码,假如抽到的是号,然后从第号开始,每隔第号开始,每隔个号码抽取一个,得到个号码抽取一个,得到,。,。这样就得到一个容量为的样本这样就得到一个容量为的样本50050这种抽取方法是这种抽取方法是系统抽样系统抽样。系统抽样系统抽样 当总体不能被样本容量整除时怎么办当总体不能被样本容量整除时怎么办当总体的个体数较多时,采用简单随机抽样当总体的个体数较多时,采用简单随机抽样太麻烦,这时将总体平均分成几个部分,然太麻烦,这时将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方一个个体,得到所需的样本,这样的抽样方法称为法称为系统抽样(等距抽样)系统抽样(等距抽样)。按按照照事事先先确确定定的的规规则则抽抽取取样样本本(通通常常是是将将l加加上上间间隔隔 k k,得得到到第第 2 2个个编编号号l+ +k k, ,第第 3 3 个个编编号号l+ +2 2k k,这这样样继继续续下下去去,直直到到获获取取整整个个样样本本) 系统抽样的步骤:系统抽样的步骤:确定分段的间隔确定分段的间隔k,对编号进行分段。当对编号进行分段。当N/n(N为总为总体中的个体的个数,体中的个体的个数,n为样本容量)是整数时,为样本容量)是整数时,k= N/n;当当N/n不是整数时,不是整数时,通过从总体中剔除一些个体使通过从总体中剔除一些个体使剩下的总体中个体的个数剩下的总体中个体的个数N被被n整除,这时整除,这时k=N/n.例例4 4、某中学有高一学生某中学有高一学生322322名,为了了解学名,为了了解学生的身体状况,要抽取一个容量为生的身体状况,要抽取一个容量为4040的样本,的样本,用系统抽样法如何抽样?用系统抽样法如何抽样?第一步,第一步,随机剔除随机剔除2 2名学生,把余下的名学生,把余下的320320名学生名学生编号为编号为1 1,2 2,3 3,320.320.第四步,第四步,从该号码起,每间隔从该号码起,每间隔8 8个号码抽取个号码抽取1 1个号个号码,就可得到一个容量为码,就可得到一个容量为4040的样本的样本. .第三步,第三步,在第在第1 1部分用抽签法确定起始编号部分用抽签法确定起始编号. .第二步,第二步,把总体分成把总体分成4040个部分,每个部分有个部分,每个部分有8 8个个个体个体. . 说明:说明:(1)适用于总体中适用于总体中个体数较大个体数较大且个体且个体差异不明显差异不明显的情况的情况(2)剔除多余个体及第一段抽样都用简单随机抽样,因)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系而与简单随机抽样有密切联系 (3)是等可能抽样,每个个体被抽到的可能性相等是等可能抽样,每个个体被抽到的可能性相等,为为n/N问题:例例4中每个学生被抽到的概率都是多少?中每个学生被抽到的概率都是多少? 40/322系统抽样与简单随机抽样比较系统抽样与简单随机抽样比较,有何优、有何优、缺点?缺点? (1)系统抽样比简单随机抽样更系统抽样比简单随机抽样更容易实施容易实施,可节可节约抽样成本约抽样成本; (2)系统抽样的效果会受个体编号的影响系统抽样的效果会受个体编号的影响,而,而简单随机抽样的效果不受个体编号的影响;系简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关统抽样所得样本的代表性和具体的编号有关,而而简单随机抽样所得样本的代表性与个体的编号简单随机抽样所得样本的代表性与个体的编号无关无关. (3)系统抽样比简单随机抽样的系统抽样比简单随机抽样的应用范围更广应用范围更广. 2.从已编号为从已编号为150的的50枚最新研制的某种型号枚最新研制的某种型号的导弹中随机抽取的导弹中随机抽取5枚来进行发射实验,若采用每枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所部分选取的号码间隔一样的系统抽样方法,则所选取选取5枚导弹的编号可能为(枚导弹的编号可能为( )A、5,10,15,20,25 B、3,13,23,33,43C、1,2,3,4,5 D、2,4,6,16,32B 1.为了了解某地区参加数学竞赛的为了了解某地区参加数学竞赛的1005名学生名学生的数学成绩的数学成绩,打算从中抽取一个容量为打算从中抽取一个容量为50的样本的样本,现用系统抽样的方法现用系统抽样的方法,需要需要_方法先方法先从总体中剔除从总体中剔除_ 个个体个个体,然后按编号顺序每间然后按编号顺序每间隔隔_个号码抽取一个个号码抽取一个.简单随机抽样520 3.以下最适合用简单随机抽样方法抽样的是以下最适合用简单随机抽样方法抽样的是 ( ) A. 某电影有某电影有32排座位,每排有排座位,每排有40个座位,座位号从个座位,座位号从140,有一次报告会坐满了报告会结束以后听取观众,有一次报告会坐满了报告会结束以后听取观众的意见,要留下的意见,要留下32名观众进行座谈;名观众进行座谈; B. 从十台冰箱中抽取从十台冰箱中抽取3台进行质量检验;台进行质量检验; C. 某学校有在编人员某学校有在编人员160人,其中行政人员人,其中行政人员16人,教人,教师师112人,后勤人员人,后勤人员32人人.教育部门为了解大家对学校教育部门为了解大家对学校机构改革的意见,要从中抽取容量为机构改革的意见,要从中抽取容量为20的样本;的样本; D. 某乡农田有山地某乡农田有山地8000亩,丘陵亩,丘陵12000亩,平地亩,平地24000亩,洼地亩,洼地4000亩,现抽取农田亩,现抽取农田 480 亩估计全乡亩估计全乡农田平均产量农田平均产量 。B4、某工厂生产产品,用传送带将产品送放下一道工序,、某工厂生产产品,用传送带将产品送放下一道工序,质检人员每隔十分钟在传送带的某一个位置取一件检验,质检人员每隔十分钟在传送带的某一个位置取一件检验,则这种抽样方法是(则这种抽样方法是( )。)。A.抽签法抽签法 B.随机数表法随机数表法C.系统抽样系统抽样 D.其他其他C两种抽样方法比较两种抽样方法比较2.1.3 2.1.3 分层抽样分层抽样 假设某地区有高中生假设某地区有高中生2400人,初中生人,初中生10900人,小学生人,小学生11000人,人,此地教育部门为了了解此地教育部门为了了解本地区中小学的近视情本地区中小学的近视情况及其形成原因,要从况及其形成原因,要从本地区的中小学生中抽本地区的中小学生中抽取取1%的学生进行调查,的学生进行调查,你认为应当怎样抽取样你认为应当怎样抽取样本?本?80604020 0近视率%小学 初中 高中哪些因素影响学生视力?抽样要考虑这些因素吗?哪些因素影响学生视力?抽样要考虑这些因素吗? 1分层抽样的概念分层抽样的概念 在抽样时,将总体分成在抽样时,将总体分成 的层,然后的层,然后按照按照_,从各层,从各层 地抽取一定数地抽取一定数量的个体,将各层取出的个体合在一起作为样量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种本,这种抽样方法是一种分层抽样分层抽样 互不交叉互不交叉一定的比例一定的比例独立独立样本结构总体结构差异明显* *每层样本数量与每层个体数量的比与每层样本数量与每层个体数量的比与样本容量与总体容量的比相等。样本容量与总体容量的比相等。B特点特点:1 1、分层抽样是当总体由、分层抽样是当总体由差异明显差异明显的几部分组成时采的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。样的方法进行抽样。2、分层抽样的分层抽样的优点优点是:使样本具有较强的代表性,是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。样是一种实用、操作性强、应用比较广泛的抽样方法。分层抽样的具体步骤是什么分层抽样的具体步骤是什么? 步骤步骤1:根据已经掌握的信息,将总体根据已经掌握的信息,将总体分成互不相交的层分成互不相交的层步骤步骤2:根据总体的个体数根据总体的个体数N和样本容和样本容量量n计算抽样比计算抽样比k= n/N步骤步骤3:确定每一层应抽取的个体数目确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为并使每一层应抽取的个体数目之和为样本容量样本容量n步骤步骤4:按步骤按步骤3确定的数目在各层中确定的数目在各层中随机抽取个体,合在一起得到容量为随机抽取个体,合在一起得到容量为n样本样本分层分层求比求比定数定数抽样抽样答案答案B知识点三 抽样方法的综合应用 例 3 下列问题中, 最适合用分层抽样抽取样本的是下列问题中, 最适合用分层抽样抽取样本的是( ) A从从 10 名同学中抽取名同学中抽取 3 人参加座谈会人参加座谈会 B某社区有某社区有 500 个家庭,其中高收入的家庭个家庭,其中高收入的家庭 125 个,中个,中等收入的家庭等收入的家庭 280 个,低收入的家庭个,低收入的家庭 95 个,为了了解生个,为了了解生活购买力的某项指标,要从中抽取一个容量为活购买力的某项指标,要从中抽取一个容量为 100 的样的样本本 C从从 1000 名工人中,抽取名工人中,抽取 100 名调查上班途中所用时名调查上班途中所用时间间 D从生产流水线上,抽取样本检查产品质量从生产流水线上,抽取样本检查产品质量 B简单随简单随机抽样机抽样系统系统抽样抽样分层分层抽样抽样抽样过抽样过程中每程中每个个体个个体被抽取被抽取的概率的概率相等相等将总体分成将总体分成均衡几部分,均衡几部分,按规则关联按规则关联抽取抽取将总体分将总体分成几层,成几层,按比例分按比例分层抽取层抽取用简单随用简单随机抽样抽机抽样抽取起始号取起始号码码总体中总体中的个体的个体数较少数较少总体中总体中的个体的个体数较多数较多总体由总体由差异明差异明显的几显的几部分组部分组成成从总体中从总体中逐个不放逐个不放回抽取回抽取用简单随用简单随机抽样或机抽样或系统抽样系统抽样对各层抽对各层抽样样