《抽样方法之分层抽样课件.ppt》由会员分享,可在线阅读,更多相关《抽样方法之分层抽样课件.ppt(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样方法之分层抽样第1页,此课件共16页哦 数理统计是研究如何有效地收集,整理,分析受随机数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问中最活跃的学科
2、之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。题来介绍这门学科的思想与方法。数理统计所要解决的问题是如何根据样本来推断总体,数理统计所要解决的问题是如何根据样本来推断总体,第一个问题就是采集样本,然后才能作统计推断。第一个问题就是采集样本,然后才能作统计推断。第2页,此课件共16页哦注意以下四点:注意以下四点:(1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;)它是一种不放回抽样;(4)它是一种等概率抽样。它是一种等概率抽样。简简单单随随机机抽抽样样是是在在特
3、特定定总总体体中中抽抽取取样样本本,总总体体中中每每一一个个体体被被抽抽取取的的可可能能性性是是等等同同的的,而而且且任任何何个个体体之之间间彼彼此此被被抽抽取取的的机机会会是是独独立立的的。如如果果用用从从个个体体数数为为N的的总总体体中中抽抽取取一个容量为一个容量为n的样本,那么每个个体被抽取的概卒等于的样本,那么每个个体被抽取的概卒等于 一一般般地地,设设一一个个总总体体的的个个体体数数为为N,如如果果通通过过逐逐个个不不放放回回地地抽抽取取的的方方法法从从中中抽抽取取一一个个样样本本,且且每每次次抽抽取取时时各各个个个个体体被被抽抽到的概率相等,就称这样的抽样为简单随机抽样。到的概率相
4、等,就称这样的抽样为简单随机抽样。1、简单随机抽样、简单随机抽样第3页,此课件共16页哦抽签法抽签法 随机抽样的方法:随机抽样的方法:随机数表法随机数表法练习练习:将全班同学按学号编号将全班同学按学号编号,制作相应的卡片号签制作相应的卡片号签,放入同一个箱放入同一个箱子里均匀搅拌子里均匀搅拌,从中抽出从中抽出15个号签个号签,就相应的就相应的15名学生对看足球名学生对看足球比赛的喜爱程度比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。分析并说明整个抽签过程中每个同学被抽到的概率是相等的。调查。分析并说明整个抽签过程中每个同学被抽到的概率
5、是相等的。1、抽签法、抽签法 先将总体中的所有个体(共先将总体中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),并),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出时,每次从中抽出1个号签,连续抽取个号签,连续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号对个体编号时,也可以利用已有的编号。
6、例如学生的学号,座位号等。等。第4页,此课件共16页哦2 2、用随机数表法进行抽取、用随机数表法进行抽取 随随机机抽抽样样并并不不是是随随意意或或随随便便抽抽取取,因因为为随随意意或随便抽取都会带有主观或客观的影响因素或随便抽取都会带有主观或客观的影响因素(1)随随机机数数表表是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证证表表中的每个位置上的数字是等可能出现的。中的每个位置上的数字是等可能出现的。(2)随随机机数数表表并并不不是是唯唯一一的的,因因此此可可以以任任选选一一个个数数作作为为开开始始,读数的方向可以向左,也可以向右、向上、向下等等。读数的方向可以向左
7、,也可以向右、向上、向下等等。(3)用用随随机机数数表表进进行行抽抽样样的的步步骤骤:将将总总体体中中个个体体编编号号;选选定定开开始的数字;获取样本号码。始的数字;获取样本号码。(4)由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样样本本保保证证了被抽取个体的概率是相等的。了被抽取个体的概率是相等的。第5页,此课件共16页哦抽签法抽签法 随机抽样的方法:随机抽样的方法:随机数表法随机数表法练习练习:将全班同学按学号编号将全班同学按学号编号,制作相应的卡片号签制作相应的卡片号签,放入同一个箱放入同一个箱子里均匀搅拌子里均匀搅拌,从中抽出从中抽出15个号签
8、个号签,就相应的就相应的15名学生对看足球比名学生对看足球比赛的喜爱程度赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。查。上述问题中抽取样本的方法用随机数表法来进行!随机数表法来进行!规则规则1:从:从95页表中第页表中第6行第行第5列的两位数开始,依次向下列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并向上读数,读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。以此下去,直到取足样本。第6页,此课件共16页哦(2)要要抽抽样样了了解解某某年年参参加加高高考考考考生生的的语语文文考考试试成成绩绩
9、,我我们们可以可以提出问题提出问题(1)一一个个礼礼堂堂有有30排排座座位位,每每排排有有40个个座座位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听听众众。会会后后为为听听取取意意见见留留下下了了座座位位号号为为20的的30名名听听众众进进行行座座谈谈。这这里里选选用用了了哪哪种种抽抽取取样样本本的的方方法法?写出抽取过程。?写出抽取过程。按照科目分类:文科、理科、艺术、体育和外语五个层次。按照科目分类:文科、理科、艺术、体育和外语五个层次。按照地区分类:大城市、中等城市、城镇、乡镇四个层次。按照地区分类:大城市、中等城市、城镇、乡镇四个层次。按照学校分类:重点、非重点两个层次。按照学校分类
10、:重点、非重点两个层次。第7页,此课件共16页哦 为了了解高一年级为了了解高一年级12000名学生的数学成绩名学生的数学成绩,需要抽取容量需要抽取容量为为120的样本的样本,请用合适的方法抽取请用合适的方法抽取.解解:(1)对全体学生的数学成绩进行编号对全体学生的数学成绩进行编号:1,2,3,12000.(2)分段分段:由于样本容量与总体容量的由于样本容量与总体容量的比是比是1:100,我们将总体我们将总体平均分为平均分为100个部分个部分,其中每一部分包含其中每一部分包含100个个体个个体.(3)在第一部分即在第一部分即1号到号到100号用简单随机抽样号用简单随机抽样,抽取一个号码抽取一个号
11、码,比如是比如是50.(4)以以50作为起始数作为起始数,然后顺序抽取然后顺序抽取150,250,350,.11950.这样这样就得到容量为就得到容量为100的一个样本的一个样本.第8页,此课件共16页哦 由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是,第第1排被抽取前,其他各排中各号码被抽取哪率也是排被抽取前,其他各排中各号码被抽取哪率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简单随机抽样,因此这种,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。抽样的方法是系统抽样。(1)一一个个礼礼堂堂有有30
12、排排座座位位,每每排排有有40个个座座位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听听众众。会会后后为为听听取取意意见见留留下下了了座座位位号号为为20的的30名名听听众众进进行行座座谈谈。这这里里选用了哪种抽取样本的方法?写出抽取过程。选用了哪种抽取样本的方法?写出抽取过程。当当总总体体的的个个数数较较多多时时,采采用用简简单单随随机机抽抽样样太太麻麻烦烦,这这时时将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从每每一一部部分分中中抽抽取取1个个个体,得到所需要的样本,这种抽样称为系统抽样。个体,得到所需要的样本,这种抽样称为系统抽样。2系统抽样
13、系统抽样第9页,此课件共16页哦系统抽样的步骤为:系统抽样的步骤为:(1)先将总体中的先将总体中的N个体编号个体编号.有时可直接利用个体自身所带的号码有时可直接利用个体自身所带的号码.(2)确定分段间隔)确定分段间隔k。对编号均衡地分段,。对编号均衡地分段,是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk 系系统统抽抽样样时时,将将总总体体中中的的个个体体均均分分后后的的每每一一段
14、段进进行行抽抽样样时时,采采用用简简单单随随机机抽抽样样;系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是是相相等等的的;如如总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随随机机抽抽样样从从总总体体中中剔剔除除几几个个个个体体,然然后后再再按按系系统统抽抽样样进进行行。需需要要说说明明的的是是整整个个抽抽样样过过程程中中每每个个个个体被抽到的概率仍然相等。体被抽到的概率仍然相等。第10页,此课件共16页哦 系统抽样与简单随机抽样比较系统抽样与简单随机抽样比较,有有何优、缺点?何优、缺点?1、系统抽样比
15、简单随机抽样更容易实施;2、系统抽样的效果会受个体编号的影 响,而简单随机抽样的效果不受个体编号的影响;3、系统抽样比简单随机抽样的应用范围广。第11页,此课件共16页哦3分层抽样分层抽样 当当已已知知总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本充充分分地地反反映映总总体体的的情情况况,常常将将总总体体分分成成几几部部分分,然然后后按按照照各各部部分分所所占占的的比比例例进进行行抽抽样。其中所分成的各部分叫做层。样。其中所分成的各部分叫做层。由由于于分分层层抽抽样样的的要要求求不不同同,各各层层的的抽抽样样的的样样本本容容量量也也不不相相同同,所所以以,应应当
16、当按按照照实实际际情情况况,合合理理地地将将样样本本容容量量分分配配到到各各个个层层,以以确确保保抽抽样样的的合合理性,研究时可以根据不同的要求来分层抽样。理性,研究时可以根据不同的要求来分层抽样。分分层层抽抽样样适适用用于于总总体体由由差差异异明明显显的的几几部部分分组组成成的的情情况况,每每一一部部分分称称为为层层,在在每每一一层层中中实实行行简简单单随随机机抽抽样样。这这种种方方法法较较充充分分地地利用了总体己有信息,是一种实用、操作性强的方法。利用了总体己有信息,是一种实用、操作性强的方法。分分层层抽抽样样的的一一个个重重要要问问题题是是一一个个总总体体如如何何分分层层。分分层层抽抽样
17、样中中分分多多少少层层,要要视视具具体体情情况况而而定定。总总的的原原则则是是:层层内内样样本本的的差差异异要要小小,而而层层与与层层之之间的差异尽可能地大,否则将失去分层的意义。间的差异尽可能地大,否则将失去分层的意义。第12页,此课件共16页哦例例2、一一个个单单位位的的职职工工有有500人人,其其中中不不到到35岁岁的的有有125人人,3549岁岁的的有有280人人,50岁岁以以上上的的有有95人人。为为了了了了解解该该单单位位职职工工年年龄龄与与身身体体状状况况的有关指标,从中抽取的有关指标,从中抽取100名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取?分分析析:这这总总体
18、体具具有有某某些些特特征征,它它可可以以分分成成几几个个不不同同的的部部分分:不不到到35岁岁;3549岁岁;50岁岁以以上上,把把每每一一部部分分称称为为一一个个层层,因因此此该该总总体体可可以以分分为为3个个层层。由由于于抽抽取取的的样样本本为为100,所所以以必必须须确确定定每每一一层的比例,在每一个层中实行简单随机抽样。层的比例,在每一个层中实行简单随机抽样。解解:抽抽取取人人数数与与职职工工总总数数的的比比是是100:5001:5,则则各各年年龄龄段段(层层)的的职职工工人人数数依依次次是是125:280:9525:56:19,然然后后分分别别在各年龄段(层)运用简单随机抽样方法抽取
19、。在各年龄段(层)运用简单随机抽样方法抽取。答答:在在分分层层抽抽样样时时,不不到到35岁岁、3549岁岁、50岁岁以以上上的的三三个个年年龄龄段分别抽取段分别抽取25人、人、56人和人和19人。人。第13页,此课件共16页哦分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。第14页,此课件共16页哦4三种抽样方法的比较三种抽样方法的比较 第15页,此课件共16页哦 一个电视台在因特网上就观众对其某一节目的喜爱程度进行一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为调查,参加调查的总人数为12000人,其中持各种态度的人数如人,其中持各种态度的人数如下所示:下所示:很喜爱很喜爱喜爱喜爱一般一般不喜爱不喜爱2400420038001600打算从中抽取打算从中抽取60人进行详细调查,如何抽取?人进行详细调查,如何抽取?5 5课堂练习课堂练习 6、布置作业、布置作业教科书习题21第4、5、6题。第16页,此课件共16页哦
限制150内