《分层抽样方法概述ppt课件.ppt》由会员分享,可在线阅读,更多相关《分层抽样方法概述ppt课件.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、复习回顾:复习回顾:1 1、简单随机抽样的概念、简单随机抽样的概念: :2 2、简单随机抽样的特点、简单随机抽样的特点: :3 3、简单随机抽样的常用方法:、简单随机抽样的常用方法:机会均等抽样机会均等抽样. . 不放回抽样;不放回抽样;逐个进行抽取;逐个进行抽取;抽签法;抽签法; 随机数表法随机数表法. . 设一个总体含有有限个个体,并记其个体数为设一个总体含有有限个个体,并记其个体数为N如果通过逐个抽取的方法从中抽取一个样本,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为样的抽样为简单随机抽样简单随
2、机抽样. . 某校有学生某校有学生1200人人,为了调查某种情况打算抽取一个为了调查某种情况打算抽取一个样本容量为样本容量为50的样本的样本,问此样本将如何获得最好?问此样本将如何获得最好?用系统抽样法如何抽取?简述抽样过程用系统抽样法如何抽取?简述抽样过程.解:适宜选用系统抽样,抽样过程如下:解:适宜选用系统抽样,抽样过程如下:随机地将这随机地将这12001200名学生编号为名学生编号为1,2,31,2,3,,1200,1200将总体按编号顺序均分成将总体按编号顺序均分成5050部分部分, ,每部分包括每部分包括2424个个个体个体在第一部分的个体编号在第一部分的个体编号1 1,2 2,3
3、3,2424中,利用中,利用简单随机抽样抽取一个号码,比如是简单随机抽样抽取一个号码,比如是1818以以1818为起始号码为起始号码, ,每间隔每间隔2424抽取一个号码抽取一个号码, ,这样得这样得到一个容量为到一个容量为5050的样本的样本:18,42,66,:18,42,66,982,982,10021002基础训练:基础训练: 探究?探究?假设某地区有高中生假设某地区有高中生2400人人,初中生初中生10900人人,小学生小学生11000人人,此地教育部门为此地教育部门为了了解本地区中小学的近了了解本地区中小学的近视情况及其形成原因视情况及其形成原因,要从要从本地区的小学生中抽取本地区
4、的小学生中抽取1%的学生进行调查的学生进行调查,你认为应你认为应当怎样抽取样本?当怎样抽取样本?80604020 0近视率近视率%小学小学 初中初中 高中高中你认为哪些因素影响学生视力?抽样要考虑哪些因素?你认为哪些因素影响学生视力?抽样要考虑哪些因素?一、分层抽样的定义。一、分层抽样的定义。 一般地一般地,在抽样时在抽样时,将总体分成互不交叉的层将总体分成互不交叉的层,然后按照一然后按照一定的比例定的比例,从各层独立地抽取一定数量的个体从各层独立地抽取一定数量的个体,将各层取出将各层取出的个体合在一起作为样本的个体合在一起作为样本,这种抽样的方法叫分层抽样。这种抽样的方法叫分层抽样。应用分层
5、抽样应遵循以下要求:应用分层抽样应遵循以下要求:(1)(1)分层分层: :将相似的个体归入一类将相似的个体归入一类, ,即为一层即为一层, ,分层要求每分层要求每层的各个个体互不交叉层的各个个体互不交叉, ,即遵循不重复、不遗漏的原则。即遵循不重复、不遗漏的原则。(2)(2)分层抽样为保证每个个体等可能入样需遵循在各层中分层抽样为保证每个个体等可能入样需遵循在各层中进行简单随机抽样进行简单随机抽样, ,每层样本数量与每层个体数量的比与每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。这层个体数量与总体容量的比相等。二、分层抽样的步骤:二、分层抽样的步骤:(1)按某种特征将总体分成
6、互不相交的层按某种特征将总体分成互不相交的层(2)计算各层的个体数与总体的个数的比;按比例计算各层的个体数与总体的个数的比;按比例k=n/N确定每层抽取个体的个数确定每层抽取个体的个数(n/N)*Ni个个,对于不能取对于不能取整的数整的数,求其近似值求其近似值(调节样本容量调节样本容量,剔除个体剔除个体) ,各层的抽各层的抽取数之和应等于样本容量取数之和应等于样本容量.(3)各层分别按简单随机抽样或系统抽样的方法抽取。各层分别按简单随机抽样或系统抽样的方法抽取。(4)综合每层抽样合在一起得到容量为综合每层抽样合在一起得到容量为n的样本。的样本。 (1)分层抽样法适用于总体中个体分层抽样法适用于
7、总体中个体差异明显差异明显的几的几部分组成的部分组成的抽样抽样,每一部分称为层每一部分称为层,在每一层中实行在每一层中实行简单随机抽样简单随机抽样或系统抽样或系统抽样.分层抽样是建立在简单随分层抽样是建立在简单随机抽样或系统抽样的基础上的机抽样或系统抽样的基础上的,这种方法这种方法由于它由于它充分充分地利用了总体己有信息地利用了总体己有信息,是一种实用、操作性强的方是一种实用、操作性强的方法法,而且更具代表性而且更具代表性,在实践的应用更为广泛在实践的应用更为广泛. (2)分层抽样的一个重要问题是总体如何分层分层抽样的一个重要问题是总体如何分层,分多少分多少层层,这要视具体情况而定。总的原则是
8、这要视具体情况而定。总的原则是:层内样本的差异层内样本的差异要小要小,而层与层之间的差异尽可能地大而层与层之间的差异尽可能地大,分层是按总体中分层是按总体中个体的明显差异进行分类个体的明显差异进行分类,否则将失去分层的意义。否则将失去分层的意义。注: (3)分层抽样是等概率抽样)分层抽样是等概率抽样,它也是公平的它也是公平的.分层分层抽样是按各层中个体在总体中所占的比例确定抽样是按各层中个体在总体中所占的比例确定, 用分用分层抽样从个体数为层抽样从个体数为N的总体中抽取一个容量为的总体中抽取一个容量为n的样的样本时本时,在整个抽样过程中每个个体被抽到的概率相等在整个抽样过程中每个个体被抽到的概
9、率相等,都等于都等于 nN假设某地区有高中生假设某地区有高中生2400人人,初中生初中生10900人人,小学生小学生11000人人,此地教此地教育部门为了了解本地区育部门为了了解本地区中小学的近视情况及其中小学的近视情况及其形成原因形成原因,要从本地区的要从本地区的小学生中抽取小学生中抽取1%的学生的学生进行调查进行调查,你认为应当怎你认为应当怎样抽取样本?样抽取样本?80604020 0近视率近视率%小学小学 初中初中 高中高中样本容量与总体个数的比例为样本容量与总体个数的比例为1:1001:100,则,则高中应抽取人数为高中应抽取人数为240024001/100=241/100=24人人,
10、 ,初中应抽取人数为初中应抽取人数为10800108001/100=1081/100=108人,人,小学应抽取人数为小学应抽取人数为11100111001/100=1111/100=111人人. .假设某地区有高中生假设某地区有高中生2400人,人,初中生初中生10900人人,小学生小学生11000人人,此地教育部门为了了解本地此地教育部门为了了解本地区中小学的近视情况及其形成区中小学的近视情况及其形成原因原因,要从本地区的小学生中抽要从本地区的小学生中抽取取1%的学生进行调查,你认为的学生进行调查,你认为应当怎样抽取样本?应当怎样抽取样本?80604020 0近视率近视率%小学小学 初中初中
11、 高中高中样本容量与总体个数的比例为样本容量与总体个数的比例为1:1001:100,则,则高中应抽取人数为高中应抽取人数为240024001/100=241/100=24人人, ,初中应抽取人数为初中应抽取人数为10800108001/100=1081/100=108人,人,小学应抽取人数为小学应抽取人数为11100111001/100=1111/100=111人人. .思考:具体在三类学生中抽取样本时(如在思考:具体在三类学生中抽取样本时(如在1080010800名初中名初中生中抽取生中抽取108108人人),),可以用哪种抽样方法进行抽样?可以用哪种抽样方法进行抽样?思考思考: :在上述抽
12、样过程中在上述抽样过程中, ,每个学生被抽到的概率相等吗?每个学生被抽到的概率相等吗?例例1 1、某高中共有某高中共有900900人人. .其中高一年级其中高一年级300300人人. .高二高二年级年级200200人人. .高三年级高三年级400400人人. .现采用分层抽样抽取容量现采用分层抽样抽取容量为为4545的样本的样本. .那么高一、高二、高三各年级抽取的人那么高一、高二、高三各年级抽取的人数分别为(数分别为( )A.15,5,25 B.15,15,15A.15,5,25 B.15,15,15C.10,5,30 D15,10,20C.10,5,30 D15,10,20 练习:练习:分
13、层抽样又称类型抽样分层抽样又称类型抽样,即将相似的个体归即将相似的个体归入一类入一类(层层),然后每层抽取若干个体构成样本然后每层抽取若干个体构成样本,所以分所以分层抽样为保证每个个体等可能入样层抽样为保证每个个体等可能入样,必须进行必须进行 ( ) A、每层等可能抽样、每层等可能抽样 B、每层不等可能抽样、每层不等可能抽样 C、所有层按同一抽样比等可能抽样、所有层按同一抽样比等可能抽样D解:解:因为疾病与地理位置和水土均有关系,所以不因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:法,具体过
14、程如下:(1 1)将)将3 3万人分为万人分为5 5层,其中一个乡镇为一层。层,其中一个乡镇为一层。 (2)(2)按照样本容量的比例随机抽取各乡镇应抽取的按照样本容量的比例随机抽取各乡镇应抽取的样本。样本。3003003/15=60(3/15=60(人人),300),3002/15=100(2/15=100(人人), ), 3003002/15=40(2/15=40(人人),300),3002/15=60(2/15=60(人人),),因此各乡镇抽因此各乡镇抽取人数分别为取人数分别为6060人、人、4040人、人、100100人、人、4040人、人、60 60 人。人。(3 3)将)将30030
15、0人组到一起,即得到一个样本。人组到一起,即得到一个样本。 例例2 2:一个地区共有一个地区共有5 5个乡镇个乡镇, ,人口人口3 3万人万人, ,其中其中人口比例为人口比例为3:2:5:2:3,3:2:5:2:3,从从3 3万人中抽取一个万人中抽取一个300300人人的样本的样本, ,分析某种疾病的发病率分析某种疾病的发病率, ,已知这种疾病与已知这种疾病与不同的地理位置及水土有关不同的地理位置及水土有关, ,问应采取什么样的方问应采取什么样的方法?并写出具体过程。法?并写出具体过程。例例3、一个单位的职工有、一个单位的职工有500人人,其中不到其中不到35岁的有岁的有125人人,3549岁
16、的有岁的有280人人,50岁以上的有岁以上的有95人。为了人。为了了解该单位职工年龄与身体状况的有关指标了解该单位职工年龄与身体状况的有关指标,从中抽从中抽取取100名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取? 分析:根据总体具有某些特征分析:根据总体具有某些特征,它可以分成几它可以分成几个不同的部分个不同的部分:不到不到35岁岁;3549岁岁;50岁以上岁以上,把把每一部分称为一个层每一部分称为一个层,因此该总体可以分为因此该总体可以分为3个层个层.由于抽取的样本为由于抽取的样本为100,所以必须确定每一层的比所以必须确定每一层的比例例,在每一个层中实行简单随机抽样。在每一个
17、层中实行简单随机抽样。 解解:抽取人数与职工总数的比是抽取人数与职工总数的比是100:5001:5,则各年则各年龄段龄段(层层)的职工人数依次是的职工人数依次是125:280:9525:56:19,然后然后分别在各年龄段分别在各年龄段(层层)运用简单随机抽样方法抽取。运用简单随机抽样方法抽取。答:在分层抽样时答:在分层抽样时,不到不到35岁、岁、3549岁、岁、50岁以上的岁以上的三个年龄段分别抽取三个年龄段分别抽取25人、人、56人和人和19人。人。比较简单随机抽样、系统抽样、分层抽样的优点、缺比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围点及适用范围类类 别别 简简 单单随随
18、机机抽抽 样样 系系 统统抽抽 样样 分分 层层抽抽 样样 ( (1)抽样过抽样过程 中 每 个程 中 每 个个 体 被 抽个 体 被 抽到 的 可 能到 的 可 能性相等性相等( (2)每次抽每次抽出个体后出个体后不再将它不再将它放回放回, ,即不即不放回抽样放回抽样 共同点共同点 各自特点各自特点 从总体中从总体中逐个抽取逐个抽取 将总体均分成将总体均分成几部分几部分, ,按预按预先制定的规则先制定的规则在各部分抽取在各部分抽取 将总体分成将总体分成几层几层, ,分层分层进行抽取进行抽取 联联 系系 在起始部分在起始部分样时采用简样时采用简随机抽样随机抽样 分层抽样时分层抽样时采用简单随采
19、用简单随机抽样或系机抽样或系统抽样统抽样 适适 用范用范 围围 总体个总体个数较少数较少 总体个总体个数较多数较多 总体由差总体由差异明显的异明显的几部分组几部分组成成 (1)分层抽样中,在每一层进行抽样)分层抽样中,在每一层进行抽样可用可用 .简单随机抽样或系统抽样简单随机抽样或系统抽样(2)教育局督学组到学校检查工作教育局督学组到学校检查工作,临时在每个班各抽临时在每个班各抽调调2人参加座谈;人参加座谈;某班期中考试有某班期中考试有15人在人在85分以上分以上,40人在人在60-84分分,1人不及格人不及格.现欲从中抽出现欲从中抽出8人研讨进一步改人研讨进一步改进教和学;进教和学;某班元旦
20、聚会,要产生两名某班元旦聚会,要产生两名“幸运者幸运者”.对对这三件事,合适的抽样方法为这三件事,合适的抽样方法为( ) A.分层抽样,分层抽样,简单随机抽样分层抽样,分层抽样,简单随机抽样B. 系统抽样,系统抽样,简单随机抽样系统抽样,系统抽样,简单随机抽样C. 分层抽样分层抽样,简单随机抽样简单随机抽样,简单随机抽样简单随机抽样D. 系统抽样,分层抽样,简单随机抽样系统抽样,分层抽样,简单随机抽样 D3、某单位有老年人某单位有老年人28人人, ,中年人中年人54人人, ,青年人青年人81人人, ,为为了调查他们的身体情况了调查他们的身体情况, ,需从他们中抽取一个容量为需从他们中抽取一个容
21、量为36的样本,则适合的抽取方法是的样本,则适合的抽取方法是 ( )A简单随机抽样简单随机抽样 B系统抽样系统抽样 C分层抽样分层抽样 D先从老人中剔除先从老人中剔除1人,然后再分层抽样人,然后再分层抽样4、某校有某校有500名学生,其中名学生,其中O型血的有型血的有200人人, ,A型血型血的人有的人有125人人, ,B型血的有型血的有125人人, ,AB型血的有型血的有50人人, ,为了为了研究血型与色弱的关系研究血型与色弱的关系, ,要从中抽取一个要从中抽取一个20人的样本,人的样本,按分层抽样,按分层抽样,O型血应抽取的人数为型血应抽取的人数为 人,人,A型血应型血应抽取的人数为抽取的
22、人数为 人,人,B型血应抽取的人数为型血应抽取的人数为 人,人,AB型血应抽取的人数为型血应抽取的人数为 人。人。5.在在100个零件中个零件中,有一级品有一级品20个个,二级品二级品30个个,三级品三级品50个个,从从中抽取中抽取20个作为样本个作为样本,有以下三种抽样方法:有以下三种抽样方法:采用随机抽样法,将零件编号为采用随机抽样法,将零件编号为00,01,02,99,抽,抽签取出签取出20个;个;采用系统抽样法,将所有零件分成采用系统抽样法,将所有零件分成20组,每组组,每组5个,然后个,然后每组随机抽取每组随机抽取1个;个;采用分层抽样法,从一级品中随机抽取采用分层抽样法,从一级品中
23、随机抽取4个,从二级品中个,从二级品中随机抽取随机抽取6个,从三级品中随机抽取个,从三级品中随机抽取10个。则下述判断中个。则下述判断中正确的是(正确的是( )A.不论采用何种抽样方法不论采用何种抽样方法,这这100个零件中每个被抽到的可能个零件中每个被抽到的可能性均为性均为1/5B. 两种抽样方法,这两种抽样方法,这100个零件中每个被抽到的可能性个零件中每个被抽到的可能性均为均为1/5 ;并非如此并非如此C. 两种抽样方法,这两种抽样方法,这100个零件中每个被抽到的可能性个零件中每个被抽到的可能性均为均为1/5 ;并非如此并非如此D.采用不同的抽样方法,这采用不同的抽样方法,这100个零
24、件中每个被抽到的可能个零件中每个被抽到的可能性是各不相同的性是各不相同的A3、某中学高一年级有学生某中学高一年级有学生600人,高二年级有学生人,高二年级有学生450人,高三年级有学生人,高三年级有学生750人,若该校取一个容量为人,若该校取一个容量为n的样本,每个学生被抽到的可能性均为的样本,每个学生被抽到的可能性均为0.2, 则则n= 。4、对某单位对某单位1000名职工进行某项专门调查,调查的名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:项目与职工任职年限有关,人事部门提供了如下资料:任职年限任职年限5年以下年以下5年至年至10年年10年以上年以上人数人数
25、300500200试利用上述资料设计一个抽样比为试利用上述资料设计一个抽样比为1/10的抽样方法。的抽样方法。课堂小结课堂小结 1 1、分层抽样是当总体由差异明显的几部分组成时采分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用为了保证每个
26、个体等可能入样,所有层应采用同一抽样比等可能抽样。同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。样的方法进行抽样。2、分层抽样的优点是:使样本具有较强的代表性,分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。样是一种实用、操作性强、应用比较广泛的抽样方法。作业:作业:P64P64习题习题2.1A2.1A组:组:5 5,6.6.6.一工厂生产了某种产品一工厂生产了某种产品16 80
27、0件,它们来自甲、乙、件,它们来自甲、乙、丙丙3条生产线。为检查这批产品的质量,决定采用条生产线。为检查这批产品的质量,决定采用分层抽样的方法进行抽样,已知从甲、乙、丙分层抽样的方法进行抽样,已知从甲、乙、丙3条条生产线抽取的个体数,组成一个等差数列,则乙生生产线抽取的个体数,组成一个等差数列,则乙生产线生产了产线生产了_件产品。件产品。5600二、基础训练:二、基础训练: 2. 2.欲从本班欲从本班7777名学生中随机抽取名学生中随机抽取7 7名学生参名学生参加数学的基本知识竞赛,试用随机表法确定这加数学的基本知识竞赛,试用随机表法确定这7 7名名学生学生. . 1. 1.中央电视台要从春节联欢晚会的中央电视台要从春节联欢晚会的6060名热名热心观众中随机抽出心观众中随机抽出4 4名幸运观众,试用抽签法名幸运观众,试用抽签法为其设计产生这为其设计产生这4 4名幸运观众的过程名幸运观众的过程. .抽签法抽签法编号、标签、搅拌、抽取,关键是编号、标签、搅拌、抽取,关键是 “搅拌搅拌”后的随机性;后的随机性;随机数表法随机数表法编号、选数、取号、抽取,其中编号、选数、取号、抽取,其中 取号的方向具有任意性取号的方向具有任意性.评点:评点:
限制150内