分层抽样与系统抽样-高中数学必修四课件.ppt
简单随机抽样的概念简单随机抽样的概念从个体数为从个体数为N的总体中不重复地取出的总体中不重复地取出n个个体个个体(nN),每个个体都有相同的机会被取到,这样),每个个体都有相同的机会被取到,这样的抽样方法称为简单随机抽样,每个个体被抽到的的抽样方法称为简单随机抽样,每个个体被抽到的可能均为可能均为n/N。适用范围:总体中个体数较少的情况,抽取的样本适用范围:总体中个体数较少的情况,抽取的样本容量也较小时容量也较小时。知识链接知识链接用抽签法抽取样本的步骤:用抽签法抽取样本的步骤:简记为:简记为:简记为:简记为:编号;制签;搅匀;抽签;取个体。编号;制签;搅匀;抽签;取个体。编号;制签;搅匀;抽签;取个体。编号;制签;搅匀;抽签;取个体。用随机数表法抽取样本的步骤:用随机数表法抽取样本的步骤:简记为:简记为:简记为:简记为:编号;选数;读数;取个体。编号;选数;读数;取个体。编号;选数;读数;取个体。编号;选数;读数;取个体。练习:练习:1 1、简单随机抽样包括、简单随机抽样包括_和和_._.抽签法抽签法随机数表法随机数表法2 2、在简单随机抽样中,某一个个体被抽到的可、在简单随机抽样中,某一个个体被抽到的可能性是(能性是()。)。A.A.与第几次抽样有关与第几次抽样有关,第一次抽的可能性最大第一次抽的可能性最大B.B.与第几次抽样有关与第几次抽样有关,第一次抽的可能性最小第一次抽的可能性最小C.C.与第几次抽样无关与第几次抽样无关,每次抽到的可能性相等每次抽到的可能性相等D.D.与第几次抽样无关与第几次抽样无关,与抽取几个样本无关与抽取几个样本无关C C 上述抽样中,每个个体被抽中的概率是上述抽样中,每个个体被抽中的概率是否一样?否一样?答:在上面的抽样中,由于在第一部分(编号为答:在上面的抽样中,由于在第一部分(编号为120120)中的起始号码是随机确定的,每个号码被抽取的概率都中的起始号码是随机确定的,每个号码被抽取的概率都等于等于 ,所以在抽取第,所以在抽取第1 1部分的个体前,其他各部分中部分的个体前,其他各部分中每个号码被抽取的概率也都是每个号码被抽取的概率也都是 。就是说,在这个系统。就是说,在这个系统抽样中,每个个体被抽取的概率都是抽样中,每个个体被抽取的概率都是 。当总体的个体数较多时,采用简单随机当总体的个体数较多时,采用简单随机抽样太麻烦,这时将总体平均分成几个部分,抽样太麻烦,这时将总体平均分成几个部分,然后按照然后按照预先定出的规则预先定出的规则,从每个部分中抽,从每个部分中抽取一个个体,得到所需的样本,这样的抽样取一个个体,得到所需的样本,这样的抽样方法称为方法称为系统抽样(等距抽样)系统抽样(等距抽样)。一、系统抽样1 1、系统抽样的定义、系统抽样的定义2 2、系统抽样的特点:、系统抽样的特点:(1 1)用系统抽样抽取样本时,每个个体被抽)用系统抽样抽取样本时,每个个体被抽到的可能性是相等的,到的可能性是相等的,(2 2)系统抽样适用于总体中个体数较多,抽取样)系统抽样适用于总体中个体数较多,抽取样 本容量也较大时;本容量也较大时;(3 3)系统抽样是不放回抽样。)系统抽样是不放回抽样。个体被抽取的概率等于个体被抽取的概率等于 情景设置情景设置情景设置情景设置情景设置情景设置练习练习为了了解参加某种知识竞赛为了了解参加某种知识竞赛的的10031003名学生的成绩,应采用什么样名学生的成绩,应采用什么样的抽样方法恰当?的抽样方法恰当?解:(解:(1 1)随机将这)随机将这10031003个个体进行编号个个体进行编号1 1,2 2,3 3,10031003。(2 2)利用简单随机抽样,先从总体中剔除)利用简单随机抽样,先从总体中剔除3 3个个个体(可以随机数表法),剩下的个体数个体(可以随机数表法),剩下的个体数10001000通通通通被被5050整除,然后按系统抽样的方法进行。整除,然后按系统抽样的方法进行。问题问题2 2 如果个体总数不能被样本容量整除时该怎么办?如果个体总数不能被样本容量整除时该怎么办?答:先从总体中随机地剔除余数(可用随机数表),答:先从总体中随机地剔除余数(可用随机数表),再按系统抽样方法往下进行。(每个被抽到的概率是再按系统抽样方法往下进行。(每个被抽到的概率是否一样?)否一样?)情景设置情景设置情景设置情景设置情景设置情景设置讨论:在这整个抽样过程中每个个体被讨论:在这整个抽样过程中每个个体被抽取的概率是否相等?抽取的概率是否相等?1 1、总体中的每个个体被剔除的概率是相等的、总体中的每个个体被剔除的概率是相等的 ,2 2、也就是每个个体不被剔除的概率相等、也就是每个个体不被剔除的概率相等 ;3 3、采用系统抽样时每个个体被抽取的概率都是、采用系统抽样时每个个体被抽取的概率都是 ;4 4、在整个抽样过程中每个个体被抽取的概率仍、在整个抽样过程中每个个体被抽取的概率仍相等,都是相等,都是 。例例2 2一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。人。为了了解这个单位职工与身体状况有关的某项指为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为标,要从中抽取一个容量为100100的样本。由于职工的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取年龄与这项指标有关,试问:应用什么方法抽取?能在?能在500500人中任意取人中任意取100100个吗?能将个吗?能将100100个份额均个份额均分到这三部分中吗?分到这三部分中吗?分析:考察对象的特点是由具有明显差异的几部分析:考察对象的特点是由具有明显差异的几部分组成。分组成。二、分层抽样 当已知总体由当已知总体由差异明显差异明显的几部分组的几部分组成时,为了使样本更充分地反映总体的成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按情况,常将总体分成几个部分,然后按照照各部分所占的比例各部分所占的比例进行抽样,这种抽进行抽样,这种抽样叫做样叫做“分层抽样分层抽样”,其中所分成的各,其中所分成的各部分叫做部分叫做“层层”。1 1、分层抽样的定义、分层抽样的定义(1 1)分层抽样是等概率抽样,它也是公平的。用分)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为层抽样从个体为N N的总体中抽取一个容量为的总体中抽取一个容量为n n的样本的样本时,在整个抽样过程中每个个体被抽到的概率相等时,在整个抽样过程中每个个体被抽到的概率相等 为为n/Nn/N。(2 2)分层抽样是建立在简单随机抽样或系统抽样)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。获取的样本更具代表性,在实用中更为广泛。2 2、分层抽样的特点、分层抽样的特点 一个电视台在因特网上就观众对其一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查某一节目的喜爱程度进行调查,参加调查的总人数为的总人数为1200012000人,其中持各种态度的人人,其中持各种态度的人数如下所示:数如下所示:很喜爱很喜爱 喜爱喜爱 一般一般 不喜爱不喜爱2400 4200 3800 1600打算从中抽取打算从中抽取6060人进行详细调查,如何抽取?人进行详细调查,如何抽取?练习练习 :三三种抽样方法的比较 在下列问题中,各采用什么在下列问题中,各采用什么抽样方法抽取样本较合适?抽样方法抽取样本较合适?1、从、从20台电脑中抽取台电脑中抽取4台进行质量检测;台进行质量检测;2、从、从2004名同学中,抽取一个容量为名同学中,抽取一个容量为20的样本的样本3、某中学有、某中学有180名教工,其中业务人员名教工,其中业务人员136名,名,管理人员管理人员20名,后勤人员名,后勤人员24名,从中抽取一个名,从中抽取一个容量为容量为15的样本。的样本。简单抽样简单抽样系统抽样系统抽样分层抽样分层抽样达标训练达标训练4 4 某公司在甲、乙、丙、丁四个地区分别有某公司在甲、乙、丙、丁四个地区分别有150150个、个、120120个、个、180180个、个、150150个销售点,公司为个销售点,公司为了调查产品的销售情况,需从这了调查产品的销售情况,需从这600600个销售点个销售点中抽取一个容量为中抽取一个容量为100100的样本,记这项调查为的样本,记这项调查为;在丙地区中有;在丙地区中有2020个特大型销售点,要从中个特大型销售点,要从中抽取抽取7 7个调查其销售收入和售后服务等情况,个调查其销售收入和售后服务等情况,记这项调查为记这项调查为,完成这两项调查宜分别采用,完成这两项调查宜分别采用什么方法?什么方法?用分层抽样,用分层抽样,用简单随机抽样用简单随机抽样.2.2.系统抽样适合于总体的个体数较多的情形,操作上分系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自动生成,机抽样外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、方便从而使得系统抽样操作简单、方便.1.1.系统抽样也是等概率抽样,即每个个体被抽到的概系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性率是相等的,从而保证了抽样的公平性.课堂小结课堂小结3.3.分层抽样利用了调查者对调查对象事先掌握的各种分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用而使样本更具有代表性,在实际调查中被广泛应用.课后作业:课后作业:课本56页 习题2-1 A2,3