《2022年抽样方法与总体分布的估计学习导引.doc》由会员分享,可在线阅读,更多相关《2022年抽样方法与总体分布的估计学习导引.doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样方法与总体分布的可能学习导引刘洪明本章“统计”部分是在初中“统计初步”和高中“概率”内容的根底上来学习的,所介绍的抽样方法比初中更系统和详细,而用样本频率分布去可能总体分布,更是初中相关内容的接着和深化。一、学习目的1.理解三种抽样方法:简单随机抽样,系统抽样,分层抽样的概念、各自的特点、互相联络、适用范围、操作方法,会依照详细咨询题中的条件、要求,选用恰当的抽样方法从总体中抽取样本。2.会编制样本频率分布表,画出频率分布条形图或直方图,用样本频率分布去可能总体分布。二、内容解析1.抽样方法(1)简单随机抽样:当总体中的个体较少时,可采纳逐一地、不放回且等概率地抽取样本。详细操作时可用抽签
2、法或随机数表法。(2)系统抽样:当总体中的个体较多时,可将总体编号,按需要抽取的样本数均分成假设干段,再按照一定的规则在每一段中抽取一个个体。(3)分层抽样:当总体是由差异明显的几个部分组成的,可将总体按差异分成几个部分(层),再按各部分在总体中所占比例进展抽样。应该留意到,在系统抽样和分层抽样中,最后仍需用简单随机抽样来完成。因而,简单随机抽样是其它各种抽样的根底。另外,不管用哪种抽样方法,不管是“逐一地抽取”,依然“一次性地抽取”,总体中的每个个体被抽到的概率都是一样的。2.总体分布的可能在通常情况下,一个总体中的个体是相当多的,甚至是无穷多的。假如逐一考察每个个体,往往是困难的,甚至是办
3、不到的。这就要求我们运用上述的抽样方法,抽取一个样本,用样本的频率分布来对总体进展可能。样本的容量越大,这种可能越准确。当总体中的个体取不同值非常少时,可由不同取值及相应的频率列出分布表,并用相应的条形图来表示。当总体中的个体取值较多时,可将不同取值分别放入相应的区间内,列出不同区间内取值的频率分布表,并依此画出相应的直方图。有了样本频率分布表或直方图,就容易可能出总体的各种属性,对总体作出推断。三、典型例题例1.(见教科书P22第4行)现要用系统抽样的方法,从一个个体数为1003的总体中,抽取一个容量为50的样本,那么总体中的每个个体被抽到的概率是()A.B.C.D.解:由于1003除以50
4、,得余数为3,因而,在用系统抽样时,首先应从总体中剔除3个个体,可用简单随机抽样的方法(可利用随机数表)。那么关于总体中某个个体a而言,未被剔除而被留在剩余总体内的概率为。接着进展系统抽样,从1000个个体中抽取50个,则个体a被抽到的概率为。综上,个体a被抽到的概率为故应选D。说明:此题容易错误认为:删除了3个个体后,从1000个个体中用系统抽样的方法抽取50个,每个个体被抽到的概率为。实际上,后面的系统抽样,是在删除3个个体的前提下来进展的(即条件概率)。例2.(见教科书P1913页)从个体数为N的总体中,抽取一个容量为n的样本,求总体中任一指定个体a被抽到的概率。假如(1)采纳逐一抽取的
5、方法;(2)采纳一次性抽取的方法。解:我们明白,从个体数为N的总体中,抽取一个个体,那么第N个个体被抽到的概率为,未被抽到的概率为。(1)在逐一抽取n个个体时,a被抽到的情况及其概率情况如下:第1次被抽到,;第2次被抽到,;第3次被抽到,;第n次被抽到由于以上几个事件彼此互斥,依照互斥事件的概率加法公式,个体a被抽到的概率为(2)在一次性抽取n个个体时,个体a被抽到时,只要再从剩余的(N1)个个体中,抽取个个体即可。因而,这时的概率为以上结果说明,“逐一抽取”与“一次性抽取”,关于总体中的每个个体而言,被抽到的概率是一样的。因而,简单随机抽样确实表达了抽样的客观公平性。而其它更复杂的抽样,又以
6、简单随机抽样为根底,就使得这些抽样方法也具有客观公平性。例3.某消费企业共有800人,其中治理人员40人,技术人员120人,一线工人640人。现要调查理解全厂人员的(1)身高与血型情况;(2)家庭人均生活费用情况。试用恰当的抽样方法抽取一个容量为40的样本,并说明操作过程。解:(1)身高和血型,与其职务无关,全厂人员又非常多,故应采纳系统抽样法。将全厂人员按1至800编号,再按编号顺序分成40组,每组20人。先在第1组中用抽签法抽出k号(1k20),其余组中的(n1,2,39)号也都抽出。如此就得到了一个容量为40的样本。(2)家庭人均生活费用的差异与其职务有关,故应采纳分层抽样的方法。三类人
7、员的人数比为40:120:6401:3:16,因而各抽人,人,人。又由于治理人员、技术人员人数较少,可采纳抽签法(技术人员也可用随机数表法)。而工人人数非常多,应采纳系统抽样法,分成32组,从每组的20人中抽出1人。详细操作可仿照(1)题。从本例可见,尽管总体不变,由于抽取的样本所涉及的内容不同,那么对总体中个体间差异的理解就不同,因而采纳的抽样方法也随之改变。例4.(见教科书P26中部至P27)试说明频率分布表的制造过程。解:这类咨询题可按以下步骤操作:(1)求极差:查找最大值是25.56(第4行第3个数),最小值是25.24(第8行第2个数),则极差是。(2)确定组数与组距:为使组数在10个左右,由,可取组数为11,组距为0.03。(3)确定分点数:为了防止出现某些数据恰好是分点,可使分点数比各数据多一位小数,同时使第1个分点数比最小值25.24稍小一点,可取为25.235。则各组的范围依次是25.235,25.265),25.265,25.295),25.535,25.565)。(4)将总体中各个体(数据)归入到相应小组中(个数累计),数出各组中样本个数(频数),再分别计算各组中。(5)列出频率分布表(见教科书P27)。(6)画出频率分布直方图(见教科书P27)。
限制150内