《三种常用抽样方法j备课教案.doc》由会员分享,可在线阅读,更多相关《三种常用抽样方法j备课教案.doc(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、,龙文教育个性化辅导授课案ggggggggggggangganggang纲 教师: 赵涛 学生: 时间: 年_月_日 段1、 授课目的与考点分析: 2、 授课内容: 三种常用抽样方法:1简单随机抽样:设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取次;
2、成样:对应号签就得到一个容量为的样本。抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。成样:对应号签就得到一个容量为的样本。结论: 用简单随机抽样,从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N; 基于此,简单随机抽样体现了抽样的客
3、观性与公平性; 简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。2系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。系统抽样的步骤可概括为:(1)将总体中的个体编号。采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。为将整个的编号进行分段,要确定分段的间隔.当N/n是整数时,k=n/N;当N/n不是整数时,通过从总体中剔除一些个体使剩下的个体数N能被整除,这时k=N/n;(3)确定起始的个体编号。在第1段用简单随机抽样确定起始的个体边号;(
4、4)抽取样本。按照先确定的规则(常将加上间隔)抽取样本:。3分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。结论:(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体数为N的总体中抽取一个容量为的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于n/N;(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践的应用更为广泛。例题:【例1】某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,
5、上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适A.系统抽样 B.简单随机抽样 C.分层抽样 D.随机数表法【例2】为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为A.40 B.30 C.20 D.12【例3】从N个编号中要抽取n个号码入样,若采用系统抽样方法抽取,则分段间隔应为A. B.n C. D.+1【例】系统抽样适用的总体应是A.容量较少的总体 B.总体容量较多C.个体数较多但均衡的总体 D.任何总体【例5】下列说法正确的个数是总体的个体数不多时宜用简单随机抽样法在总体均分后的每一部分进行抽
6、样时,采用的是简单随机抽样百货商场的抓奖活动是抽签法整个抽样过程中,每个个体被抽取的机率相等(有剔除时例外)A.1 B.2 C.3 D.4【例6】一批灯泡400只,其中20 W、40 W、60 W的数目之比为4,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为_.答案:20、15、5【例7】从总体为.的一批零件中用分层抽样抽取一个容量为的样本,若每个零件被抽取的机率为.25,则N等于A.150B.200C.120D.100【例8】一个总体的60个个体的编号为0,1,2,59,现要从中抽取一个容量为10的样本,请根据编号按被6除余3的方法,取足样本,则抽取的样本号码是_ 【例
7、9】体育彩票000001100000编号中,凡彩票号码最后三位数为345的中一等奖,采用的是系统抽样法吗?为什么? 【例10】某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示.很喜爱喜爱一般不喜爱2435456739261072电视台为了了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中各应抽选出多少人?二、用样本估计总体一频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:计算一组数据中最大
8、值与最小值的差,即求极差1、决定组距与组数2、将数据分组3、列频率分布表4、画频率分布直方图二频率分布直方图的特征:1、从频率分布直方图可以清楚的看出数据分布的总体趋势。2、从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。三频率分布折线图、总体密度曲线1频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。根据这条曲线,
9、可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。总体分布密度密度曲线函数y=f(x)的两条基本性质:f(x) 0(xR);由曲线y=f(x)与x轴围成面积为1。 1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。 中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。平均数: 一组数据的算术平均数,即x=2从频率分布直方图中估计众数、中位数、平均数:众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,(1)课本中调查的100位居民的月均用水量的问题中,
10、从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如上图(较细的虚线)所示;(2)在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。此数据值为2.02t。 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。由图估计平均数为2.02t。(较粗的虚线);3三种数字特征的优缺点:(1)、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。(2)、中位数是样本数据所占频率的等分线,它
11、不受少数几个极端值的影响。(3)、平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大。 4:方差、标准差(1)方差的计算公式:(2)标准差的计算公式:(3)方差和标准差的意义:用于考察样本数据的分散程度的大小,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。次数90100110120130140150o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036例题:【例1】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方
12、形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?【例2】某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6 h B.0.9 h C.1.0 h D.1.5 h【例3】把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的
13、一组的频数为_.【例4】某班学生在一次数学考试中成绩分布如下表:分数段0,80)80,90)90,100)人数2)56分数段100,110)110,120 120,130)人数8126分数段130,140)140,150)人数42那么分数在100,110)中的频率和分数不满110分的累积频率分别是_、_(精确到0.01).【例5】对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个 数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100400 h以内的概率;(4)估计电子元
14、件寿命在400 h以上的概率.例3从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm) 设计了如下茎叶图:甲乙31277550284542292587331304679403123556888553320224797413313672356根据以上茎叶图,对甲乙两品种棉花的纤维长度作比较,写出两个统计结论:_ 统计单元测试题一、选择题:(本题共14小题,每小题4分,共56分,在每小题给出的四个选项中,只有一项是符合题目要求的)1、抽样调查在抽取调查对象时A、按一定的方法抽取 B、随意抽取C、全部抽取 D、根据个人的爱好抽取2、对于简单随机抽样,下列说法中正确的命题为它要求被抽取样本
15、的总体的个数有限,以便对其中各个个体被抽取的概率进行分析;它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;它是一种不放回抽样;它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种方法抽样的公平性。A、 B、 C、 D、3、某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。则完成
16、(1)、(2)这两项调查宜采用的抽样方法依次是A、分层抽样法,系统抽样法 B、分层抽样法,简单随机抽样法C、系统抽样法,分层抽样法 D、简单随机抽样法,分层抽样法4、某小礼堂有25排座位,每排有20个座位。一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下了座位号是15的所有的25名学生测试。这里运用的抽样方法是A、抽签法 B、随机数表法 C、系统抽样法 D、分层抽样法5、我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为A、45,75,15 B、45,45,45 C、
17、30,90,15 D、45,60,306、中央电视台动画城节目为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众。现采用系统抽样方法抽取,其组容量为A、10 B、100 C、1000 D、100007、对总数为的一批零件抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则为A、150 B、200 C、100 D、1208、某中学有高级教师28人,中级教师54人,初级教师81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是A、简单随机抽样 B、系统抽样C、分层抽样 D、先从高级教师中随机剔除1人,再用分层抽样9、一个容量为3
18、5的样本数据,分组后,组距与频数如下:个;个;个;个;个;个。则样本在区间上的频率为A、20% B、69% C、31% D、27%10、在用样本估计总体分布的过程中,下列说法正确的是A、总体容量越大,估计越精确 B、总体容量越小,估计越精确C、样本容量越大,估计越精确 D、样本容量越小,估计越精确11、下列对一组数据的分析,不正确的说法是A、数据极差越小,样本数据分布越集中、稳定B、数据平均数越小,样本数据分布越集中、稳定C、数据标准差越小,样本数据分布越集中、稳定D、数据方差越小,样本数据分布越集中、稳定12、下列两个变量之间的关系是相关关系的是A、正方体的棱长和体积 B、单位圆中角的度数和
19、所对弧长C、单产为常数时,土地面积和总产量 D、日照时间与水稻的亩产量13、对于给定的两个变量的统计数据,下列说法正确的是A、都可以分析出两个变量的关系 B、都可以用一条直线近似地表示两者的关系C、都可以作出散点图 D、都可以用确定的表达式表示两者的关系14、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在的频率为2400 2700 3000 3300 3600 3900 体重00.001频率/组距A、0.001 B、0.1 C、0.2 D、0.3二、填空题:(本题共6小题,每小题4分,共24分,请把答案填写在横线上)15、若总体中含有1650个个体,现在要采用系统抽样,从中抽取
20、一个容量为35的样本,分段时应从总体中随机剔除 个个体,编号后应均分为 段,每段有 个个体。16、某工厂生产的产品用传送带将其送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品检测,则这种抽样方法是 。17、某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为。现用分层抽样的方法抽出一个容量为的样本,样本中A种型号的产品共有16件,那么此样本的容量 件。18、数据 平均数为6,标准差为2,则数据 的平均数为 ,方差为 。频率0.40.30.20.1040 50 60 70 80 时速19、管理人员从一池塘内捞出30条鱼,做上标记后放回池塘。10天后,又从池塘内捞出50条鱼,其中
21、有标记的有2条。根据以上数据可以估计该池塘内共有 条鱼。20、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,则时速在的汽车大约有 辆。三、解答题:(本题20分,解答应写出文字说明或演算步骤.)21、为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组数如下:;(1)列出频率分布表(含累积频率);(2)画出频率分布直方图以及频率分布折线图;(3)据上述图表,估计数据落在范围内的可能性是百分之几?(4)数据小于11.20的可能性是百分之几? 三、本次课后作业:四、学生对于本次课的评价: 特别满意 满意 一般 差 学生签字:五、教师评定:1、 学生上次作业评价: 好 较好 一
22、般 差2、 学生本次上课情况评价: 好 较好 一般 差 教师签字: 教研组长签字: _ 龙文教育教务处主任签字: _ 一、选择题1. 为了了解某地区高三学生的身体发育情况,抽查了该地区名年龄为岁岁的男生体重(kg),得到频率分布直方图如下:体重(kg)54.556.558.560.562.564.566.568.570.572.574.576.5 根据上图可得这名学生中体重在的学生人数是( )0.1500.1250.1000.0750.050O96克98100102104106频率/组距2 某工厂对一批产品进行了抽样检测右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产
23、品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )0.5%1%2%水位(米)30 31 32 3348 49 50 51图2A90 B75 C 60 D453. 根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图2)从图2中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( )A48米B49米C50米D51米4. 一个容量100的样本,其数据的分组与各组的频数如下:组别频数121
24、3241516137则样本数据落在上的频率为( )0.13B0.39C0.52D 0.648 979 3164025. 若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ( ) A91.5和91.5 B91.5和92 C91和91.5 D92和926.样本中共有五个个体,其值分别为,0,1,2,3,若该样本的平均值为1,则样本方差为( )(A)(B)(C)(D)27. 从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )分数54321 人数201030300ABC3D8. 在某项体育比赛中,七位裁判为一选手打出的分数如下:90
25、89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )(A) 92,2 (B)92,2.8 (C) 93,2 (D)93,2.89. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A甲地:总体均值为3,中位数为4 B乙地:总体均值为1,总体方差大于0C丙地:中位数为2,众数为3 D丁地:总体均值为2,总体方差为310. 某人次上班途中所花的时间(单位:分钟)分别为,已知这组数据的平均数为,方差为
26、,则的值为( )11. 设矩形的长为a,宽为b,其比满足,这种矩形给人以美感,称为黄金矩形黄金矩形常用于工艺品设计中下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )A甲批次的总体平均数与标准值更接近 B乙批次的总体平均数与标准值更接近C两个批次总体平均数与标准值接近程度相同D两个批次总体平均数与标准值接近程度不能确定0.090.080.030.0226101418
27、22样本数据二、填空题12 下图是样本容量为200的频率分布直方图根据样本的频率分布直方图估计,样本数据落在内的频数为 ,数据落在内的概率约为 图30.0400.0350.0300.0250.0200.0150.0100.0050455565758595产品数量频率组距13. 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为45,55),55,65),65,75),75,85),85,95),由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在55,75)的人数是 14. 某个容量为100的样本的频率分布直方图如下,则在区间上的数
28、据的频数为 15.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组频数123101则这堆苹果中,质量不小于120克的苹果数约占苹果总数的 0.060.050.040.030.020.010510152025303540长度(mm)16.某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标)所得数据均在区间5,40中,其频率分布直方图如图所示,则在抽样的100根中,有 棉花纤维的长度小于20mm作品A8923x21489917. 某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示记分员在去
29、掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清若记分员计算无误,则数字x应该是 甲乙98 1 97101320 2 1424115 3 02018. 甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数则这10天甲、乙两人日加工零件的平均数分别为 和 19. 从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280285285 287292294295301303303307308310314319323325325 328
30、331334337352乙品种:284292295304306307312313315315316318318320322322324327329331333336337343356由以上数据设计了如下茎叶图3 1 277 5 5 0 28 45 4 2 29 2 58 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 88 5 5 3 32 0 2 2 4 7 97 4 1 33 1 3 6 734 32 35 6甲乙根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ; 20. 某高校有甲、乙两个数学建模兴趣班,其中甲班40人,乙班50人,现分析
31、两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是分21 从一堆苹果中任取5只,称得它们的质量如下(单位:克):125 124 121 123 127则该样本标准差 (克)(用数字作答)22. 已知总体的各个体的值由小到大依次为2,3,3,7,12,13.7,18.3,20,且总体的中位数为. 若要使该总体的方差最小,则的取值分别是 . 23. 某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生1号2号3号4号5号甲班67787乙班67679则以上两组数据的方差中较小的一个为 三、解
32、答题24.(本小题满分12分)某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示:分组500,900)900,1100)1100,1300)1300,1500)1500,1700)1700,1900)1900,)频数4812120822319316542频率(I)将各组的频率填入表中;(II)根据上述统计结果,计算灯管使用寿命不足1500小时的频率;(III)该公司某办公室新安装了这种型号的灯管3支,若将上述频率作为概率,试求至少有2支灯管的使用寿命不足1500小时的概率12分25. (本小题满分12分)某良种培育基地正在培育
33、一种小麦新品种A将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414, 415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397 397,400,401,401,403,406,407,410,412,415,416,422,430(I)完成所附的茎叶图;(II)用茎叶图处理现有的数据,有什么优点?(III)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论2181991017036898832162 588159甲班乙班26.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率
限制150内