2018版高中数学人教版A版必修三学案:2.2.1 用样本的频率分布估计总体分布 .docx
22.1用样本的频率分布估计总体分布学习目标1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题知识点一频率分布表与频率分布直方图1用样本估计总体的两种情况(1)用样本的频率分布估计总体的分布(2)用样本的数字特征估计总体的数字特征2作频率分布直方图的步骤(1)求极差:即一组数据中最大值和最小值的差;(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来这时应注意:一般样本容量越大,所分组数越多;为方便起见,组距的选择应力求“取整”;当样本容量不超过100时,按照数据的多少,通常分成512组(3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间(4)列频率分布表:一般分四列:分组、频数累计、频数、频率,最后一行是合计其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率/组距其相应组距上的频率等于该组上的小长方形的面积即每个小长方形的面积组距频率思考为什么要对样本数据进行分组?答不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征知识点二频率分布折线图与总体密度曲线1频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图,如图所示2总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,如图所示知识点三茎叶图1定义:顾名思义,茎是指中间的一列数,叶就是从茎的旁边生长出来的数一般地,对于两位数茎叶图,中间的数字表示十位数,旁边的数字表示个位数2几种表示频率分布的方法的优点与不足:优点不足频率分布表表示数量较确切分析数据分布的总体趋势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据的信息茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据题型一频率分布直方图的绘制例1为了了解一大片经济林的生长情况,人们随机测量其中的100株树木的底部周长(单位:cm),得到如下数据:135981021109912111096100103125971171131109210210910411210512487131971021231041041281091231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)绘制频率分布直方图、频率分布折线图解(1)从数据中可以看出,这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距为5.列频率分布表如下:分组频数频率80,85)10.0185,90)20.0290,95)40.0495,100)140.14100,105)240.24105,110)150.15110,115)120.12115,120)90.09120,125)110.11125,130)60.06130,13520.02合计1001.00(2)画频率分布直方图、频率分布折线图如图所示反思与感悟1.在列频率分布表时,极差、组距、组数有如下关系:(1)若为整数,则组数(2)若不为整数,则的整数部分1组数2组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多跟踪训练1美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况解(1)以4为组距,列表如下:分组频数频率41.5,45.5)20.045545.5,49.5)70.159149.5,53.5)80.181853.5,57.5)160.363657.5,61.5)50.113661.5,65.5)40.090965.5,69.520.0455合计441.00(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小题型二频率分布直方图的应用例2为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?解(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为0.08.因为第二小组的频率,所以样本容量150.(2)由直方图可估计该校全体高一年级学生的达标率约为100%88%.反思与感悟1.频率分布直方图的性质:(1)因为小矩形的面积组距频率,所以各小矩形的面积表示相应各组的频率这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)样本容量2频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性跟踪训练2如图所示是总体的一个样本频率分布直方图,且在15,18)内频数为8.(1)求样本在15,18)内的频率;(2)求样本容量;(3)若在12,15)内的小矩形面积为0.06,求在18,33)内的频数解由样本频率分布直方图可知组距为3.(1)由样本频率分布直方图得样本在15,18)内的频率等于3.(2)样本在15,18)内频数为8,由(1)可知,样本容量为850.(3)在12,15)内的小矩形面积为0.06,故样本在12,15)内的频率为0.06,故样本在15,33)内的频数为50(10.06)47,又在15,18)内频数为8,故在18,33)内的频数为47839.题型三茎叶图及其应用例3某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较解甲、乙两人数学成绩的茎叶图如图所示从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段因此乙同学发挥比较稳定,总体得分情况比甲同学好反思与感悟1.画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数要先确定中间的数取数据的哪几位,填写数据时边读边填比较数据时从数据分布的对称性、稳定性等几方面来比较2绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶跟踪训练3如图茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5B5,5C5,8D8,8答案C解析由于甲组数据的中位数为1510x,x5.又乙组数据的平均数为16.8,y8,故选C.频率分布直方图的应用例4为了解某地居民的月收入情况,一个社会调查机构调查了20000人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值)现按月收入分层,用分层抽样的方法在这20000人中抽出200人进一步调查,则月收入在1500,2000)(单位:元)的应抽取_人分析首先求出频率,再利用频数样本容量频率求解答案40解析月收入在1500,2000)的频率为1(0.00020.000520.00030.0001)5000.2,故应抽取2000.240(人)解后反思在频率分布直方图中,矩形的面积组距频率,各矩形表示的频率之和为1. 此外,解题时常用到频数样本容量频率1下列关于样本频率分布折线图与总体密度曲线的关系的说法中,正确的是()A频率分布折线图与总体密度曲线无关B频率分布折线图就是总体密度曲线C样本容量很大的频率分布折线图就是总体密度曲线D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线答案D解析选项正误理由A当总体个数较多时,随着样本容量的增加,组数增加,组距减小,频率分布折线图趋向于总体密度曲线,所以两者有关B只有当样本容量很大时,频率分布折线图趋向于总体密度曲线C总体密度曲线是由频率分布折线图估计的,样本容量越大就越准确D频率分布折线图在样本容量无限增大,分组的组距无限减小的情况下会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为()A640B320C240D160答案B解析依题意得0.125,n320.3某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A56 B60 C120 D140答案D解析设所求人数为N,则N2.5(0.160.080.04)200140,故选D.4已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是()A5.57.5B7.59.5C9.511.5D11.513.5答案D解析由题意知,共20个数据,频率为0.2,在此范围内的数据有200.24个,只有在11.513.5范围内有4个数据:13,12,12,12,故选D.5在如图所示的茎叶图中,甲、乙两组数据的中位数分别是_,_.答案4546解析甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45.乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.1.总体分布指的是总体取值的频率分布规律,由于总体分布不易统计,因此我们往往用样本的频率分布去估计总体的分布2总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图