2.2.1用样本的频率分布估计总体分布.pptx
第1页/共69页第2页/共69页第3页/共69页第4页/共69页第5页/共69页1.对样本的数据进行分析的具体方法有哪些?提示:可利用频数分布表,频率分布表、频率分布直方图,频率分布折线图,茎叶图等.2.有人说:样本的频率分布只反映了样本的数据特征,不能估计总体的分布情况,对吗?提示:错误.通过样本的频率能够估计总体的分布情况.第6页/共69页第7页/共69页第8页/共69页1.在绘制频率分布直方图的过程中,将数据的样本进行分组的目的是什么?提示:从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况.2.在频率分布直方图中,各个小矩形面积之和是多少?提示:是1.第9页/共69页3.频率分布直方图以怎样的形式反映了数据落在各个小组内的频率大小?提示:以面积的形式,因为矩形的面积=组距 ,并且各个小矩形的面积之和等于1.第10页/共69页第11页/共69页1.频率分布折线图的形状与什么有关?它会随着谁的改变而改变?提示:与分组数(组距)有关,随着样本的改变而改变.2.是否所有的总体都存在密度曲线?若总体存在密度曲线,那么是否都能准确画出其密度曲线?提示:并非所有的总体都存在密度曲线.尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样被准确地画出来,只能用样本的频率分布对它进行估计.一般说来,样本容量越大,这种估计就越精确.第12页/共69页第13页/共69页1.茎叶图对重复的数据如何处理?提示:重复记录,不能遗漏.2.茎叶图可以表示三位数数据吗?如何表示?提示:可以,这时茎表示前两位数,叶表示最后一位数.第14页/共69页第15页/共69页【例1】美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48第16页/共69页(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.第17页/共69页第18页/共69页第19页/共69页第20页/共69页第21页/共69页【例2】有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取16台,记录某天上午各自的销售情况(单位:元):甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.(1)请作出这两组数据的茎叶图;(2)将这两组数据进行比较分析,你能得到什么结论?第22页/共69页第23页/共69页第24页/共69页【练一练】1.用茎叶图表示一组两位数据时,数据的个数 _茎叶图中叶的个数(填大于、小于或等于).第25页/共69页2.数据123,127,131,151,157,135,129,138,147,152,134,121,142,143的茎叶图中,茎应取 _.第26页/共69页3.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,36,23,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示.(2)将这两组数据进行比较分析,得到什么结论?第27页/共69页第28页/共69页【例3】世界卫生组织指出青少年的身体健康状况是一个应该引起大家足够重视的问题,某校为了了解小学生的体能情况,抽取了一个年级的部分学生进行一分钟跳绳次数测试.将所得数据整理后,画出频率分布直方图,如图所示.已知图中从左到右前三个小组的频率分别为,第一个小组的频数为5.第29页/共69页(1)求第四小组的频率;(2)求参加这次测试的学生人数是多少?(3)若在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少?思路点拨:由题目可获取以下主要信息:一分钟跳绳次数的频率分布直方图;从左到右前三个小组的频率;第一个小组的频数.解答本题可由图读数,再由数进行判断.第30页/共69页第31页/共69页【练一练】1.在某路段检测点对200辆汽车的车速进行检测,检测结果表示为频率分布直方图如图所示,则车速不小于90 km/h的汽车约有 _辆.第32页/共69页第33页/共69页2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110次以上(含110次)为达标,试估计该校全体高一学生的达标率是多少.第34页/共69页第35页/共69页第36页/共69页第37页/共69页一、选择题(每题5分,共15分)1.将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和,则n的值为()(A)640(B)320(C)240(D)160 【解题提示】根据频率的定义求解.【解析】选B.频率=,n=320.第38页/共69页2.下面给出4个茎叶图第39页/共69页则数据6,23,12,13,27,35,37,38,51可以由图 _表示.【解析】选A.因为在4049之间无数据,有数据51,从而茎4无叶,茎5有叶为1.第40页/共69页3.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为岁18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在56.5,64.5)kg的学生人数是()(A)20(B)30(C)40(D)50第41页/共69页 【解题提示】计算在)kg范围内的矩形的面积即该范围对应的频率,根据频率的定义计算该范围内的人数.【解析】选C.在频率分布直方图中,矩形的面积就是数据落在这一范围的频率,在56.5,64.5)kg范围内的矩形的面积是,则数据落在这一范围的频率是0.4.所以这100名学生中体重在)的学生人数是1000.4=40.第42页/共69页第43页/共69页二、填空题(每题5分,共10分)4.(2010福建高考)将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为234641,且前三组数据的频数之和等于27,则n等于 _.【解题提示】频率之比即为频数之比,按比例设六组的频数,可解.【解析】设第一组到第六组的频数分别为2a,3a,4a,6a,4a,a,2a+3a+4a=27,a=3,2a+3a+4a+6a+4a+a=20a=60.答案:60第44页/共69页5.某班25人的数学成绩茎叶图如下图所示,则最高分为 _,最低分为_,优秀率(90分以上)为 _.第45页/共69页【解析】根据茎叶图中数据的排列规律,分析数据,可得最高分为91,最低分为51,优秀率为 =4%.答案:91 51 4%第46页/共69页三、解答题(6题12分,7题13分,共25分)6.(2010福州高一检测)甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分):甲组:76 90 84 86 81 87 86 82 85 83乙组:82 84 85 89 79 80 91 89 79 74用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.第47页/共69页【解析】用茎叶图表示如下:容易看出甲组成绩较集中,即甲组成绩更整齐一些.第48页/共69页7.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在70,80)分的学生所占总体的百分比;(4)估计成绩在70,100分的学生所占总体的百分比.第49页/共69页【解析】(1)频率分布表如下:第50页/共69页第51页/共69页第52页/共69页(3)由频率分布直方图可知成绩在70,80)分的学生所占总体的百分比是0.0310=0.3=30%.(4)估计成绩在70,100分的学生所占总体的百分比是0.3+0.24+0.16=0.7=70%.第53页/共69页第54页/共69页1.(5分)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;;第六组,成绩大于等于18秒且小于等于19秒.如图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()第55页/共69页(A)0.9,35(B)0.9,45(C)0.1,35(D)0.1,45【解析】选A.从频率分布直方图上可以看出x=(0.02+0.18+0.36+0.34)1=0.9,y=50(0.34+0.36)1=35.第56页/共69页2.(5分)甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示.则甲、乙两班的最高成绩分别是 _,_.从图中看 _班的平均成绩较高.第57页/共69页【解析】根据茎叶图中数据的排列规律,分析数据可知,甲、乙两班的最高成绩分别是96、92.乙班的平均成绩较高.答案:96 92 乙第58页/共69页第59页/共69页3.(5分)(2010北京高考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数值可知a=_.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为 _.第60页/共69页 【解题提示】利用各矩形的面积之和为1可解出a.分层抽样时,先算出身高在140,150内的学生在三组学生中所占比例,再从18人中抽取相应比例的人数.第61页/共69页【解析】各矩形的面积之和为:0.00510+0.03510+a10+0.02010+0.01010=1,解得a=0.030.身高在120,130),130,140),140,150三组内学生人数分别为:30、20、10,人数的比为321,因此从身高在140,150内的学生中选取的人数应为18 =3人.答案:0.030 3第62页/共69页4.(15分)50辆汽车经过某一段公路的时速记录如图所示:将其分成7组.(1)列出样本的频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述结果,估计汽车时速在哪组的几率最大?第63页/共69页【解析】(1)由茎叶图,数据最大值为33,最小值为13,分为7组,组距为3,则频率分布表为:第64页/共69页(2)频率分布直方图及频率分布折线图如图所示:第65页/共69页(3)估计汽车时速在21.5,24.5)内的几率最大,为0.22.第66页/共69页第67页/共69页第68页/共69页感谢您的观看!第69页/共69页