【高中数学】总体取值规律的估计第1课时课件 2022-2023学年高一下学期数学人教A版(2019)必修第二册.pptx
9 9.2 2 用样本估计总体用样本估计总体9.2.1 总体取体取值规律的估律的估计(第第1课时)第九章第九章 统计统计学学习目标习目标1.理解频率分布直方图理解频率分布直方图2.能够求解有关频率分布直方图的问能够求解有关频率分布直方图的问题题 收集数据是为了寻找数据中蕴含的信息收集数据是为了寻找数据中蕴含的信息.因为实际问题中因为实际问题中数据数据多而且杂乱多而且杂乱,往往,往往无法直接从原始数据中发现规律无法直接从原始数据中发现规律,所以需要根据所以需要根据问题的背景特点,选择合适统计图表对数据进行整理和直观描述问题的背景特点,选择合适统计图表对数据进行整理和直观描述.在此基础上,通过数据分析,找出数据中蕴含的信息在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这就可以用这些信息来解决实际问题了些信息来解决实际问题了.1.1.通过调查获取数据通过调查获取数据2 2.通过试验获取数据通过试验获取数据3 3.通过观察获取数据通过观察获取数据4 4.通过查询获得数据通过查询获得数据获取数据的基本途径获取数据的基本途径:引引 入入问问题题1 我我国国是是世世界界上上严严重重缺缺水水的的国国家家之之一一,城城市市缺缺水水问问题题较较为为突突出出.某某市市政政府府为为了了节节约约生生活活用用水水,计计划划在在本本市市试试行行居居民民生生活活用用水水定定额额管管理理,即即确确定定一一个个居居民民月月用用水水量量标标准准a,用用水水量量不不超超过过a的的部部分分按按平平价价收收费费,超超出出a的的部部分分按按议议价价收收费费.那么标准那么标准a定为多少比较合理呢?定为多少比较合理呢?(1)(1)每户居民月均用水标准每户居民月均用水标准a如果定得如果定得太低太低,会影响,会影响_;很多居民的日常生活很多居民的日常生活(2)(2)每户居民月均用水标准每户居民月均用水标准a如果定得如果定得太高太高,会不利于,会不利于_;节约用水节约用水(3)(3)为了较为合理地确定出这个标准,需要做哪些工作?为了较为合理地确定出这个标准,需要做哪些工作?必须先了解全市所有居民用户中,月用水量在必须先了解全市所有居民用户中,月用水量在不同范围不同范围内的居民用户所占的内的居民用户所占的比例比例情况情况.(4)(4)如何调查全市所有居民用户的如何调查全市所有居民用户的月用水量分布情况月用水量分布情况?全面调查:获取过去一年全市所有居民用户的月均用水量数据全面调查:获取过去一年全市所有居民用户的月均用水量数据抽样调查:分析样本观测数据,抽样调查:分析样本观测数据,估计估计全市居民用户月均用水量的分布情况全市居民用户月均用水量的分布情况.探究新知探究新知 假假设通过简单随机抽样,获得了设通过简单随机抽样,获得了100100户居民用户的月均用水量数据户居民用户的月均用水量数据(单位单位:t):t):9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.09.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 2.1 5.7 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.94.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2 22.42.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.03.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.922.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.85.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.67.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6最小值是最小值是1.3t,1.3t,最大值是最大值是28.028.0t t,其他值在,其他值在1.3t1.3t至至28.0t28.0t之间之间.探究新知探究新知问问题(题(1):):从这组数据我们能发现什么信息呢从这组数据我们能发现什么信息呢?在这个问题中,在这个问题中,总体总体是是该市的全体居民用户该市的全体居民用户,个体个体是是每户居民用户每户居民用户,调查的变量调查的变量是是居民用户的月均用水量居民用户的月均用水量.假假设通过简单随机抽样,获得了设通过简单随机抽样,获得了100100户居民用户的月均用水量数据户居民用户的月均用水量数据(单位单位:t):t):9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.09.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 2.1 5.7 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.94.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2 22.42.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.03.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.922.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.85.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.67.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6 为了更深人地挖掘数据蕴含的信息为了更深人地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析需要对数据作进一步的整理与分析.问题(问题(2 2):在):在实际问题中,我们更关心什么问题?实际问题中,我们更关心什么问题?月均用水量在不同范围内的居民用户占全市居民用户的比例月均用水量在不同范围内的居民用户占全市居民用户的比例.探究新知探究新知 此样本观测数据的最小值是此样本观测数据的最小值是1.3t1.3t,最大值是,最大值是28.0t28.0t,极差为极差为28.028.0-1.3=26.71.3=26.7。这说明样本观测数据的变化范围是。这说明样本观测数据的变化范围是26.7t26.7t.1.1.求极差求极差极差为一组数据中最大值与最小值的差极差为一组数据中最大值与最小值的差.2 2.决定组距与组数决定组距与组数 组数太多或太少,都会影响我们了解数据的分布情况组数太多或太少,都会影响我们了解数据的分布情况.组距与组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程组数的确定没有固定的标准,常常需要一个尝试和选择的过程.决决定组距与组数:当样本容量不超过定组距与组数:当样本容量不超过100100时,常分成时,常分成5 51212组,为了方组,为了方便起见,一般取等长组距,并且组距应力求便起见,一般取等长组距,并且组距应力求“取整取整”我们可以按以下步骤制作我们可以按以下步骤制作频频率分布表、画频率率分布表、画频率分布直方图。分布直方图。探究新知探究新知 由于组距为由于组距为3 3,9 9个组距的长度超过极差个组距的长度超过极差,我们可以使第一组我们可以使第一组的左端点略小于数据中的最小值的左端点略小于数据中的最小值,最后一组的右端点略大于数据最后一组的右端点略大于数据中的最大值中的最大值.例如,可以取区间为例如,可以取区间为1.2,28.21.2,28.2,按如下方式把样,按如下方式把样本观测数据以组距本观测数据以组距3 3分为分为9 9组组:1.2 1.2,4.2)4.2),4.24.2,7.2)7.2),25.225.2,28.2.28.2.计算各小组的频率,例如第一小组的频率是计算各小组的频率,例如第一小组的频率是3 3.将数据分组将数据分组4 4.列频率分布表列频率分布表探究新知探究新知作出频率分布表作出频率分布表(如下表如下表):探究新知探究新知根据上表可以得到如下图所示的频率分布直方图根据上表可以得到如下图所示的频率分布直方图.月均用水量月均用水量/t/t0.077频率频率/组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.25 5.画频率分布直方图画频率分布直方图频率分布直方图的优频率分布直方图的优点点:把样本数据落在:把样本数据落在各小组的比例大小各小组的比例大小直直观化观化,更有利于我们,更有利于我们从整体上把握数据从整体上把握数据分分布的特点布的特点.探究新知探究新知月均用水量月均用水量/t/t0.077频率频率/组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2(1)(1)纵轴表示什么?纵轴表示什么?(1)(1)纵轴表示纵轴表示 ,就是小长方形的高就是小长方形的高,它反映了各组样本观它反映了各组样本观 测数据的疏密程度测数据的疏密程度.探究新知探究新知(2)(2)横轴表示月均用水量横轴表示月均用水量(2)(2)横横轴轴表示什么?表示什么?月均用水量月均用水量/t/t0.077频率频率/组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2(3)(3)小长方形的面积等于什么?小长方形的面积等于什么?(3)(3)小长方形的面积小长方形的面积=组距组距 =频率频率.频率分布直方图就以面积频率分布直方图就以面积 的形式反映了数据落在各个小组的频率的的形式反映了数据落在各个小组的频率的大小大小.探究新知探究新知(4)(4)小长方形的面积之和为多少?小长方形的面积之和为多少?(4)(4)小长方形的面积之和为小长方形的面积之和为1 1,即样本数据落在整个区间的频率为即样本数据落在整个区间的频率为1 1.探究新知探究新知(2)从频率分布直方图能直观地表明数据分布的形状和总体趋势从频率分布直方图能直观地表明数据分布的形状和总体趋势.可以看出,可以看出,数据数据的分布不对称,图形左边高、右边低,右边有一个较长的的分布不对称,图形左边高、右边低,右边有一个较长的“尾巴尾巴”。这表明大部分。这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在居民用户的月均用水量集中在一个较低值区域,尤其在1.2,7.2)最为集中,少数用最为集中,少数用户居民的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势户居民的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.问问题(题(3):):观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?你能给出适当的语言描述吗?(1)从频率分布表中可以看出,样本观测数据落在各个小组的比例大小从频率分布表中可以看出,样本观测数据落在各个小组的比例大小.例如,月均用水量在区间例如,月均用水量在区间4.2,7.2)内的居民用户最多,在区间内的居民用户最多,在区间1.2,4.2)内的次之,内的次之,而月均用水量超过而月均用水量超过16.2的各区间内数据所占比例较小,等等的各区间内数据所占比例较小,等等.探究新知探究新知问问题(题(4):):分别以分别以3和和27为组数,对数据进行等距分组,画出为组数,对数据进行等距分组,画出100户居民月户居民月均用水量的频率分布直方图,你发现均用水量的频率分布直方图,你发现不同的组数不同的组数对直方图呈现数据分布规律对直方图呈现数据分布规律有什么影响?有什么影响?组数少、组距大:组数少、组距大:易看出数据整体的易看出数据整体的分布特点,无法看出每组内的数据分分布特点,无法看出每组内的数据分布情况,损失了较多的原始数据信息;布情况,损失了较多的原始数据信息;组数多、组距小:组数多、组距小:保留较多原始数据信息;保留较多原始数据信息;但小长方形较多,有时图形会变得不规则,但小长方形较多,有时图形会变得不规则,不容易从中看出总体分布特点;直方图会不容易从中看出总体分布特点;直方图会依赖样本数据,稳定性差依赖样本数据,稳定性差.小结:频率分布直方图小结:频率分布直方图1.求求极差极差(一组数据中的最大值与最小值的差)(一组数据中的最大值与最小值的差).2.决定决定组距组距与与组数组数3.将数据将数据分组分组(确定分点,左闭右开最后闭确定分点,左闭右开最后闭)4.列出列出频率分布表频率分布表(分组,频数,频率)(分组,频数,频率)5.列出列出频率分布直方图频率分布直方图(纵轴为(纵轴为频率频率/组距组距)归纳总结归纳总结2.2.某某公司为了解该公司公司为了解该公司800名名员工参加运动的情况,对公司员工半年来的运动时间员工参加运动的情况,对公司员工半年来的运动时间进行统计得到如图所示的频率分布直方图,则运动时间进行统计得到如图所示的频率分布直方图,则运动时间超过超过100小时小时的员工有(的员工有()A.360人人 B.480人人 C.600人人 D.240人人 1.一一个容量为个容量为80的样本中数据的最大值是的样本中数据的最大值是140,最小值是,最小值是41,组距是,组距是10,则应将,则应将样本数据分为样本数据分为()A10组组 B9组组 C8组组 D7组组小试牛刀小试牛刀3 3.已已知知样样本本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为那么频率为0.2的范围是的范围是()A.5.57.5 B.7.59.5C.9.511.5 D.11.513.5解析解析:(1)(1)共共2020个数据个数据,频率为频率为0.2,0.2,在此范围内的数据有在此范围内的数据有4 4个个,只有在只有在11.511.513.513.5范围内有范围内有4 4个数据个数据:13,12,12,12.:13,12,12,12.故选故选D.D.答案答案:D自主学自主学习习145页页小试牛刀小试牛刀0.00440.0044原理:频率和原理:频率和/长方形面积和为长方形面积和为1 原理:样本容量原理:样本容量频率频率 7070 改编改编 从某小区抽取从某小区抽取100户户居民进行月居民进行月用电量调查,发现其用电量都在用电量调查,发现其用电量都在50到到350度之间,频率分布直方图如图所度之间,频率分布直方图如图所示在这些用户中,用电量落在区间示在这些用户中,用电量落在区间150,250)内的户数为内的户数为()A46 B48 C50 D52教材198页第1题课堂练习课堂练习课堂练习课堂练习解:解:(1)通通话时长话时长在区在区间间15,20),20,30)内的次数分内的次数分别为别为9次和次和12次次.(2)区区间间20,30)上每上每单单位区位区间长间长度内的度内的通通话话次数次数 少于区少于区间间15,20内的通内的通话话次数次数.2.如图,胡晓统计了他爸爸如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话月的手机通话明细清单,发现他爸爸该月共通话60次次.胡晓按每次通话时间长短进行分组胡晓按每次通话时间长短进行分组(每组为左闭右开的区间每组为左闭右开的区间),画出了,画出了频率分布直方图频率分布直方图.(1)通话时长在区间通话时长在区间15,20),20,30)内的次数分别为多少内的次数分别为多少?(2)区间区间20,30)上的小长方形高度低于上的小长方形高度低于15,20)上的小长方形的高度,说上的小长方形的高度,说明什么明什么?教材198页第2题巩固巩固练练习习1.为了解人们对环保知识的认知情况,某调查机构对某地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(成绩范围为40,100,不低于60分记为 及 格)绘 制 成 如 图 所 示 的 频 率 分 布 直 方 图(分 为40,50),50,60),60,70),70,80),80,90),90,100六组),若问卷成绩最后三组频数之和为360,则下列结论不正确的是()A.n=480 B.问卷成绩在70,80)内的频率为0.3 C.a=0.030 D.以样本估计总体,若对该地区5 000人进行问卷调查,则约有1 250人不及格自主学自主学习习147页页2.为为了解今年某校高三了解今年某校高三毕业毕业班准班准备报备报考考飞飞行行员员学生的体重学生的体重(单单位:千克位:千克)情况,将所得情况,将所得的数据整理后,画出了的数据整理后,画出了频频率分布直方率分布直方图图,如,如图图所示,已知所示,已知图图中从左到右的中从左到右的前三个小前三个小组组的的频频率之比率之比为为1 2 3,其中,其中第第2小小组组的的频频数数为为12.则该则该校校报报考考飞飞行行员员的的总总人数人数为为_.解解析析:前三组的频率和前三组的频率和为为1(0.0370.013)50.75,巩固巩固练练习习自主学习P147巩固巩固练练习习答案答案:200小结:小结:课堂小结课堂小结布置作业布置作业(1)智慧上进(课课练)第46课时 总体取值规律的估计(2)预习新课(课本第119页至第202页)