用样本的频率分布估计总体.ppt
著名数学家克莱因所著名数学家克莱因所说:数学是人数学是人类最高超的智力成就最高超的智力成就 也是人也是人类心灵最独特的心灵最独特的创作作 音音乐能激能激发或或抚慰情慰情怀 绘画能使人画能使人赏心悦目心悦目 诗歌能歌能动人心弦人心弦 哲学使人哲学使人获得智慧得智慧 科学可改善物科学可改善物质生活生活 但数学能但数学能给予以上一切予以上一切 用样本的频率分布估计总体用样本的频率分布估计总体新授课新授课设计:程宏彦设计:程宏彦19 二月二月 2023作业反馈:作业反馈:(态度决定一切,习惯成自然!态度决定一切,习惯成自然!)完成优秀者:完成优秀者:存在的问题:存在的问题:本本节课学学习目目标:1.通通过实例体会分布的意例体会分布的意义和作用;和作用;2.在表示在表示样本数据的本数据的过程中,学会列程中,学会列频率分布表,画率分布表,画频率分布直方率分布直方图、频率折率折线图和茎叶和茎叶图;3.通通过实例体会例体会频率分布直方率分布直方图、频率折率折线图、茎叶、茎叶图的各自特征,从而恰当地的各自特征,从而恰当地选择上述方法分析上述方法分析样本的本的分布,准确地做出分布,准确地做出总体估体估计。新知解读新知解读:画频率分布直方图:画频率分布直方图(1)计算一组数据中最大值与最小值的差,)计算一组数据中最大值与最小值的差,即求即求 。(2)决定组距与组数。)决定组距与组数。(3)将数据分组。)将数据分组。(4)列)列 表表 (5)画)画 图图 分几步呢?分几步呢?这组数据的变动范围这组数据的变动范围4.3-0.2=4.1(8.2取整取整,分为分为9组组)频率分布表频率分布表频率分布直方频率分布直方分组分组频数累计(划记)频数累计(划记)频数频数0,0.5)40.5,1)正81,1.5)正正正151.5,2)正正正正丅222,2.5)正正正正正252.5,3)正正143,3.5)正63.5,4)44,4.5丅2合计100频率频率频率频率/组距组距频率频率0.040.080.150.220.250.140.060.040.021频率频率/组距组距0.080.160.30.440.500.280.120.080.044.4.列列频率频率分布表分布表5、频率分布直方图如下、频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面积小长方形的面积=?各小长方形的面积各小长方形的面积=频率频率5、频率分布直方图如下、频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面积小长方形的面积总和总和=?各小长方形的面积之和各小长方形的面积之和=1=15、频率分布直方图如下、频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在那个区多的在那个区间间?5、频率分布直方图如下、频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5直方图直方图的优点的优点?说明说明:直方图以面积的形式直方图以面积的形式反映数据落在各小组的频反映数据落在各小组的频率。根据样本的频率分布率。根据样本的频率分布可大致估计总体的分布。可大致估计总体的分布。频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5直方图直方图的缺点的缺点?说明说明:看不到原始数据!看不到原始数据!(3)用水量在用水量在3吨以上的百分比?吨以上的百分比?你认为标准你认为标准定为定为3吨一定能保证吨一定能保证85%的居民每月的用水量的居民每月的用水量不超过标准嘛?如果不能,是什么原因造成的不超过标准嘛?如果不能,是什么原因造成的?(4)标准可能出现偏差,怎么办?)标准可能出现偏差,怎么办?进行评估进行评估随机性造成的随机性造成的利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布折线图就会无限接近于一条光滑那么频率分布折线图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上上例例的的样样本本容容量量为为100,如如果果增增至至1000,其其频频率率分分布布直直方方图图的的情情况况会会有有什什么么变变化化?假假如如增增至至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。反映了总体在各个范围内取值的百分比,它能反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。给我们提供更加精细的信息。用用样样本本分分布布折折线线图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布折折线线图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内的的取取值值百百分分比比。但但不不能能由由样样本本的的频频率率分分布布折折线线图图得得到到准确的总体密度曲线。准确的总体密度曲线。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线茎叶图茎叶图如:某赛季甲、乙两名篮球运动员每场比赛得分如:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:的原始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图:用来表示数据的一种图,茎叶图:用来表示数据的一种图,茎茎就是指就是指中间的一列数,中间的一列数,叶叶是从旁边生出来的数。是从旁边生出来的数。茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 843 8 9 1中间的数字表示得分的十位,旁边的数字分别表示中间的数字表示得分的十位,旁边的数字分别表示两人得分的个位。茎叶图不仅保留原始数据,而且两人得分的个位。茎叶图不仅保留原始数据,而且能展示数据的分布情况。能展示数据的分布情况。当堂检测:当堂检测:1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的)的百分比是多少百分比是多少?(用直尺和铅笔作图!)(用直尺和铅笔作图!)解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图课堂小结:课堂小结:1、制制作作频频率率分分布布直直方方图图分分几几个个步步骤?骤?各步骤需要注意哪些问题各步骤需要注意哪些问题?2、几几种种表表示示频频率率分分布布的的方方法法的的优优点点和和不足:不足:1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、将数据分组将数据分组(8.2取整取整,分为分为9组组)小结小结:画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(填写频率填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。注意注意(2)纵坐标为纵坐标为:几种表示频率分布的方法的优点和不足:几种表示频率分布的方法的优点和不足:(1)频率分布表频率分布表在数量上表示比较确切,但不够直在数量上表示比较确切,但不够直观,形象,分析数据分布的总体、态势不太方便。观,形象,分析数据分布的总体、态势不太方便。(2)频率分布直观图频率分布直观图能很容易表示大量数据,非常能很容易表示大量数据,非常直观地表示分布的形状,使我们能够看到在分布表看直观地表示分布的形状,使我们能够看到在分布表看不清的数据模式。但看不到原始数据。不清的数据模式。但看不到原始数据。(3)频率分布折线图频率分布折线图的优点是它反映了数据的变化的优点是它反映了数据的变化趋势,如果样本用量不断的增大,分组的组距不断的趋势,如果样本用量不断的增大,分组的组距不断的缩小,那么折线图就趋向于总体分布的密度曲线。缩小,那么折线图就趋向于总体分布的密度曲线。(4)用)用茎叶图茎叶图刻画数据有两个优点:一是所有的信刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到,二是茎叶图便于记录息都可以从这个茎叶图中得到,二是茎叶图便于记录和表示,能够展示数据的分布情况,但当数据较多或和表示,能够展示数据的分布情况,但当数据较多或数据位数较多时,茎叶图就显得不方便了。数据位数较多时,茎叶图就显得不方便了。