人教版福建省仙游第一中学学年高中数学 2.2.1用样本的频率分布估计总体分布(一)课件 新人教A必修3.ppt
用样本的用样本的频率分布频率分布估计总体分布估计总体分布 (一一)2021/8/9 星期一1(1)(1)统计的核心问题统计的核心问题:如何根据样本的情况对总体的情况作出推断如何根据样本的情况对总体的情况作出推断复习引入:简单随机抽样简单随机抽样 系统抽样系统抽样 分层抽样分层抽样(3 3)通过抽样方法收集数据的目的是什么?)通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体从中寻找所包含的信息,用样本去估计总体(2)(2)随机抽样的几种常用方法随机抽样的几种常用方法:2021/8/9 星期一2知识探究(一):频率分布表知识探究(一):频率分布表 我国是世界上严重缺水的国我国是世界上严重缺水的国家之一,城市缺水问题较为家之一,城市缺水问题较为突出,某市政府为了节约生突出,某市政府为了节约生活用水,计划在本市试行居活用水,计划在本市试行居民生活用水定额管理,即确民生活用水定额管理,即确定一个居民月用水量标准定一个居民月用水量标准a a,用水量不超过,用水量不超过a a的部分按的部分按平价收费,超出平价收费,超出a a的部分按的部分按议价收费。如果希望大部分议价收费。如果希望大部分居民的日常生活不受影响,居民的日常生活不受影响,那么标准那么标准a a定为多少比较合定为多少比较合理呢理呢?探究探究:你认为,为了了较你认为,为了了较为合理地确定出这为合理地确定出这个标准,需要做哪个标准,需要做哪些工作?些工作?2021/8/9 星期一3我国是世界上严重缺水的国我国是世界上严重缺水的国家之一,城市缺水问题较为家之一,城市缺水问题较为突出,某市政府为了节约生突出,某市政府为了节约生活用水,计划在本市试行居活用水,计划在本市试行居民生活用水定额管理,即确民生活用水定额管理,即确定一个居民月用水量标准定一个居民月用水量标准a a,用水量不超过,用水量不超过a a的部分按的部分按平价收费,超出平价收费,超出a a的部分按的部分按议价收费。如果希望大部分议价收费。如果希望大部分居民的日常生活不受影响,居民的日常生活不受影响,那么标准那么标准a a定为多少比较合定为多少比较合理呢理呢?探究探究:采用抽样调查的方采用抽样调查的方式获得样本数据式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况2021/8/9 星期一4下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式据的新方式讨论:如何分讨论:如何分析数据?析数据?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析2021/8/9 星期一5一频率分布的概念:一频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围内是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反所占比例的大小。一般用频率分布直方图反映样本的频率分布映样本的频率分布 二画二画频率分布直方图频率分布直方图其其一般步骤一般步骤为为(1 1)计算一组数据中最大值与最小值的差,即求极差)计算一组数据中最大值与最小值的差,即求极差(2 2)决定组距与组数)决定组距与组数(3 3)将数据分组)将数据分组(4 4)列频率分布表)列频率分布表(5 5)画频率分布直方图)画频率分布直方图2021/8/9 星期一6第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)最大值最大值=4.3 =4.3 最小值最小值=0.2 =0.2 所以极差所以极差=4.3-0.2=4.1=4.3-0.2=4.1第二步第二步:决定组距与组数决定组距与组数:(强调取整)(强调取整)当样本容量不超过当样本容量不超过100100时时,按照数据的多少按照数据的多少,常分成常分成512512组组.为方便组距的选择应力求为方便组距的选择应力求”取整取整”.”.本题如果组距为本题如果组距为0.5(t).0.5(t).则则 第三步第三步:将数据分组:将数据分组:(给出组的界限给出组的界限)所以将数据分成所以将数据分成9 9组较合适组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共共9组组.2021/8/9 星期一7 分分 组 频数累数累计 频数数 频率率 0 0,0.50.5)4 0.04 4 0.04 0.5 0.5,1 1)正正 8 0.08 8 0.08 1 1,1.51.5)正正 正正 正正 15 0.15 15 0.15 1.5 1.5,2 2)正正 正正 正正 正正 22 0.22 22 0.22 2 2,2.52.5)正正 正正 正正 正正 正正 25 0.25 25 0.25 2.5 2.5,3 3)正正 正正 14 0.14 14 0.14 3 3,3.53.5)正正 一一 6 0.06 6 0.06 3.5 3.5,4 4)4 0.04 4 0.04 4 4,4.5 2 0.024.5 2 0.02 合合计 100 1.00 100 1.00第四步第四步:列频率分布表列频率分布表.2021/8/9 星期一8第四步第四步:列频率分布表列频率分布表.分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.052021/8/9 星期一9想一想2021/8/9 星期一10知识探究(二):频率分布直方图知识探究(二):频率分布直方图 00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5第第五五步步:画画出出频频率率分分布布直直方方图图.频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的在哪个区间间?请大家阅读第请大家阅读第6868页页,直方图有直方图有哪些优点和缺哪些优点和缺点点?注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和等于各长方形的面积总和等于1 1。2021/8/9 星期一11频率分布直方图的特征:频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布从频率分布直方图可以清楚的看出数据分布的总体趋势。的总体趋势。从频率分布直方图得不出原始的数据内容,从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信把数据表示成直方图后,原有的具体数据信息就被抹掉了。息就被抹掉了。对样本数据进行分组,组距的确定没有固对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们定的标准,组数太多或太少,都会影响我们了解数据的分布情况了解数据的分布情况.数据分组的组数与样本数据分组的组数与样本容量有关,一般样本容量越大,所分组数越容量有关,一般样本容量越大,所分组数越多多.当样本容量不超过当样本容量不超过100100时,按照数据的多时,按照数据的多少,常分成少,常分成5 51212组组.2021/8/9 星期一12(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.居民月均用水量的一些数据特点居民月均用水量的一些数据特点2021/8/9 星期一13思考思考:1.频率分布表与频率分布直方图的区别?频率分布表与频率分布直方图的区别?频率分布表频率分布表列出的是在各个不同区间内取值的频率。列出的是在各个不同区间内取值的频率。频率分布直方图频率分布直方图是用小长方形面积的大小来表示在各个区是用小长方形面积的大小来表示在各个区间内取值的频率间内取值的频率。2.2.如果当地政府希望使如果当地政府希望使85%85%以上的居民每月的用水量不以上的居民每月的用水量不超出标准,根据频率分布表超出标准,根据频率分布表2-22-2和频率分布直方图和频率分布直方图2.2-12.2-1,你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗?2021/8/9 星期一14 与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关.月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O3.将组距确定为将组距确定为1 1,作出教材,作出教材P66P66页页 居民月均用居民月均用水量的频率分布直方图水量的频率分布直方图 4.谈谈两种组距下,你对图的印象?同一个样本数据,绘制出谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?来的分布图是唯一的吗?(同样一组数据,如果组距不同,横轴、纵轴的单位不同,(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断这种印象有时会影响我们对总体的判断 )2021/8/9 星期一15理论迁移理论迁移 例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444,40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少.2021/8/9 星期一16(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 27 27,3232)3 0.06 3 0.06 32 32,3737)3 0.06 3 0.06 37 37,4242)9 0.18 9 0.18 42 42,4747)16 0.32 16 0.32 47 47,5252)7 0.14 7 0.14 52 52,5757)5 0.10 5 0.10 57 57,6262)4 0.08 4 0.08 62 62,6767】3 0.06 3 0.06 合合 计计 50 1.00 50 1.00样本频率分布表:样本频率分布表:2021/8/9 星期一17(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故故年龄在年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.2021/8/9 星期一18练练 习习:1.1.有一个容量为有一个容量为5050的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.512.5,15.5)3 315.5,18.515.5,18.5)8 818.5,21.518.5,21.5)921.5,24.521.5,24.5)11 1124.5,27.524.5,27.5)10 1027.5,30.527.5,30.5)5 530.5,33.530.5,33.5)4 4(1)(1)列出样本的频率分布表列出样本的频率分布表;(2)(2)画出频率分布直方图画出频率分布直方图;(3)(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,15.5,24.524.5)的百分比是多少)的百分比是多少?2021/8/9 星期一19解解:组距为组距为3 3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.0272021/8/9 星期一20频率分布直方图如下:频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.0702021/8/9 星期一21练习练习:2.2.投掷一枚均匀骰子投掷一枚均匀骰子44次的记录是次的记录是:32415134565425313414516331242634661622526543现对这些数据进行整理,试画出频数分布直方图现对这些数据进行整理,试画出频数分布直方图第一步:写出样本可能出现的一切数值,即:第一步:写出样本可能出现的一切数值,即:1,2,3,4,5,6 1,2,3,4,5,6 共共6 6个数个数(数据分组数据分组)2021/8/9 星期一22第二步:列出频率分布表:第二步:列出频率分布表:样本样本频数频数7 77 78 88 87 77 7频率频率0.160.160.160.160.180.180.180.180.160.160.160.16组距组距=1=1第三步第三步:画频率分布直方图画频率分布直方图2021/8/9 星期一23小结小结:画频率分布直方图的步骤画频率分布直方图的步骤:第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)第二步第二步:决定组距与组数决定组距与组数:(强调取整)(强调取整)第三步第三步:将数据分组将数据分组 (给出组的界限给出组的界限)第四步第四步:列频率分布表列频率分布表.(包括分组、频数、频率(包括分组、频数、频率、频率、频率/组距组距)第五步第五步:画频率分布直方图画频率分布直方图(在频率分布表的基础上绘制,横(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率坐标为样本数据尺寸,纵坐标为频率/组距组距.)组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。2021/8/9 星期一24注意注意(2)纵坐标为纵坐标为:作业作业:P71:P71第一题第一题 习题习题2.22.2:2 22021/8/9 星期一25