《频率分布表和频率分布直方图1.ppt》由会员分享,可在线阅读,更多相关《频率分布表和频率分布直方图1.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.2.1用样本的频率分布用样本的频率分布估计总体分布估计总体分布一、复习回顾一、复习回顾1.我们已经学习了哪些抽样的方法我们已经学习了哪些抽样的方法?简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样随机抽样是收集数据的方法,如何通过随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需本特征,即用样本估计总体,是我们需要进一步学习的内容要进一步学习的内容.用样本估计总体一般有两种方法:用样本估计总体一般有两种方法:1.用样本的频率分布估计总体的用样本的频率分布估计总体的分布分布2.是用样本的数字特征(如
2、平均是用样本的数字特征(如平均数、标准差等)估计总体特征。数、标准差等)估计总体特征。二、样本估计总体的方法二、样本估计总体的方法我国是世界上严重缺水的国家之一。我国是世界上严重缺水的国家之一。20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市如何节约用水?如何节约用水?例:例:某市政府为了节约生活用水,计划在本市试某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水行居民生活用水定额管理,即确定一个居民月用水量标准量标准a,用水量不超过用水量不超过a的部分按平价收费,超过的部分按平价收费,超过a的部分按议价收费。
3、的部分按议价收费。如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a定为多少比较合理呢定为多少比较合理呢?为了较合理地确定这个标准,为了较合理地确定这个标准,你认为你认为需要做需要做 哪些工作?哪些工作?思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月位居民某年的月平均用水量平均用水量(单位:单位:t)t),如下表:,如下表:三、样本分析三、样本分析 一般通过表、图、计算来分析一般通过表、图、计算来分析数据,帮助我们找出样本数据中的数据,帮助我们找出样本数据中
4、的规律,使数据所包含的信息转化成规律,使数据所包含的信息转化成直观的容易理解的形式。直观的容易理解的形式。频数分布表频数分布表和和频数分布图频数分布图可以使我可以使我们能够清楚的知道数据分布在各个小们能够清楚的知道数据分布在各个小组的个数。组的个数。频率分布表频率分布表和和频率分布直方图频率分布直方图则则是从各个小组数据在样本容量中是从各个小组数据在样本容量中所占所占比例的大小比例的大小的角度,来表示数据的角度,来表示数据分布分布的规律的规律,它可以使我们看到整个样本,它可以使我们看到整个样本数据的频率分布情况。数据的频率分布情况。通过抽样,我们获得了通过抽样,我们获得了100100位居民某年
5、的月位居民某年的月平均用水量平均用水量(单位:单位:t)t),如下表:,如下表:知识探究(一):频率分布表知识探究(一):频率分布表 1.1.求极差(即一组数据中最大值与最小值求极差(即一组数据中最大值与最小值 的差)的差)2.2.决定组距与组数决定组距与组数组数组数=4.3-0.2=4.14.3-0.2=4.14.14.10.50.5=8.2=8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5),0.50.5,1 1),4 4,4.54.5 组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4.4.列频率分布表列频率分
6、布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表频率频率=频数频数样本容量样本容量频数频数=样本数据落在各小组内的个数样本数据落在各小组内的个数一一、求求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,取通常对组内数值所在区间,取 左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以可以按以下的步骤进行下的
7、步骤进行:五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示 频率组距频率组距)思考思考1 1:为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:信息用下面的图形表示:频率分布直方图中频率分布直方图中各小长方形的各小长方形的宽度和高度宽度和高度在数量上有何特点在数量上有何特点?月均用水量月均用水量/t/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.
8、5 4 4.5 O O知识探究(知识探究(二二):):频率分布直方图频率分布直方图 宽度:组距宽度:组距高度:高度:频率频率组距组距频率频率/组组距距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 画频率分布直方图画频率分布直方图小长方形的面积小长方形的面积=组距组距频率频率=组距组距频率频率注意:注意:这里的纵坐标不是频率,这里的纵坐标不是频率,而是频率而是频率/组距;组距;某个区间上的频率用某个区间上的频率用这个区间矩形的面积表示;这个区间矩形的面积表示;直方图直方图0.080.160.300.440.500
9、.280.120.080.04思考思考2 2:频率分布直方图中各小长方形的面频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少积表示什么?各小长方形的面积之和为多少?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O各小长方形的面积各小长方形的面积=对应频率对应频率各小长方形的面积之和各小长方形的面积之和=1=11.1.某校共有某校共有50005000名学生,该名学生,该校学生每月课外读物方面的校学生每月课外读物方面的支出总体上在支出总体上在20602060元之间元之间其频率分布直方图如右图
10、所其频率分布直方图如右图所示,为具体了解同学们购买示,为具体了解同学们购买课外读物的具体情况,按支课外读物的具体情况,按支出的情况进行分层抽样,抽出的情况进行分层抽样,抽出一个容量为出一个容量为100100的样本进行的样本进行分析,其中支出在分析,其中支出在元元频频率率组组距距20 30 40 50 600.010.0360.024元的同学应抽取元的同学应抽取 人。人。30理论迁移理论迁移 思考思考3 3:频率分布直方图非常直观地表明了样本频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能
11、在图中表示不太清楚的数据模式,但原始数据不能在图中表示出来出来.你能根据上述频率分布直方图指出居民月均你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?用水量的一些数据特点吗?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中
12、在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.理论迁移理论迁移 2 2 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444,40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,45
13、45,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比岁的知识分子所占的比 例约是多少例约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分
14、为8 8组组.分分 组组 频数频数 频率频率2727,3232)3 0.06 3 0.063232,3737)3 0.063 0.063737,4242)9 0.189 0.184242,4747)16 0.3216 0.324747,5252)7 0.14 7 0.145252,5757)5 0.10 5 0.105757,6262)4 0.084 0.086262,67 67 3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030
15、.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故故年龄在年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.小结:小结:频率分布直方图频率分布直方图步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图频率分布直方图以面积的形式反映了数据落
16、在频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小各个小组的频率的大小.必修必修3 3实验实验例例1.关于频率分布直方图中小长方形的高说法,关于频率分布直方图中小长方形的高说法,正确的是(正确的是()A.表示该组上的个体在样本中出现的频率表示该组上的个体在样本中出现的频率B.表示某数的频率表示某数的频率C.表示该组上的个体数与组距的比值表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距表示该组上的个体在样本中出现的频率与组距 的比值的比值应用举例:应用举例:D2 2根据中华人民共和国道路根据中华人民共和国道路交通安全法规定:交通安全法规定:血液酒精血液酒精浓
17、度在浓度在80mg/100ml80mg/100ml(含(含8080)以)以上时,属醉酒驾车上时,属醉酒驾车,处十五日,处十五日以下拘留和暂扣三个月以上六以下拘留和暂扣三个月以上六个月以下驾驶证个月以下驾驶证,并处并处500500元以元以上上20002000元以下罚款据法制元以下罚款据法制晚报报道,晚报报道,20092009年年8 8月月1515日至日至8 8月月2828日,全国查处酒后驾车和日,全国查处酒后驾车和醉酒驾车共醉酒驾车共5 50000人,如图人,如图1 1是对是对这这5 50000人酒后驾车血人酒后驾车血 液中酒精液中酒精含量进行检测所得结果的频率含量进行检测所得结果的频率分布直方
18、图,则属于分布直方图,则属于醉酒驾车醉酒驾车的人数约为(的人数约为()A A2525 B B5050C C7575 D D100100答案:答案:C3 3学校为了调查学生学校为了调查学生在课外读物方面的支出在课外读物方面的支出况,抽出了一个容量为况,抽出了一个容量为n的样本,其频率分布的样本,其频率分布直方图如右图所示,其直方图如右图所示,其中支出在中支出在 元的元的同学有同学有3030人,则人,则n的值的值为为 元元频频率率组组距距20 30 40 50 600.010.0360.0241004 4统计某校统计某校10001000名学生的数学水平测试成绩,名学生的数学水平测试成绩,得到样本频
19、率分布直方图如图所示,若满分为得到样本频率分布直方图如图所示,若满分为100100分,规定不低于分,规定不低于6060分为及格,则及格率是分为及格,则及格率是()A A20%20%B B25%25%C C60%60%D D80%80%D D例例5:从高二学生中抽取:从高二学生中抽取50名同学参加数学竞赛,名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分)成绩的分组及各组的频数如下(单位:分)40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100),8;(1)列出样本的频率分布表)列出样本的频率分布表;(2)画出频率分布直方图;)画出频率分布直方图;(3)估计成绩在)估计成绩在60,90)分的学生比例。分的学生比例。COMPANY LOGO 作作 业业 1、课时训练、课时训练 P732、探究咱班学生的身高、探究咱班学生的身高 分布情况分布情况COMPANY LOGO
限制150内