《用样本频率分布估计总体分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布ppt课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.2.1 2.2.1 用样本的频率分用样本的频率分布估计总体分布布估计总体分布 我们用我们用简单随机抽样、系统抽样、分层简单随机抽样、系统抽样、分层抽样抽样的方法收集样本数据后,就可以通过样的方法收集样本数据后,就可以通过样本研究总体。本研究总体。 用样本估计总体的两种情况:用样本估计总体的两种情况:用用样本的频率分布样本的频率分布估计总体分布估计总体分布用用样本的数字特征样本的数字特征(平均数、标准差等)(平均数、标准差等) 估计总体的数字特征估计总体的数字特征 复习回顾复习回顾频数:频数:不分组时,数据中某个数据出现的次数不分组时,数据中某个数据出现的次数 分组时,一个组内的数据的个数分
2、组时,一个组内的数据的个数频率:频率:样本容量频数频率 极差:极差:最大数最大数-最小数最小数分组分组频数频数频率频率频率频率/组距组距频率分布表:频率分布表:知识探究(一):频率分布表知识探究(一):频率分布表 某某市政府为了节约生活用水,计划在市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确本市试行居民生活用水定额管理,即确定一个居民月用水量标准定一个居民月用水量标准a a,用水量不,用水量不超过超过a a的部分按平价收费,超出的部分按平价收费,超出a a的部分的部分按议价收费按议价收费. .问题问题1 1:如果希望大部分居民的日常生活如果希望大部分居民的日常生活 不受影响
3、,那么标准不受影响,那么标准a a定为多少比较合理?定为多少比较合理?问题问题2 2:为了较为合理的确定:为了较为合理的确定标准标准a a,需要做,需要做 哪些工作?哪些工作?通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的月年的月均用水量如下表(单位:均用水量如下表(单位:t t):):3.1 2.5 2.0 2.03.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.23.4 2.6 2.2 2.2 1.5 1.2 1.5 1.2 0.20.2 0.4 0.3
4、 0.4 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.34.33.0 2.9 2.4 2.43.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7
5、 2.0 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.02.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.
6、22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2问题问题3:这些数字告诉了我们什么信息?这些数字告诉了我们什么信息?我们可以看出,样本数据中的最大值我们可以看出,样本数据中的最大值4.34.3和最和最小值,其他数据在小值,其他数据在0.20.24.34.3之间之间分析数据的基本方法:分析数据的基本方法: 用图画出来用图画出来 用表格重新排列用表格重新排列1、借助于、借助于图:图:频率分布直方图、频率分布折线图、频率分布直方图、频率分布折线图、茎叶图茎叶图两个目的从数据中提取信息两个目的从数据中提取信息 利用图形传递信息利用图形传递信息2、借助于、借助于表格:表格
7、: 频率分布表频率分布表两个目的两个目的 改变数据的排列方式改变数据的排列方式提供解释数据的新方式提供解释数据的新方式第二步:确定组距,第二步:确定组距, 组数组数组距组距= =每个小组两个每个小组两个端点的差端点的差. .组数组数= =极差极差组距组距 (取整数)(取整数)探究一探究一 频率分布表频率分布表(4.4.1 10.5=8.20.5=8.2将将8.28.2取整,组数取整,组数=9=9,组距组距=0.5=0.5思考思考1:上述上述100个数据的个数据的最小值和最大值分别是多最小值和最大值分别是多少?少?第一步:求极差第一步:求极差思考思考2:分成多少组分成多少组合适?合适?如果将上述
8、如果将上述100100个数据按组个数据按组距为距为0.50.5进行分组,那么这进行分组,那么这些数据共分为多少组?些数据共分为多少组?极差:极差:4.3-0.2=4.1512组组第四步:列频率第四步:列频率 分布表分布表探究一探究一 频率分布表频率分布表思考思考3:各组:各组数据的取值范数据的取值范围如何设定?围如何设定?第三步:确定端第三步:确定端点,将数据分组点,将数据分组 各组均为各组均为左开右闭左开右闭区间,最后一个闭区间,最后一个闭区间区间思考思考4:如何统计各如何统计各族中的频数、频率?族中的频数、频率?00,0.50.5),),0.50.5,1 1),),11,1.51.5),)
9、,44,4.5.4.5. 分分 组组 频数频数 频率频率 频率频率/ /组距组距 0 0,0.50.5) 4 0.04 0.08 4 0.04 0.08 0.5 0.5,1 1) 8 0.08 0.168 0.08 0.16 1 1,1.51.5) 15 0.15 0.3015 0.15 0.30 1.5 1.5,2 2) 22 0.22 0.4422 0.22 0.44 2 2,2.52.5) 25 0.25 0.5025 0.25 0.50 2.5 2.5,3 3) 14 0.14 0.2814 0.14 0.28 3 3,3.53.5) 6 0.06 0.126 0.06 0.12 3.
10、5 3.5,4 4) 4 0.04 0.084 0.04 0.08 4 4,4.5 2 0.02 0.044.5 2 0.02 0.04 合计合计 100 1.00 2100 1.00 2探究(二):画频率分布直方图探究(二):画频率分布直方图 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O第一步:第一步:画直角坐标系:画直角坐标系: x轴为数据单位,轴为数据单位,y轴为频率轴为频率/ 组距组距第二步第二步:在在x轴上均匀标出各
11、组分点,轴上均匀标出各组分点, 在在y轴上标出单位长度轴上标出单位长度第三步:第三步:以组距为宽,各组的频率以组距为宽,各组的频率/组距为高,组距为高,分别画出各组对应的长方形分别画出各组对应的长方形 问题问题1 1:频率分布直方图中各小长方频率分布直方图中各小长方形的宽度和高度在数量上有何特点?形的宽度和高度在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组距高度:高度:频率频率组距组距问题问题2 2:频率分布直方图中各小长方形的频率分布直方图中各小长方形的面积表示什么?各小长方
12、形的面积之和面积表示什么?各小长方形的面积之和为多少?为多少?各小长方形的面积各小长方形的面积= =各小组的各小组的频率频率各小长方形的面积之和各小长方形的面积之和= =1 1月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组距高度:高度:频率频率组距组距3 3 分析例题:分析例题:频率分布直方图非常直观频率分布直方图非常直观地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出据模式
13、,但原始数据不能在图中表示出来来. .你能根据上述频率分布直方图指出居你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的
14、分布有一定的对称性等)居民月均用水量的分布有一定的对称性等. .月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考:思考:对一组给定的样本数据,频率分对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以在居民月均用水量样本中,你能以1 1为组为组距画频率分布直方图吗?距画频率分布直方图吗? 与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关. .月均用水量月均用水量/t频率频率组距组距0.40.40.30.30
15、.20.20.10.11 2 3 4 51 2 3 4 5 O1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、 将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(填写频率填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在
16、将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。4.18.20.5 极极差差组组数数= =组组距距 小结小结理论迁移理论迁移 例例1 1 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444, 40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929, 48 48,4545,5353,4848,3737,2828,4646,50
17、50,3737,4444, 42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767, 53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少. .(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率
18、频率频率/ /组距组距 27 27,3232) 3 0.06 0.0123 0.06 0.012 32 32,3737) 3 0.06 0.0123 0.06 0.012 37 37,4242) 9 0.18 0.0369 0.18 0.036 42 42,4747) 16 0.32 0.06416 0.32 0.064 47 47,5252) 7 0.14 0.0287 0.14 0.028 52 52,5757) 5 0.10 0.0205 0.10 0.020 57 57,6262) 4 0.08 0.0164 0.08 0.016 62 62,6767) 3 0.06 0.0123 0
19、.06 0.012 合合 计计 50 1.00 0.20050 1.00 0.200样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.90901
20、00100110110120120130130140140150150次数次数o o0.0040.0040.0080.0080.0120.0120.0160.0160.0200.0200.0240.0240.0280.028频率频率/ /组距组距0.0320.0320.0360.036例例2 2:为了了解高一学生的体能为了了解高一学生的体能情况情况, ,某校抽取部分学生进行一分钟某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理跳绳次数次测试,将所得数据整理后,画出频率分布直方图后,画出频率分布直方图( (如图如图) ),图中从左到右各小长方形面积之比图中从左到右各小长方形面积之比为为2
21、 2:4 4:1717:1515:9 9:3 3,第二小组,第二小组频数为频数为12.12.第二小组的频率是多少?样本容量第二小组的频率是多少?样本容量是多少?是多少?若次数在若次数在110110以上(含以上(含110110次)为达次)为达标,试估计该学校全体高一学生的标,试估计该学校全体高一学生的达标率是多少?达标率是多少?练习巩固练习巩固 1 有一个容量为有一个容量为50的样本数据的分组的样本数据的分组及各组的频数如下:及各组的频数如下:12.5, 15.5) 3 24.5, 27.5) 1015.5, 18.5) 8 27.5, 30.5) 518.5, 21.5) 9 30.5, 33
22、.5) 421.5, 24.5) 11列出样本的频率分布表和画出频率列出样本的频率分布表和画出频率分布直方图;分布直方图;根据样本的频率分布估计,小于根据样本的频率分布估计,小于30.5的数据约占多少?的数据约占多少? 解解: :组距为组距为3 3 分组分组 频数频数 频率频率 频率频率/ / 组距组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.
23、0330.027频率分布直方图如下:频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070课堂练习课堂练习2(2006年全国卷年全国卷II)一个社会调查机构就某地居民一个社会调查机构就某地居民的月收入调查了的月收入调查了10 000人,并根据所得数据画了样人,并根据所得数据画了样本的频率分布直方图本的频率分布直方图(如下图如下图).为了分析居民的收入为了分析居民的收入与年龄、学历、职业等方面的关系,要从这与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出人中再用分层抽样方法抽出100人作进一步调查,人
24、作进一步调查,则在则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人.0.00010.00020.00030.00040.00051000 1500 2000 2500 3000 3500 4000月收入月收入(元元)频率频率/组距组距课堂练习课堂练习2一个社会调查机构就某地居民的月收入调查了一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图人,并根据所得数据画了样本的频率分布直方图(如下图如下图).为了分析居民的收入与年龄、学历、职业等为了分析居民的收入与年龄、学历、职业等方面的关系,要从这方面的关系,要从这10 000人中再用分层抽
25、样方法抽出人中再用分层抽样方法抽出100人作进一步调查,则在人作进一步调查,则在2500,3000(元元)月收入段应月收入段应抽出抽出_人人.0.00010.00020.00030.00040.0005月收入月收入(元元)频率频率/组距组距251000 1500 2000 2500 3000 3500 4000课堂练习课堂练习3某班某班50名学生在一次百米测试中,成绩全部介于名学生在一次百米测试中,成绩全部介于13秒与秒与19秒之间,将测试结果按如下方式分成六组:第秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于一组,成绩大于等于13秒且小于秒且小于14秒;第二组,成绩秒;第二组,成
26、绩大于等于大于等于14秒且小于秒且小于15秒;秒;第六组,成绩大于等于第六组,成绩大于等于18秒且小秒且小于等于于等于19秒右图是按上述分组秒右图是按上述分组方法得到的频率分布直方图设方法得到的频率分布直方图设成绩小于成绩小于17秒的学生人数占全班秒的学生人数占全班总人数的百分比为总人数的百分比为x,成绩大于等,成绩大于等于于15秒且小于秒且小于17秒的学生人数为秒的学生人数为y,则从频率分布直方图中可分析出则从频率分布直方图中可分析出x和和y分别为分别为( )A0.9,35 B0.9,45C0.1,35 D0.1,45O13141516171819秒秒频率频率/组距组距0.360.340.1
27、80.060.040.02课堂练习课堂练习3某班某班50名学生在一次百米测试中,成绩全部介于名学生在一次百米测试中,成绩全部介于13秒与秒与19秒之间,将测试结果按如下方式分成六组:第秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于一组,成绩大于等于13秒且小于秒且小于14秒;第二组,成绩秒;第二组,成绩大于等于大于等于14秒且小于秒且小于15秒;秒;第六组,成绩大于等于第六组,成绩大于等于18秒且小秒且小于等于于等于19秒右图是按上述分组秒右图是按上述分组方法得到的频率分布直方图设方法得到的频率分布直方图设成绩小于成绩小于17秒的学生人数占全班秒的学生人数占全班总人数的百分比为总人
28、数的百分比为x,成绩大于等,成绩大于等于于15秒且小于秒且小于17秒的学生人数为秒的学生人数为y,则从频率分布直方图中可分析出则从频率分布直方图中可分析出x和和y分别为分别为( )A0.9,35 B0.9,45C0.1,35 D0.1,45O13141516171819秒秒频率频率/组距组距0.360.340.180.060.040.02A课堂练习课堂练习4为了了解某地区高三学生的身体发育情况,抽为了了解某地区高三学生的身体发育情况,抽查了该地区查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg) ,得到频率分布直方图如下:得到频率分布直方图如下:根据上图可得这根据
29、上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是( )A. 20 B. 30 C. 40 D. 500.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 74.5 课堂练习课堂练习4为了了解某地区高三学生的身体发育情况,抽为了了解某地区高三学生的身体发育情况,抽查了该地区查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg) ,得到频率分布直方图得到频率分布直方图如下:如下:C0.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70
30、.5 74.5 根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是( )A. 20 B. 30 C. 40 D. 50课堂练习课堂练习身高身高/cm人数人数/人人145 155 165175 18550150250350450550195输入输入A1,A2,Ana0 i41 ii输出输出siAss 是是否否开始开始结束结束课堂练习课堂练习B身高身高/cm人数人数/人人145 155 165175 18550150250350450550195输入输入A1,A2,Ana0 i41 ii输出输出siAss 是是否否开始开始结束结束小结小结: :
31、 画频率分布直方图的步骤画频率分布直方图的步骤: : 第一步第一步: 求极差求极差: (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) 第二步第二步: 决定组距与组数决定组距与组数: (强调取整)(强调取整) 第三步第三步: 将数据分组将数据分组 ( 给出组的界限给出组的界限) 第四步第四步: 列频率分布表列频率分布表. (包括分组、频数、频率(包括分组、频数、频率、频、频率率/组距组距) 第五步第五步: 画频率分布直方图画频率分布直方图(在频率分布表的基础上(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率绘制,横坐标为样本数据尺寸,纵坐标为频率/组距组距.) 组距组
32、距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。4.18.20.5极差组数=组距注意注意第几组频数(1)第几组频率样本容量(2)纵坐标为纵坐标为:频率组距第二节第二节3 3 分析例题:分析例题:频率分布直方图非常直观频率分布直方图非常直观地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出据模式,但原始数据不能在图中表示出来来. .你能根
33、据上述频率分布直方图指出居你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有
34、一定的对称性等. .月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5在频率分布直方图中在频率分布直方图中取取各小长方形各小长方形上端的中点上端的中点用折线依次用折线依次连接各中点连接各中点得到得到频率分布折线图频率分布折线图用样本频分布估计总体分布用样本频分布估计总体分布 上例的样本容量为上例的样本容量为100,如,如果增至果增至1000,其频率分布直,其频率
35、分布直方图的情况会有什么变化?方图的情况会有什么变化?假如增至假如增至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。 当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线 用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般一般样本容
36、量越大,频率分布直方图就会无限接样本容量越大,频率分布直方图就会无限接近总体密度曲线近总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。 总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线茎茎 叶叶 图图 某赛季甲、乙两名篮球运动员每场比赛得分的某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:原始记录如下:(
37、1)甲运动员得分甲运动员得分:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39(2)乙运动员得分乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39 甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 (1)甲甲:8,13, 16, 14, 23, 26, 28, 38, 33, 39,51。(2)乙乙: 12,15,24,25,31,36,31, 36, 37,39,44,49,50,茎叶图茎叶图 当样本数据当样本数据较少较少时,用茎叶时,
38、用茎叶图表示数据的效果较好,它不但图表示数据的效果较好,它不但可以可以保留保留所有的信息,而且所有的信息,而且 可以可以随时随时记录记录,给数据的记录和表示,给数据的记录和表示都方便。都方便。 小小 结结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示)易表示大量数据大量数据 丢失一些丢失一些直方图直方图 2)直观直观地表明分布地地表明分布地 情况情况 信息信息 1)无信息损失无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据课堂小结课堂小结表示样本分布的方法:表示样本分布的方法:(1)频率分布表)频率分布
39、表(2)频率分布图直方图)频率分布图直方图(3)频率分布折线图)频率分布折线图(4)茎叶图)茎叶图1.频率分布表频率分布表 表示样本的分布的方法:表示样本的分布的方法:分组分组频数频数频率频率频率频率/组距组距频率频率/组距组距产品尺寸产品尺寸(mm)2.频率分布直方图频率分布直方图样本频率分布中,样本频率分布中,当样本容量无限增当样本容量无限增大,组距无限缩小大,组距无限缩小样本频率分布直方图样本频率分布直方图接近接近于一条光滑曲线于一条光滑曲线总体总体密度曲线密度曲线,反映了总体分,反映了总体分布。布。3.频率分布折线图频率分布折线图频率分布的条形图和频率分布直方图的区别频率分布的条形图和
40、频率分布直方图的区别 两者是不同的概念;两者是不同的概念;横轴:两者表示内容横轴:两者表示内容相同相同思考:思考: 频率分布条形图和频率分布直方图是两个频率分布条形图和频率分布直方图是两个相同的概念吗?相同的概念吗? 有什么区别?有什么区别?纵轴:两者表示的内容纵轴:两者表示的内容不相同不相同频率分布条形图频率分布条形图的纵轴(长方形的高)表示频率的纵轴(长方形的高)表示频率 频率分布直方图频率分布直方图的纵轴(长方形的高)表示的纵轴(长方形的高)表示频率与组距的比值,频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。其相应组距上的频率等于该组距上长方形的面积。 =频率长方形的面积
41、组距频率组距 1.总体分布指的是总体取值的频率分布规律,总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。的频率分布去估计总体的分布。 2.总体的分布分两种情况:当总体中的个体取总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。频率分布表或频率分布直方图。 小结小结练习:练习:某中学高一(某中学高一(2)班甲,乙两)班甲,乙两名同学自高中以来每场数学考试成名同学自高中以来每场数学考试成绩情况如下:绩情况如下:甲的得分:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。茎叶图对两人的成绩进行比较。
限制150内