《用样本频率分布估计总体分布.pptx》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布.pptx(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、频率分布 样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率。频率分布的表示形式有:样本频率分布表样本频率分布图 样本频率分布条形图 样本频率分布直方图样本频率分布折线图 所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。第1页/共34页1、抛掷硬币的大量重复试验的结果:35 964反面向上36 124正面向上频率频数实验结果0.501 1 0.498 9频率分布条形图0.10.20.30.40.50.60.701试验结果频率“正面向上”记为0“反面向上”记为1频率分布表:注意:各长方形长条的宽度要相同。相邻长条的间距要适当。结论:当试验次数无限增大时,两种试验结果的频
2、率大致相等。长方形长条的高度表示取各值的频率。第2页/共34页 例1.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件 (1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少 解:(1)样本的频率分布表为:0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品解:(2)样本频率分布 的条形图为:0.10.20.30.40.50.60.7一级品 二级品产品频率三级品 次品(3)此种产品为二级品或三级品的概率约为 第3页/共34页知识探究(一):频
3、率分布表【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2013年的月均用水量如下表(单位:t):第4页/共34页3.1 2.5 2.0 3.4 2.6 2.2 1.5 1.2 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 3.0 2.9 2.4 2.5 2.8 2.3 1.8 1.3 2.5 2.6 2.3 2.1 1.6 1.0 显然:这个例子与前面抛掷硬币的问题是不同的,这
4、里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:频率分布表和频率分布直方图第5页/共34页1.极差:样本数据中的最大值和最小值的差称为极差2.确定组距,组数:.如果将上述100个数据按组距为进行分组,那么这些数据共分为多少组?()画频率分布直方图的步骤第6页/共34页 3 将数据分组,决定分点:以组距为进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?4 画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?0,),1),1,),4,4.5.第7页/共34页 分 组 频数累计 频数 频
5、率 0,),1)正 1,)正 正 正 ,2)正 正 正 正 2,)正 正 正 正 正 ,3)正 正 3,)正 一 ,4)4,合计 第8页/共34页知识探究(二):频率分布直方图 5 画频率分布直方图 为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第9页/共34页上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.5
6、1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距高度:频率组距2 图形的意义 第10页/共34页图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距高度:频率组距第11页/共34页频率分布的条形图和频率分布直方图的区别 两者是不同的概念;横轴:两者表示内容相同思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?纵轴:两者表示的内容不相同频率分布条形图的纵轴(长方形的高)表示
7、频率 频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。第12页/共34页3 分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第13页/共34页(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少
8、;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第14页/共34页频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图第15页/共34页利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?第16页/共34页总体密度曲线频率组距月均用水量/
9、tab (图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体密度曲线总体密度曲线第17页/共34页 用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线第18页/共34页1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围2、决定组距与组数(将数据分组
10、)3、将数据分组取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。小结第19页/共34页1、一个容量为20的样本数据.分组后.组距与频数如下:(0,20 2;(20,30 3,(30,40 4;(40,50 5;(50,60 4;(60,70 2。则样本在(,50上的频率为:,7/10第20页/共34页2为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为岁18岁的男生体重(kg),得到频率分布直方图如下:C体重(kg)频率
11、/组距54.5 58.5 62.5 66.5 70.5 74.5 根据上图可得这100名学生中体重在56.5,64.5的学生人数是()A.20 B.30 C.40 D.50第21页/共34页240027003000330036003900X 体重y3、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:;第22页/共34页4.为为了了了了解解小小学学生生的的体体能能情情况况,抽抽取取了了某某小小学学同同年年级级部部分分学学生生进进行行跳跳绳绳测测试试,将将所所得得数数据据整整理理后后,画画出出频频率率分分布布直直方方图图如如图图,已已知知图图中中从从左左
12、到到右右前前三三个个小小组组的的频频率分别是,第一小组的频数为率分别是,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?第23页/共34页【解解】(1)第四小组的频率第四小组的频率10.4)0.2.(2)n第一小组的频数第一小组的频数第一小组的频率第一小组的频率50.(3)因为因为5050505010.即即第第一一、第第二二、第第三三、第第四四小小组组的的频频数数分分别别为为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内所以学生跳绳次数的中位数落在第三小组内解本题的关键是准确掌握频率、频数
13、、样本容量(数据总数)之间的关系及中位数的概念第24页/共34页变变式式训训练练为为了了了了解解高高一一学学生生的的体体能能情情况况,某某校校抽抽取取部部分分学学生生进进行行一一分分钟钟跳跳绳绳次次数数测测试试,将将所所得得数数据据整整理理后后,绘绘制制出出频频率率分分布布直直方方图图(如如图图所所示示),图图中中从从左左到到右右各各小小矩矩形形的的面面积积之之比比为为241715102,第二小组频数为第二小组频数为12.1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?解:(1)第二小组的频率是,样本容量是150.(
14、2)达标率为0.004)100.0881088%.第25页/共34页第26页/共34页第27页/共34页0123480 50 5 71 1 53茎叶第28页/共34页 甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲 乙 84 6 3 3 6 83 8 9 1012345 4 6 1 6 7 9 90 5第29页/共34页当样本数据较少时,用茎叶图表示数据的效果较好第30页/共34页练习:某中学高一(2)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:甲的得分:95,
15、81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。第31页/共34页表示样本分布的方法:(1)频率分布表优点是在数量表示上比较确切,缺点是不够直观、形象,分析数据分布的总体态势不太方便(2)频率分布图(包括直方图和条形图)优点:易表示大量数据,直观地表明分布地 情况;缺点:丢失一些信息。(3)频率分布折线图优点是它反映了数据的变化趋势(4)茎叶图优点:(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.缺点:只能处理样本容量较小数据小结第32页/共34页1.频率分布表 表示样本的分布的方法:频率/组距产品尺寸(mm)2.频率分布直方图样本频率分布中,当样本容量无限增大,组距无限缩小4.样本频率分布直方图接近于一条光滑曲线总体密度曲线,反映了总体分布。3.频率分布折线图5.茎叶图第33页/共34页感谢您的观看!第34页/共34页
限制150内