《221(1)用样本的频率分布估计总体分布.ppt》由会员分享,可在线阅读,更多相关《221(1)用样本的频率分布估计总体分布.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教学目标1 通过实例体会分布的意义和作用。通过实例体会分布的意义和作用。2 2在表示样本数据的过程中,学会列频率分在表示样本数据的过程中,学会列频率分布表,画频率分布直方图布表,画频率分布直方图, ,频率频率分布折线分布折线图图3 3能通过样本的频率分布估计总体的分布能通过样本的频率分布估计总体的分布。我国是世界上严重缺水的国家之一,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。城市缺水问题较为突出。20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市引入引入政府为了节约生活用水,计划在本市试行居民生政府为了节约生活用水,计划在本市试行居
2、民生活用水定额管理,即确定一个居民月用水量标准活用水定额管理,即确定一个居民月用水量标准a , a , 用水量不超过用水量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的的部分按议价收费。部分按议价收费。 如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a a定为多少比较合理呢定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做为了较合理地确定这个标准,你认为需要做 哪些工作?哪些工作? 这些数字告诉我们这些数字告诉我们什么信息?什么信息? 通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某
3、年的月平均用水量( (单位:单位:t) t) ,如下表:,如下表: 1.1.求极差(即一组数据中最大值与最小值的差)求极差(即一组数据中最大值与最小值的差) 2.2.决定组距与组数决定组距与组数 4.3 4.3 - - 0.2 = 4.10.2 = 4.14.14.10.50.5 = 8.2= 8.2组数组数= =组距组距极差极差=3.3.将数据分组(左闭右开)将数据分组(左闭右开)0 0,0.50.5 ) ),0.50.5,1 1 ) ),4 4,4.54.5 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。组距:指每个小组的两个端点的距离, 组距:0.5 组数:94.
4、4.列频率分布表列频率分布表分组分组频数累计频数累计频数频数频率频率0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041001.00频率频率= =样本容量样本容量频数频数频率分布表一般分频率分布表一般分“分分组组”,“频数累计频数累计”(可省),(可省),“频数频数”,“频率频率”, , “频率频率/ /组组距距”五列,最后一行五列,最后一行是合计是合计注意频数的合计应注意频数的合计应是样本容量,频率是样本容量,频率合计应是合计应是1 10.
5、02频率频率/ /组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04小矩形的面积小矩形的面积组距组距频率频率组距组距频率频率= = =分组分组频数频数频率频率频率频率/组距组距0,0.5)40.040.080.5,1)80.080.161,1.5)150.150.301.5,2)220.220.442,2.5)250.250.502.5,3)140.140.283,3.5)60.060.123.5,4)40.040.084,4.520.020.04合计合计1005. 5. 画画频率频率分布直方
6、图分布直方图: :用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234请计算每个小矩形的面积请计算每个小矩形的面积,它代表什么它代表什么?为什么为什么?所有小矩形的面积的和是多少所有小矩形的面积的和是多少?1 1注意纵坐标是频率/组距用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234频率分布直方图频率分布直方图, ,显示了样本数据落在各个小组的比例的大小显示了样本数据落在各个小组的比例的大小, ,图中最高的小矩形说明了什么图中最高的小矩形说明了什么? ?大部分居民的月均
7、用水量都集中在什么之间大部分居民的月均用水量都集中在什么之间? ?月均用水量在月均用水量在2,2.5)2,2.5)内的居民最多内的居民最多. .1,3)1,3)之间之间. .频率分布直方图的特征:频率分布直方图的特征:优点:从频率分布直方图可以清楚地看出数据分布的总体趋势优点:从频率分布直方图可以清楚地看出数据分布的总体趋势缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据就被抹掉了方图后,原有的具体数据就被抹掉了如果当地政府希望如果当地政府希望85%85%以上的居民每月的用水量不超出以上的居民每月的用水量
8、不超出标准标准, ,根据频率分布表和频率分布直方图根据频率分布表和频率分布直方图, ,你能对制定你能对制定月用水量提出建议吗月用水量提出建议吗? ?用水量用水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234分组分组频数频数频率频率累积频率累积频率0,0.5)40.040.5,1)80.081,1.5)150.151.5,2)220.222,2.5)250.252.5,3)140.143,3.5)60.063.5,4)40.044,4.5)20.02合计合计1001.000.040.120.270.490.740.880.940.981.0
9、088%88%的居民月用水量在的居民月用水量在3t3t以下,可建议取以下,可建议取a=3.a=3. 思考:在实际中,取思考:在实际中,取a=3ta=3t一定能保证一定能保证85%85%以上以上的居民用水不超标吗?哪些环节可能会导致的居民用水不超标吗?哪些环节可能会导致结论出现偏差?结论出现偏差?不能。分组时,组距的大小可能会导致结论不能。分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行出现偏差,实践中,对统计结论是需要进行评价的评价的. . 频率分布频率分布折线图折线图如下如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5
10、 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图利用样本频率分布对总体分布进行相应估利用样本频率分布对总体分布进行相应估计计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布折线图就会无限接
11、近于一条光滑那么频率分布折线图就会无限接近于一条光滑曲线,统计中称这条光滑曲线为曲线,统计中称这条光滑曲线为总体密度曲总体密度曲线线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。 用样本分布直
12、方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布折线图频率分布折线图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。 总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线例1对某电子元件进行寿命追踪调查,情况如下:寿
13、命寿命个数个数1002002003003004004005005006002030804030(1)列出频率分布表;(2)画出频率分布直方图及频率分布折线图;(3)估计电子元件寿命在100h400h以内的频率;(4)估计电子元件寿命在400h以上的频率;应用举例:应用举例:(1)列出频率分布表;100200200300300400400500500600寿命寿命合计合计频率频率频数频数频率频率/组距组距20308040302000.100.150.400.200.1510.0010.00150.0040.0020.0015500100200300400600)寿命(h频率/组距0(3)电子元件
14、寿命在100h400h以内的频率为0.65(4)电子元件寿命在400h以上的频率为0.35频率分布直方图频率分布直方图步骤步骤2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表1.1.求极差求极差5.5.画频率分布直方图画频率分布直方图小结小结1. 右图是容量为右图是容量为100的的样本的频率分布直方图样本的频率分布直方图,试根据图中的数据填空试根据图中的数据填空:(1)样本数据落在范围样本数据落在范围6,10)内的频率为内的频率为_;(2)样本数据落在范围样本数据落在范围10,14)内的频数为内的频数为_;(3)总体在范围总体在范围2,6)内的内
15、的概率约为概率约为_;O2610 14 180.020.030.080.09样本样本数据数据频率频率组距组距0.32360.08检测检测2.一个容量为一个容量为35的样本的样本,分组后分组后,组距与频数如下组距与频数如下:5,10)5,10,15)12,15,20)7,20,25)5,25,30)4,30,35)2,则样本在区间则样本在区间20,+)上的频率为上的频率为( )A.20% B.69% C.31% D.27%C3.一个容量为一个容量为3232的样本的样本, ,已知某组样本的频率已知某组样本的频率为为0.125,0.125,则该组样本的频数为则该组样本的频数为( )A.2 B.4 C
16、.6 D.8BO6070 80 90 1000.010.020.04车速车速频率频率组距组距1104.某路段检查监控录象某路段检查监控录象显示,在某时段内,有显示,在某时段内,有1000辆汽车通过该站,辆汽车通过该站,现在随机抽取其中的现在随机抽取其中的200辆汽车进行车速分辆汽车进行车速分析,则估计在这一时段析,则估计在这一时段内通过该站的汽车中速内通过该站的汽车中速度不小于度不小于90km/h的约的约有(有( )A100辆辆 B200辆辆C300辆辆 D400辆辆C5.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5, 15.5) 315.5,
17、18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5 4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的)的百分比是多少百分比是多少? 0.0400.0100.030频率频率组距组距解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/ 组距组距0.060.160.180.220.200.100.0810.0200.0530.0600.0730.0670.0330
18、.02712.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5 4合计合计 500.0200.05012.515.50.0600.07018.527.521.524.533.530.5数据落在数据落在15.5, 24.515.5, 24.5)的百分比是的百分比是5 56% P71 第第1题题1.1.求极差(即一组数据中最大值与最小值的差)求极差(即一组数据中最大值与最小值的差) 2.2.决定组距与组数决定组距与组数 364.41364.41 362.51 362.51
19、= 1.9 = 1.91.91.90.190.19 = 10 = 10组数组数= =组距组距极差极差=3.3.将数据分组(左闭右开)将数据分组(左闭右开)362.51362.51,362.7362.7 ) ),362.7362.7,362.89362.89 ) ),364.22364.22,364.41364.41 P71 P71 第第1 1题题 组距=0.194.4.列频率分布表列频率分布表分组分组频数累计频数累计频数频数频率频率362.51,362.7)362.7,362.89)362.89,363.08)363.08,363.27)363.27,363.46)363.46,363.65)
20、363.65,363.84)363.84,364.03)364.03,364.22 )364.22,364.41合计合计3561181813750.03750.06250.0750.13750.10.2250.16250.0875801.000.0625频率频率/ /组距组距3/(803/(800.19)0.19)5/(805/(800.19)0.19)6/(806/(800.19)0.19)11/(8011/(800.19)0.19)8/(808/(800.19)0.19)18/(8018/(800.19)0.19)13/(8013/(800.19)0.19)7/(807/(800.19)0
21、.19)5/(805/(800.19)0.19)4 40.054/(804/(800.19)0.19)分组分组频频数数频率频率频率频率/组距组距362.51,362.7)30.03753/(800.19)362.7,362.89)50.06255/(800.19)362.89,363.08)60.0756/(800.19)363.08,363.27)110.137511/(800.19)363.27,363.46)80.18/(800.19)363.46,363.65)180.22518/(800.19)3363.65,363.84)130.162513/(800.19)363.84,364.
22、03)70.08757/(800.19)363.03,364.22)50.06255/(800.19)364.22,364.4140.054/(800.19)合计合计8015. 5. 画画频率频率分布直方图分布直方图: :4/(804/(800.19)0.19)O频率频率/组距组距362.7注意纵坐标是频率/组距362.51362.51362.89362.89 363.08363.08 363.27363.27 363.46363.46363.65363.65 363.84363.84 364.02364.02 364.22364.22 364.41364.41尺寸尺寸/cm/cm 为了检测某
23、种产品的质量,抽取了一个容量为为了检测某种产品的质量,抽取了一个容量为100的样的样本,数据的分组情况与频数如下:本,数据的分组情况与频数如下:10.75,10.85),3;10.85,10.95),9;10.95,11.05),13;11.05,11.15),16;11.15,11.25),26;11.25,11.35),20;11.35,11.45),7;11.45,11.55),4;11.55,11.65,2(1)列出频率分布表;列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;画出频率分布直方图以及频率分布折线图;(3)据上述图表,估计数据落在据上述图表,估计数据落在10.9
24、5,11.35)范围内的可能范围内的可能性是百分之几;性是百分之几;(4)数据小于数据小于11.20的可能性是百分之几的可能性是百分之几审题指导审题指导 根据画频率分布直方图的步骤先画频率分布根据画频率分布直方图的步骤先画频率分布直方图,再画折线图直方图,再画折线图题型题型三三频率分布直方图的综合应用频率分布直方图的综合应用【例例3】创新设计创新设计P41P41规范解答规范解答 (1)频率分布表如下:频率分布表如下:分组分组频数频数频率频率10.75,10.85)30.0310.85,10.95)90.0910.95,11.05)130.1311.05,11.15)160.1611.15,11
25、.25)260.2611.25,11.35)200.2011.35,11.45)70.0711.45,11.55)40.0411.55,11.6520.02合计合计1001.00(3分)分)(2)频率分布直方图及频率分布折线图,如图频率分布直方图及频率分布折线图,如图(3)由上述图表可知数据落在由上述图表可知数据落在10.95,11.35)范围内的频率为范围内的频率为1(0.030.09)(0.070.040.02)0.7575%,即数据落在,即数据落在10.95,11.35)范围内的可能性是范围内的可能性是75%. (10分分)(4)数据小于数据小于11.20的可能性即数据小于的可能性即数据
26、小于11.20的频率,设为的频率,设为x,则则(x0.41)(11.2011.15)(0.670.41)(11.2511.15),所以所以x0.410.13,即,即x0.54,从而估计数据小于从而估计数据小于11.20的可能性是的可能性是54%. (12分分)(8分)分)【题后反思题后反思】 (1)用样本的频率分布估计总体的分布,是用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目的,频率分布列频率分布表和画频率分布直方图的主要目的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布能直观
27、地反映样本的频率分布(2)频率分布直方图反映了样本在各个范围内取值的可能性,频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性估计总体在这一范围内的可能性 (2012盐城高一检测盐城高一检测)为了了解高一年级学生的体能为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图得数据整理后,画出频率分布直方图(如图所示如图所示),图中从,图中从左到右各小长方形的面积之比为左到右各小长方形的面积之比为2 4 17 15 9 3,第,第二小组的频数为二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?第二小组的频率是多少?样本容量是多少?(2)若次数在若次数在110以上以上(含含110次次)为达标,则该校全体高一年为达标,则该校全体高一年级学生的达标率是多少?级学生的达标率是多少?【变式变式3】创新设计创新设计 P42P42 创新设计创新设计 P42P42
限制150内