数据的频数分布(沪科版).ppt
数据的频数分布数据的频数分布( (二二) )条形统计图可条形统计图可以清楚地表示以清楚地表示出每个项目的出每个项目的具体数目具体数目折线统计图可以折线统计图可以清楚地反映事物清楚地反映事物变化的情况变化的情况扇形统计图可以扇形统计图可以清楚地表示各部清楚地表示各部分在总体中所占分在总体中所占的百分比的百分比你还记得各个统计图的特点:你还记得各个统计图的特点:沙尘暴袭我国北方沙尘暴袭我国北方2.7亿人受苦亿人受苦 或蔓延至长江以南或蔓延至长江以南 某校学生在假期进行某校学生在假期进行“空气质量调查空气质量调查”的课题研究的课题研究时,他们从当地的气象部门提供的今年上半年的资料中,时,他们从当地的气象部门提供的今年上半年的资料中,随意抽取随意抽取3030天的空气综合污染指数,数据如下:天的空气综合污染指数,数据如下:国家环保总局公布的空气质量级别表国家环保总局公布的空气质量级别表引例引例3030,7777,127127,5353,9898,130130,5757,153153,8383,3232,4040,8585,167167,6464,184184,201201,6666,3838,8787,4242,4545,9090,4545,7777,235235,4545,113113,4848,9292,243.243.空气污染空气污染指数指数05051100101150151200 201250251300 大于大于300空气质量级别级(优)级(良)级1(轻微污染)级2(轻度污染)级1(中度污染)级2中度重污染级重度污染请你根据上面级别的五级,同学们根据下表进行整理请你根据上面级别的五级,同学们根据下表进行整理(1 1)说说这)说说这3030天的空气质量,根据国家公布的级别,天的空气质量,根据国家公布的级别,各级别各占多大频率(即分布情况)各级别各占多大频率(即分布情况)(2)该校学生估计该地今年(按)该校学生估计该地今年(按365天计算)空气质量达到优级天计算)空气质量达到优级别的天数约是别的天数约是110天,你知道他们是怎样估计出这个结论的?天,你知道他们是怎样估计出这个结论的?空气污染空气污染指数指数05051100101150151200201250251300大于大于300天数912333003030,7777,127127,5353,9898,130130,5757,153153,8383,3232,4040,8585,167167,6464,184184,201201,6666,3838,8787,4242,4545,9090,4545,7777,235235,4545,113113,4848,9292,243.243.师生讨论:师生讨论: 问题问题1 1启示我们:面对大量的数据,要想从中获取所启示我们:面对大量的数据,要想从中获取所需要的信息。常常先要选择好合适的统计表,把相差不需要的信息。常常先要选择好合适的统计表,把相差不大的数据放在一起,进行适当的分组,然后统计出落在大的数据放在一起,进行适当的分组,然后统计出落在各个小组内数据的个数,并借助表格将分组结果及各组各个小组内数据的个数,并借助表格将分组结果及各组数据的个数进行整理,这样,便能反映出这批数据的分数据的个数进行整理,这样,便能反映出这批数据的分布规律。布规律。 下面我们就来通过具体的例子,学习这种分析下面我们就来通过具体的例子,学习这种分析数据的分布方法数据的分布方法4040,2121,3535,2424,4040,3838,2323,5252,3535,6262,3636,1515,5151,4545,4242,4040,3232,4343,3636,3434,5353,3838,4040,3939,3232,4545,4040,5050,4545,4040,5050,2626,4545,4040,4545,3535,4040,4242,4545,4040。为了了解这批数据反映的情况,可以对它们进行怎样的分析呢?为了了解这批数据反映的情况,可以对它们进行怎样的分析呢?问题问题2 某校体卫组对该该校八年级学生一周内平均某校体卫组对该该校八年级学生一周内平均每天参加课外体育锻炼的时间(单位:每天参加课外体育锻炼的时间(单位:min)min)有所了解,有所了解,从中随机抽查了从中随机抽查了4040名学生,结果如下:名学生,结果如下:一般地,可以按照下列步骤来分析:一般地,可以按照下列步骤来分析:(1)计算这组数据中的最大值和最小)计算这组数据中的最大值和最小值值(5)画频数分布图)画频数分布图(4)列频数分布表)列频数分布表(2)决定组距和组数)决定组距和组数(3)决定分点)决定分点极差极差= =最大值最大值- -最小值最小值 组距是指每个小组的两个端点间的距离,将这批数组距是指每个小组的两个端点间的距离,将这批数据分组,如果每组组距相同,并去除组距为据分组,如果每组组距相同,并去除组距为8,那么,那么4040,2121,3535,2424,4040,3838,2323,5252,3535,6262,3636,1515,5151,4545,4242,4040,3232,4343,3636,3434,5353,3838,4040,3939,3232,4545,4040,5050,4545,4040,5050,2626,4545,4040,4545,3535,4040,4242,4545,4040。(1 1)计算这组数据中的最大值和最小)计算这组数据中的最大值和最小值值由此可知道这批数据的变动范围由此可知道这批数据的变动范围极差极差=62-15=47=62-15=47(2 2)决定组距和组数)决定组距和组数组数组数=组距组距最大数最大数-最小数最小数478=6即把数据分成即把数据分成6组组 将数据按照将数据按照8min8min的组距分组,从的组距分组,从1515开始,分成开始,分成6 6组组15231523,23312331,31393139,39473947,47554755,55635563 方法是:为了避免这种情况,一般地把表示分点的数方法是:为了避免这种情况,一般地把表示分点的数比原数多取一位小数,并把第一组的起点定为比最小的比原数多取一位小数,并把第一组的起点定为比最小的数据稍小一点的数,把第一组定为数据稍小一点的数,把第一组定为14.5。4040,2121,3535,2424,4040,3838,2323,5252,3535,6262,3636,1515,5151,4545,4242,4040,3232,4343,3636,3434,5353,3838,4040,3939,3232,4545,4040,5050,4545,4040,5050,2626,4545,4040,4545,3535,4040,4242,4545,4040。(3)决定分点)决定分点同学们对照数据发现什么问题?该如何解决呢同学们对照数据发现什么问题?该如何解决呢 ? 从从14.514.5开始,分成开始,分成6 6组;组;14.522.514.522.5,22.530.522.530.5,30.538.530.538.5,38.546.538.546.5,46.554.546.554.5,54.562.554.562.5下列数据分组表示分点的数应取到哪一位下列数据分组表示分点的数应取到哪一位,1.110,120,120,130,150,210.110,150,160,220.230 150,120,210,130,170,180,160,170,110,190,210,240,260,310,2102.0.2,0.3,0.3,0.5,0.52,0.4,0.38,0.3.下面请大家根据上面数据下面请大家根据上面数据 填写下频数分布表:填写下频数分布表:4040,2121,3535,2424,4040,3838,2323,5252,3535,6262,3636,1515,5151,4545,4242,4040,3232,4343,3636,3434,5353,3838,4040,3939,3232,4545,4040,5050,4545,4040,5050,2626,4545,4040,4545,3535,4040,4242,4545,4040。(4)列频数分布表)列频数分布表分组分组频数统计频数统计频数频数14。522.522。530.530.538.538.546.546.554.554.562.5合计23正 正10正 正正19正 5 1404040名学生平均每天锻炼名学生平均每天锻炼时间频数分布表时间频数分布表分组分组频数统计频数统计频数频数14。522.522。530.530.538.538.546.546.554.554.562.5合计2310195140 编制频数分布表的关键是编制频数分布表的关键是什么?什么? 1:关键是分组。数据越:关键是分组。数据越 多,分的组数就越多;多,分的组数就越多; 2:确定组距。一般来说:确定组距。一般来说数数 据在据在100内,内, 可以方分可以方分成成 512组;组; 3:组距可以相同,也可以:组距可以相同,也可以彼此不同;彼此不同; 4:切记每个数据只能落在:切记每个数据只能落在一个组内一个组内正 正正 正正 正 方法:画出相互垂直的两条直线,用横轴表示分组方法:画出相互垂直的两条直线,用横轴表示分组情况,纵轴表示频数,绘出相应的长方形条,就得到了情况,纵轴表示频数,绘出相应的长方形条,就得到了频数直方图频数直方图。如下图。如下图(5)画频数分布图)画频数分布图14.514.5时间时间/min频频数数2222202016161414121210108 86 64 42 2181822.522.530.530.538.538.546.546.5 54.554.5 62.562.5交流:这交流:这40名学生平均每名学生平均每天锻炼的时间是如何分布天锻炼的时间是如何分布的?的?交流:如果该校八年级有交流:如果该校八年级有500名学生,估计一下平均名学生,估计一下平均每天参加锻炼达到每天参加锻炼达到30min以上的有多少?以上的有多少? 身高身高人人数数 151510109 9 8 8 2 2 1 1136.5 141.5141.5 146.5146.5 151.5151.5 156.5156.5 161.5161.5 166.6166.5 171.5171.5 176.5身高在身高在161161,5 5以上的学生有多少?以上的学生有多少?占全班人数的百分之几?占全班人数的百分之几?(2)估计我)估计我校八年级校八年级400名学生中身名学生中身高在高在161.5以以上的约有多上的约有多少人?少人?例题。我校八年级(例题。我校八年级(1 1)班共有学生)班共有学生5050名,该班学生名,该班学生的身高(单位:的身高(单位:cm)cm)的频数分布如下:的频数分布如下:解:身高在解:身高在161.5以上的以上的学生有:学生有:8+2+1=11占全班人数的百分比是:221005011答:答: 八年级学生身高在八年级学生身高在161.5以上的学生有以上的学生有:8822400超速行驶是交通事故频发的主要原因之一,交警部门统计某日7:009:00经过黄衢南高速公路江山测试点的汽车速度,得到如下所示的频数分布直方图,请根据这个直方图回答下列问题: 频数(辆)频数(辆)速度速度km/h()这个时间段共有()这个时间段共有_辆辆汽车行驶过汽车行驶过()频数最大是第()频数最大是第_组,组,该组的组中值是该组的组中值是_()若该路段汽车限速为本()若该路段汽车限速为本110km/h,则超速行的驶汽车,则超速行的驶汽车有有_辆辆2040608021095.595.5101.5101.5107.5107.5113.5113.5119.119.5 53107.580请观察图,并回答下面的问题:请观察图,并回答下面的问题:(1 1)被检测的矿泉水总数有多)被检测的矿泉水总数有多少种?少种? 32种种(2 2)组界为)组界为6.97. .3这一组的频这一组的频数、频率分别是多少(每一组包数、频率分别是多少(每一组包括前一个边界值,不包括后一个括前一个边界值,不包括后一个边界值)?边界值)? 10 (3) 根据我国根据我国2001年公布的年公布的生活饮用水卫生规范,饮用水生活饮用水卫生规范,饮用水的的PH应在应在6.58.5的范围内。被的范围内。被检测的矿泉水不检测的矿泉水不 符合这一标准符合这一标准的有多少种?占总数的百分之的有多少种?占总数的百分之几?几?5种种5.9 6.3 6.7 7.1 7.5 7.9 8.3048612102频数(种)频数(种)PH各种矿泉水各种矿泉水PHPH的频数分布直方图的频数分布直方图0.312515.625%下表是从某中学随机抽取的部分同学的视力情况频数下表是从某中学随机抽取的部分同学的视力情况频数分布表分布表视力频数频率3.954.2520.0490.184.554.85204.855.155.155.4510.02合计1.004.254.550.40180.3650(1)、请你把上表补充完整;)、请你把上表补充完整;(2)、请你根据频数分布表,画出频数分布直方图)、请你根据频数分布表,画出频数分布直方图 如果视力在如果视力在4.85以下就属于不正常范围,那么请你分析以下就属于不正常范围,那么请你分析一下我们学校的视力情况,看到这种情况,你想对周围的一下我们学校的视力情况,看到这种情况,你想对周围的同学说些什么?同学说些什么?3.953.95视力视力人人数数2222202016161414121210108 86 64 42 218184.254.254.554.554.854.855.155.155.455.45课后课后 小结:小结:梨25%桃12.5% 通过本课的探索,你学到了什么?通过本课的探索,你学到了什么?有何收获?有何收获?1. 学会使用统计表、统计图使数据一目了然。学会使用统计表、统计图使数据一目了然。2. 注意:注意:(1)组距要相等,组数要合适。)组距要相等,组数要合适。(2)分点数据要多位。)分点数据要多位。(3)频数、频率要分清。)频数、频率要分清。3.通过解读收集并处理有价值的信息,以便我们能通过解读收集并处理有价值的信息,以便我们能作出科学合理地决策。数据一般总是中间多,两头作出科学合理地决策。数据一般总是中间多,两头少呈正态分布。少呈正态分布。样本容量频数频率