频率分布直方图与茎叶图..优秀PPT.ppt
用样本的频率分布估计总体分布用样本的频率分布估计总体分布衡阳县六中高一年级衡阳县六中高一年级 刘碧华刘碧华用样本的频率分布估计总体分布用样本的频率分布估计总体分布一一 频率分布图和频率分布直方图频率分布图和频率分布直方图二二频率分布折线图频率分布折线图 和总体密度曲线和总体密度曲线三三三三 莖叶图莖叶图理论迁移理论迁移 1 1 某地区为了了解学问分子的年龄结构,某地区为了了解学问分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444,40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的学问分子所占的比岁的学问分子所占的比 例约是多少例约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.样本频率分布表:样本频率分布表:分分 组组 频数频数 频率频率2727,3232)3 0.06 3 0.063232,3737)3 0.06 3 0.063737,4242)9 0.18 9 0.184242,4747)16 0.32 16 0.324747,5252)7 0.14 7 0.145252,5757)5 0.10 5 0.105757,6262)4 0.08 4 0.086262,67 3 0.0667 3 0.06 合合 计计 50 1.00 50 1.00(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故故年龄在年龄在32325252岁的学问分子约占岁的学问分子约占70%.70%.某校共有5000名学生,该校学生每月课外读物方面的支出总体上在2060元之间其频率分布直方图如右图所示,为具体了解同学们购买课外读物的具体状况,按支出的状况进行分层抽样,抽出一个容量为100的样本进行分析,其中支出在元元频频率率组组距距20 30 40 50 600.010.0360.024元的同学应抽取元的同学应抽取 人。人。30理论迁移理论迁移 2 2 例例1.关于频率分布直方图中小长方形的高说法,关于频率分布直方图中小长方形的高说法,正确的是(正确的是()A.表示该组上的个体在样本中出现的频率表示该组上的个体在样本中出现的频率B.表示某数的频率表示某数的频率C.表示该组上的个体数与组距的比值表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距表示该组上的个体在样本中出现的频率与组距 的比值的比值课堂测试:课堂测试:D2 2依据中华人民共和国道路依据中华人民共和国道路交通平安法规定:血液酒精交通平安法规定:血液酒精浓度在浓度在80mg/100ml80mg/100ml(含(含8080)以)以上时,属醉酒驾车,处十五日上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六以下拘留和暂扣三个月以上六个月以下驾驶证,并处个月以下驾驶证,并处500500元以元以上上20002000元以下罚款据法制元以下罚款据法制晚报报道,晚报报道,20092009年年8 8月月1515日至日至8 8月月2828日,全国查处酒后驾车和日,全国查处酒后驾车和醉酒驾车共醉酒驾车共500500人,如图人,如图1 1是对是对这这500500人酒后驾车血人酒后驾车血 液中酒精液中酒精含量进行检测所得结果的频率含量进行检测所得结果的频率分布直方图,则属于醉酒驾车分布直方图,则属于醉酒驾车的人数约为(的人数约为()A A25 B25 B5050C C75 D75 D100100答案:答案:C3 3统计某校统计某校10001000名学生的数学水平测试成果,名学生的数学水平测试成果,得到样本频率分布直方图如图所示,若满分为得到样本频率分布直方图如图所示,若满分为100100分,规定不低于分,规定不低于6060分为及格,则及格率是分为及格,则及格率是()A A20%20%B B25%25%C C60%60%D D80%80%D D下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)最大值最大值=4.3 =4.3 最小值最小值=0.2 =0.2 所以极差所以极差=4.3-0.2=4.1=4.3-0.2=4.1其次步其次步:确定组距与组数确定组距与组数:(强调取整)(强调取整)当样本容量不超过当样本容量不超过100100时时,依据数据的多少依据数据的多少,常分成常分成512512组组.为便利组距的选择应力求为便利组距的选择应力求”取整取整”.”.本题假如组距为本题假如组距为0.5(t).0.5(t).则则 第三步第三步:将数据分组:将数据分组:(给出组的界限给出组的界限)所以将数据分成所以将数据分成9 9组较合适组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共共9组组.第四步第四步:列频率分布表列频率分布表.(包括分组、频数、频率、频率(包括分组、频数、频率、频率/组距)组距)分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5第第五五步步:画画出出频频率率分分布布直直方方图图.频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的在哪个区间间?请大家阅读第请大家阅读第6767页页,直方图有直方图有哪些优点和缺哪些优点和缺点点?频率分布直方图的特征:频率分布直方图的特征:从频率分布直方图可以清晰的看出数据分布从频率分布直方图可以清晰的看出数据分布的总体趋势。的总体趋势。从频率分布直方图得不出原始的数据内容,从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信把数据表示成直方图后,原有的具体数据信息就被抹掉了。息就被抹掉了。思索思索:从频率分布直方图中,你能得到随意从频率分布直方图中,你能得到随意区间(区间(a,b)的频率?有什么困难?的频率?有什么困难?00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5一、频率分布折线图与概率密度曲线一、频率分布折线图与概率密度曲线频率频率/组距组距 月均用水量月均用水量/t (取组距中点取组距中点,并连线并连线)0.080.160.30.440.50.30.10.080.04频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图思思索索:上上例例的的样样本本容容量量为为100,假假如如增增至至1000,其其频频率率分分布布直直方方图图的的状状况况会会有有什什么么变变更更(组组距距和和组组数数)?假假如如增增至至10000呢?呢?在样本频率分布直方图中,当样本容量增加,作图时所在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距削减,相应的频率折线图会越来越分的组数增加,组距削减,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线度曲线.它能够精确地反映了总体在各个范围内取值的它能够精确地反映了总体在各个范围内取值的百分比,它能给我们供应更加精细的信息百分比,它能给我们供应更加精细的信息.总体密度曲线总体密度曲线:月均用水量月均用水量/t/t频率频率组距组距0ab总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线月均用水量月均用水量/t/t频率频率组距组距0ab1.1.对于任何一个总体,它的密度曲线是不是确定存在?它对于任何一个总体,它的密度曲线是不是确定存在?它的密度曲线是否可以被特别精确地画出来?的密度曲线是否可以被特别精确地画出来?思索2.2.图中阴影部分的面积表示什么?图中阴影部分的面积表示什么?1、总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是探探讨讨总总体体分分布布的的工工具具.总体密度曲线的特征:总体密度曲线的特征:2、样本容量越大,频率分布直方图就会无限接近、样本容量越大,频率分布直方图就会无限接近 总体密度曲线,就越精确地反映了总体的分布规律,总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。即越精确地反映了总体在各个范围内取值百分比。3、不能由样本的频率分布折线图得到精确的总、不能由样本的频率分布折线图得到精确的总体密度曲线。体密度曲线。1.1.事实上,尽管有些总体密度曲线是客观存在事实上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样精确地画出来,的,但一般很难想函数图象那样精确地画出来,我们只能用样本的频率分布对它进行估计,一我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确般来说,样本容量越大,这种估计就越精确 二、二、茎叶图茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即其次个有效数字,它个有效数字,两边的数字表示个位数,即其次个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图因此通常把这样的图叫做茎叶图 例例:甲乙两人竞赛得分记录如下:甲乙两人竞赛得分记录如下:甲:甲:13,51,23,8,26,38,16,33,14,28,3913,51,23,8,26,38,16,33,14,28,39乙:乙:49,24,12,31,50,31,44,36,15,37,25,36,3949,24,12,31,50,31,44,36,15,37,25,36,39用茎叶图表示两人成果,说明哪一个成果好用茎叶图表示两人成果,说明哪一个成果好甲甲乙乙0 12345 2,55,41,6,1,6,7,9 4,90 8 4,6,3 3,6,8 3,8,9 1 叶叶 茎茎 叶叶合作探究合作探究 :茎叶图:茎叶图 (一种被用来表示数据的图一种被用来表示数据的图)甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 主要从对称性,中位数(体现成果好坏),主要从对称性,中位数(体现成果好坏),稳定性(即集中程度)来分析稳定性(即集中程度)来分析分析:甲得分除分析:甲得分除51特别大致对称,乙基本上也对称。特别大致对称,乙基本上也对称。甲的中位数为甲的中位数为26,乙的中位数为,乙的中位数为36,所以乙较甲成果要好,所以乙较甲成果要好,另,乙的叶较甲的更集中,所以乙较甲发挥更稳定。另,乙的叶较甲的更集中,所以乙较甲发挥更稳定。画茎叶图要留意什么:画茎叶图要留意什么:1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此例中在此例中,茎为十位上的数字茎为十位上的数字,叶为个位上的数字叶为个位上的数字;2.将最小茎和最大茎之间的数按大小将最小茎和最大茎之间的数按大小次序排成一列次序排成一列,写在左写在左(右右)侧侧;3.将各个数据的叶按大小次序将各个数据的叶按大小次序写在其茎右写在其茎右(左左)侧侧.茎叶0813 4 523 6 833 8 9451两个优点:两个优点:一是:没有原始数据信息的损失;一是:没有原始数据信息的损失;二是:茎叶图中的数据可以随时记录,随时添二是:茎叶图中的数据可以随时记录,随时添加,便利记录与表示。加,便利记录与表示。茎叶图的特征茎叶图的特征:三个局限:三个局限:一是:只便于表示两位有效数字的数据;一是:只便于表示两位有效数字的数据;二是:茎叶图只便利记录两组的数据;二是:茎叶图只便利记录两组的数据;三是:数据量不能太大三是:数据量不能太大阅读阅读70页最终一段,说出茎叶图的页最终一段,说出茎叶图的优缺点?优缺点?频数频数茎茎叶叶2107,81111 2,7,6,3,6,8,6,7,2,2,013126,8,4,2,7,8,6,1,0,4,3,2,04134,2,3,0下表一组数据是某车间下表一组数据是某车间3030名工人加工零件的个数名工人加工零件的个数,设计一个设计一个茎叶图表示这组数据茎叶图表示这组数据,并说明这一车间的生产状况并说明这一车间的生产状况.134 112 117 126 128 124 122 116 113 107116 132 127 128 126 121 120 118 108 110133 130 124 116 117 123 122 120 112 112练习练习1:练习练习2:某次运动会甲乙两名射击运动员的成果(环数)某次运动会甲乙两名射击运动员的成果(环数)如下:如下:甲:甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8乙:乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1(1)用茎叶图表示甲乙的成果)用茎叶图表示甲乙的成果(2)依据茎叶图分析甲乙的成果依据茎叶图分析甲乙的成果甲甲乙乙7 8 9 10 15 7 1 1 2 7 8 1 18 5 27 4 48 7 5 1(2)解:如图:茎为成果的整环数,叶为小数点后的数字)解:如图:茎为成果的整环数,叶为小数点后的数字(2)乙成果大致对称,甲成果的中位数为乙成果大致对称,甲成果的中位数为9.05,乙成果的中位数为乙成果的中位数为9.15,所以乙成果较甲好,乙成果较集中,所以乙成果较甲好,乙成果较集中于峰值,甲成果分散所以乙发挥的稳定性好,甲波动大。于峰值,甲成果分散所以乙发挥的稳定性好,甲波动大。小结:小结:1.不易知一个总体的分布状况时,不易知一个总体的分布状况时,往往从总体中抽取一个样本,用往往从总体中抽取一个样本,用样本的频率分布去估计总体的频样本的频率分布去估计总体的频率分布,样本容量越大,估计就率分布,样本容量越大,估计就越精确越精确.2.目前有:频率分布表、直方图、目前有:频率分布表、直方图、茎叶图茎叶图.3.当总体中的个体取值很少时,用当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数中的个体取值较多时,将样本数据恰当分组,用各组的频率分布据恰当分组,用各组的频率分布描述总体的分布,方法是用频率描述总体的分布,方法是用频率分布表或频率分布直方图。分布表或频率分布直方图。