人教A版高中数学必修三2.2.1用样本的频率分布估计总体分布.ppt
2.2.1 用样本的频率分布估计总体分布温故知新温故知新1 1、什么是简单随机抽样?什么样的总体、什么是简单随机抽样?什么样的总体适宜简单随机抽样?适宜简单随机抽样?2 2、什么是系统抽样?什么样的总体适宜、什么是系统抽样?什么样的总体适宜 系统抽样?系统抽样?3 3、什么是分层抽样?什么样的总体适宜、什么是分层抽样?什么样的总体适宜分层抽样?分层抽样?通过图、表、计算来分析通过图、表、计算来分析样本样本数据数据,找出数据找出数据中的规律中的规律,就可以对就可以对总体总体作出相应的作出相应的估计估计.这种估计一般分成这种估计一般分成两种两种:是用样本的是用样本的频率分布频率分布估计总体的分布估计总体的分布.是用样本的是用样本的数字特征数字特征(如平均数、标准差如平均数、标准差 等等)估计总体的数字特征估计总体的数字特征.用样本去估计总体,是研究统计问题的一用样本去估计总体,是研究统计问题的一个基本思想个基本思想.初中时我们学习过样本的频率分布初中时我们学习过样本的频率分布,包括频数、频包括频数、频率的概念率的概念,频率分布表和频率分布直方图的制作频率分布表和频率分布直方图的制作.探究探究:我国是世界上严重缺水的国家之一我国是世界上严重缺水的国家之一,城市缺水问题城市缺水问题较为突出较为突出.某市政府为了节约生活用水某市政府为了节约生活用水,计划在本市试行计划在本市试行居民生活用水定额管理居民生活用水定额管理,即确定一个居民即确定一个居民月用水量标准月用水量标准a,用水量不超过用水量不超过a的部分按平价收费的部分按平价收费,超出超出a的部分按议价的部分按议价收费收费.如果希望大部分居民的日常生活不受影响如果希望大部分居民的日常生活不受影响,那么标那么标准准a定为多少比较合理呢定为多少比较合理呢?你认为你认为,为了较为合理的确定为了较为合理的确定出这个标准出这个标准,需要做那些工作需要做那些工作?20002000年全国主要城年全国主要城市中缺水情况排在市中缺水情况排在前前1010位的城市位的城市某市某市100名居民的月均用水量名居民的月均用水量(单位单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 将一批数据按要求分为若干组,各组内的数据的个数,将一批数据按要求分为若干组,各组内的数据的个数,叫做该组数据的叫做该组数据的频数频数,各个小组数据在样本容量中所占的,各个小组数据在样本容量中所占的比例的大小,叫做该组数据的比例的大小,叫做该组数据的频率频率。为了解数据分布的规律,可利用频率分布表和频率分布图来分析,为了解数据分布的规律,可利用频率分布表和频率分布图来分析,具体做法具体做法如下:如下:1.1.求极差求极差(即一组数据中(即一组数据中最大值和最小值的差最大值和最小值的差)例如,例如,4.3-0.2=4.14.3-0.2=4.1,这说明这些数据的变化范围大小是这说明这些数据的变化范围大小是4.1t4.1t。2.2.决定组距和组数决定组距和组数例如,例如,若取组距为若取组距为0.50.5,则则故可将数据分成故可将数据分成9 9组。组。(设(设k=极差极差组距,若组距,若k为整数,则组数为整数,则组数=k,若若k不是整数,组数不是整数,组数=k+1)分组分组频数频数频率频率0,0.5)40.040.5,1)80.081,1.5)150.151.5,2)220.222,2.5)250.252.5,3)140.143,3.5)60.063.5,4)40.044,4.520.02合计合计1001.004.列频率分布表:列频率分布表:3.将数据分组将数据分组以组距以组距0.5将数据分组如下:将数据分组如下:0,0.5),0.5,1),4,4.5.(频数(频数=样本数据落在各小组内的个数,样本数据落在各小组内的个数,频率频率=频数频数样本容量)样本容量)5.画频率分布直方图画频率分布直方图 用用横轴横轴表示表示月均用水量月均用水量,纵轴纵轴表示表示频率与组距的比值频率与组距的比值,以,以每个每个组距为底组距为底,以,以频率除以组距的商频率除以组距的商为高为高,分别画出矩形,这,分别画出矩形,这样得到的直方图就是频率分布直方图。样得到的直方图就是频率分布直方图。思考思考:小矩形的面积与哪些量有关小矩形的面积与哪些量有关?如何表示如何表示?频率分布直方图频率分布直方图0 00.10.10.20.20.30.30.40.40.50.50.60.60-0.50-0.50.5-10.5-11-1.51-1.51.5-21.5-22-2.52-2.52.5-32.5-33-3.53-3.53.5-43.5-44-4.54-4.5用水量范围用水量范围频率频率/组距组距频率分布直方图频率分布直方图0 00.10.10.20.20.30.30.40.40.50.50.60.60-0.50-0.50.5-10.5-11-1.51-1.51.5-21.5-22-2.52-2.52.5-32.5-33-3.53-3.53.5-43.5-44-4.54-4.5用水量范围用水量范围频率频率/组距组距横轴表示横轴表示:月均用水量月均用水量,纵轴表示纵轴表示:频率频率/组距组距小长方形的面积小长方形的面积=组距组距*(频率频率/组距组距)=)=频率频率各小长方形的各小长方形的面积总和面积总和等于等于1 1频率分布折线图频率分布折线图连接频率分布直方图中各个小长方形上端的连接频率分布直方图中各个小长方形上端的中点中点,频率分布折线图频率分布折线图随着样本容量的增加,作图时所分的组数也会增加,相应的频率折随着样本容量的增加,作图时所分的组数也会增加,相应的频率折线图会越来越接近于一条线图会越来越接近于一条光滑的曲线光滑的曲线,统计学中称这条光滑的曲线,统计学中称这条光滑的曲线为为总体密度曲线总体密度曲线.总体密度曲线总体密度曲线 统计中称这条光滑曲线为统计中称这条光滑曲线为总体密度曲线总体密度曲线,它它反映了总体在各个范围内取值的百分比反映了总体在各个范围内取值的百分比.阴影部分的面积阴影部分的面积表表示总体在区间示总体在区间(a,b)内取值的百分比内取值的百分比.1.求极差求极差(即一组数据中最大值即一组数据中最大值与最小值的差与最小值的差)364.41362.51=1.90说明样说明样本数据的变化范围大小是本数据的变化范围大小是1.90cm)2.决定组距与组数决定组距与组数 取组距为取组距为0.4cm,那么组数那么组数=极极差差组距组距=1.900.4=4.75因此因此可以将数据分成可以将数据分成5组组,即组距即组距为为0.4,组数为组数为53.将数据分组将数据分组 362.51,362.91),362.91,363.31),363.31,363.71),363.71,364.11),364.11,364.51分组分组频数频数频率频率362.51,362.91)362.91,363.31)363.31,363.71)363.71,364.11)364.11,364.51)817331660.100.21250.41250.200.075合计合计801.005.画频率分布直方图画频率分布直方图4.列频率分布表列频率分布表 小结:频率分布直方图频率分布直方图应用应用步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图茎叶图茎叶图甲乙两名篮球运动员每场比赛得分的原始记录如下:甲乙两名篮球运动员每场比赛得分的原始记录如下:甲得分:甲得分:1313,5151,2323,8 8,2626,3838,1616,3333,1414,2828,3939乙得分:乙得分:4949,2424,1212,3131,5050,3131,4444,3636,1515,3737,2525,3636,3939012345甲甲乙乙3 34 46 68 83 36 69 93 38 88 81 12 25 55 54 41 16 61 16 67 79 94 49 90 0样本数据的茎叶图的步骤:样本数据的茎叶图的步骤:第一步,将每个数据分第一步,将每个数据分为为“茎茎”(高位)和(高位)和“叶叶”(低位)两部分;(低位)两部分;第二步,将最小的茎和最第二步,将最小的茎和最大的茎之间的数按大小次大的茎之间的数按大小次序排成一列,序排成一列,写在中间写在中间;第三步,将各个数据的叶第三步,将各个数据的叶按大按大小次小次序写在茎右(左)侧序写在茎右(左)侧.茎叶图茎叶图甲乙两名篮球运动员每场比赛得分的原始记录如下:甲乙两名篮球运动员每场比赛得分的原始记录如下:甲得分:甲得分:1313,5151,2323,8 8,2626,3838,1616,3333,1414,2828,3939乙得分:乙得分:4949,2424,1212,3131,5050,3131,4444,3636,1515,3737,2525,3636,3939012345甲甲乙乙3 34 46 68 83 36 69 93 38 88 81 12 25 55 54 41 16 61 16 67 79 94 49 90 0怎样求甲、乙的中位数?怎样求甲、乙的中位数?例题:例题:某市对上、下班交通情况做抽样调查,上、下班时间各抽某市对上、下班交通情况做抽样调查,上、下班时间各抽 取了取了1212辆机动车行使时速如下辆机动车行使时速如下:(单位:(单位:km/hkm/h)上班时间:上班时间:30 33 18 27 32 40 26 28 21 28 35 2030 33 18 27 32 40 26 28 21 28 35 20下班时间:下班时间:27 19 32 29 36 29 30 22 25 16 17 3027 19 32 29 36 29 30 22 25 16 17 30用茎叶图表示上面的样本数据,并求出上下班样本数据的用茎叶图表示上面的样本数据,并求出上下班样本数据的中位数中位数。解:依题意,茎叶图如下解:依题意,茎叶图如下上班上班下班下班 8 1 6 7 98 8 7 3 1 0 2 2 5 7 9 9 5 3 2 0 3 0 0 2 6 0 4思考:思考:对于样本数据:对于样本数据:3.13.1,2.5,2.02.5,2.0,0.80.8,1.51.5,1.01.0,4.34.3,2.72.7,3.13.1,3.53.5,用茎叶图如何表示?用茎叶图如何表示?0123480 50 5 71 1 53茎茎叶叶1.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为那么频率为0.2范围的是范围的是()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5 分组分组 频数频数 频率频率 5.57.5 2 0.1 7.59.5 6 0.3 9.511.5 8 0.411.513.5 4 0.2 合计合计 20 1.0D小试牛刀2.有一个容量为的样本数据有一个容量为的样本数据,分组后各组的分组后各组的频数如下频数如下:(12.5,15.5,3;(15.5,18.5,8;(18.5,21.5,9;(21.5,24.5,11;(24.5,27.5,10;(27.5,30.5,4.由此估计,不大于由此估计,不大于27.5的数的数据约为总体的据约为总体的()A91%B92%C95%D30%A3.一个容量为一个容量为20的样本数据,数据的分的样本数据,数据的分组及各组的频数如下:组及各组的频数如下:(10,20),),2;(;(20,30),),3;(;(30,40),),4;(;(40,50),),5;(;(50,60),),4;(;(60,70),),2.则样本在区间(则样本在区间(,50)上的频率)上的频率为为()A0.5B0.7C0.25 D0.05B