新课标人教A高中数学必修三用样本的频率分布估计总体分布.pptx
问题提出问题提出 1.1.随机抽样有哪几种基本的抽样方法?随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通过样本数据所包含的信随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容学习的内容.简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样.3.3.高一某班有高一某班有5050名学生,在数学必修名学生,在数学必修结业考试后随机抽取结业考试后随机抽取1010名,其考试成绩如下:名,其考试成绩如下:8282,7575,6161,9393,6262,5555,7070,6868,8585,78.78.如果要求我们根据上述抽样数据,估计该班对数学模块如果要求我们根据上述抽样数据,估计该班对数学模块的总的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用将学习用样本的频率分布估计总体分布样本的频率分布估计总体分布.第1页/共37页频数频数:频率频率:样本的频率分布样本的频率分布:总体分布:【复习回顾复习回顾】各组内数据的个数。每组数据的个数除以全体数据个数的商。样本的频率分布规律总体取值的概率分布规律。第2页/共37页20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市探究:探究:我国是世界上严重缺水的国家之一,城市缺我国是世界上严重缺水的国家之一,城市缺水问题较为突出。水问题较为突出。知识探究(一):频率分布表知识探究(一):频率分布表 第3页/共37页 某市政府为了节约生活用水,计划在本市试行居民生某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准活用水定额管理,即确定一个居民月用水量标准a,a,用水用水量不超过量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?为了较合理地确定这个标准,你认为需要做 哪些工作?第4页/共37页 思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100100位居民某年的月平均用 水量(单位:t)t),如下表:根据这些数据你能得出用水量其他信息吗?第5页/共37页 1 1、样本数据的变化范围是什么?样本数据的变化范围是什么?2 2、样本数据中的最大值和最小值的差称为样本数据中的最大值和最小值的差称为极差极差.如果将上述如果将上述100100个数据按个数据按组距组距为为0.50.5进行分组,那么这些数据共分为多少组?进行分组,那么这些数据共分为多少组?0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.2 3 3、以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,各组数组,各组数据的取值范围可以如何设定?据的取值范围可以如何设定?4 4、如何统计上述如何统计上述100100个数据在各组中的个数据在各组中的频数频数?如何计算样本数?如何计算样本数据在各组中的据在各组中的频率频率?你能将这些数据用表格反映出来吗?你能将这些数据用表格反映出来吗?00,0.50.5),0.50.5,1 1),11,1.51.5),44,4.5.4.5.【思考思考】第6页/共37页 【频率分布表】100100位居民月平均用水量的频率分布表第7页/共37页 1 1、上表称为样本数据的上表称为样本数据的频率分布表频率分布表,由此可以推测该市全体,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布用样本的频率分布估计总体分布.2 2、如果市政府希望如果市政府希望85%85%左右的居民每月的用水量不超过标准,左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即根据上述频率分布表,你对制定居民月用水量标准(即a a的取值)的取值)有何建议?有何建议?88%88%的居民月用水量在的居民月用水量在3t 3t以下,可建议取以下,可建议取a=3.a=3.3 3、在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以上的居民用水不超标吗以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论出现偏差,实践中,对统计分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的结论是需要进行评价的.【思考思考】第8页/共37页 4 4、一般地,列出一组样本数据的频率分布表可以分哪几一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?个步骤进行?第一步,求极差第一步,求极差.(极差(极差=样本数据中最大值与最小值的差)样本数据中最大值与最小值的差)第二步,确定组距与组数第二步,确定组距与组数.(设(设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否则,组数,否则,组数=k+1=k+1)第三步,确定分点,将数据分组第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格.(频数(频数=样本数据落在各小组内的个数,频率样本数据落在各小组内的个数,频率=频数频数样本容量)样本容量)第9页/共37页请大家思考直方图有那些优点和缺点?小长方形的面积总和=?频率/组距月平均用水量/t0.500.400.300.200.100 0.511.522.533.544.5 小长方形的面积=?月均用水量最多的在哪个区间?知识探究(二):频率分布直方图知识探究(二):频率分布直方图 为了直观反映样本数据在各组中的分布情况,我们将上述频率为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:分布表中的有关信息用下面的图形表示:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.第10页/共37页 你能根据频率分布直你能根据频率分布直方图指出居民月均用水量方图指出居民月均用水量的一些数据特点吗?的一些数据特点吗?频率/组距月平均用水量/t0.500.400.300.200.100 0.511.522.533.544.5(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而且是状的,而且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值附近,只有少数)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.第11页/共37页 【思考思考】样本数据的频率分布直方图是根据频率分布表画出来样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?的,一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴上标出第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度单位长度.第三步,以组距为宽,各组的频率与组距的商为高,第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形分别画出各组对应的小长方形.第12页/共37页探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。第13页/共37页 将直方图各块顶端中点连线你会发现什将直方图各块顶端中点连线你会发现什么呢?:么呢?:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O思考:思考:若组距取得越小,则频率折线的光滑程度会怎样?若组距取得越小,则频率折线的光滑程度会怎样?越光滑越光滑频率分布折线图第14页/共37页 如果样本容量足够大,分组的组距取得如果样本容量足够大,分组的组距取得足够小,则频率折线图将趋于一条光滑的曲足够小,则频率折线图将趋于一条光滑的曲线:线:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O总体密度曲线第15页/共37页 例例2 2 甲乙两篮球运动员在上赛季每场比赛的甲乙两篮球运动员在上赛季每场比赛的得分如下,试比较两位运动员的水平。得分如下,试比较两位运动员的水平。甲:甲:1212,1515,2424,2525,3131,3131,3636,3636,3737,3939,4444,4949,5050;乙:乙:8 8,1313,1414,1616,2323,2626,2828,3333,3838,3939,51.51.解决这个实际问题还用频率分布表或者解决这个实际问题还用频率分布表或者频率分布直方图来做吗?频率分布直方图来做吗?知识探究(三):频率分布茎叶图知识探究(三):频率分布茎叶图 此时可以考虑:频率分布茎叶图此时可以考虑:频率分布茎叶图第16页/共37页 一般地,当数据是两位有效数字时,用中间的数字表示十位数,一般地,当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上的叶子,因此通常它的中间部分像植物的茎,两边部分像植物茎上的叶子,因此通常将此图成为将此图成为茎叶图茎叶图012345834636838915254976611940甲乙通过此图即可看出甲运动员的得分大致对称,发挥比较稳定!第17页/共37页第一步,将每个数据分为茎(十位数)和叶(个位数);第一步,将每个数据分为茎(十位数)和叶(个位数);第二步,将最小的茎和最大的茎之间的数按大小次序排第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在中间;成一列,写在中间;第三步,将各个数据的叶按大小次序写在其茎右(左)侧第三步,将各个数据的叶按大小次序写在其茎右(左)侧.一般地,列出一组样本数据的频率分布茎叶图可以分哪几个步骤进行?第18页/共37页1.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为那么频率为0.2范围的是范围的是 ()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5 分组分组 频数频数 频率频率 频数累计频数累计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9.511.5 8 0.4 1611.513.5 4 0.2 20 合计合计 20 1.0D第19页/共37页2.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组分组 频数频数 频率频率 频率累计频率累计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33)0.1033,36 1.00合计合计 100 1.000.0680.140.16160.210.440.25250.160.850.100.950.0550.06第20页/共37页3.已知一个样本,填写下面的频率分布表7.0 6.6 6.8 7.0 7.2 7.4 7.0 7.3 7.5 7.47.3 7.1 7.0 6.9 6.7 7.1 7.2 7.0 6.9 7.1 分组分组频数累计频数累计频数频数频率频率.556.756.756.956.957.157.157.357.357.55合计合计2384320251317200.100.150.200.400.151.00第21页/共37页0.081500.88第22页/共37页(20112011湖北高考)有一个容量为200200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间1010,1212)内的频数为()(A A)18 18 (B B)36 36 (C C)54 54 (D D)7272B第23页/共37页例题例题1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的百分比是多少的百分比是多少?第24页/共37页解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第25页/共37页频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070第26页/共37页例例2 2、为了了解一大片经济林的生长情况,随机测量其中的、为了了解一大片经济林的生长情况,随机测量其中的100100株的株的底部周长,得到如下数据表(长度单位:底部周长,得到如下数据表(长度单位:cmcm):135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108 (1)(1)编制编制频率分布表频率分布表;(;(2)2)绘制绘制频率分布直方图频率分布直方图;(3 3)估计该片经济林中底部周长)估计该片经济林中底部周长小于小于100cm100cm的树木的树木 约占多少,约占多少,周长周长不小于不小于120cm120cm的树木约占多少。的树木约占多少。第27页/共37页解解:(1 1)从表中可以看出:)从表中可以看出:这组数据的最大值为这组数据的最大值为135135,最小值为,最小值为8080,故极差为故极差为5555,可将其分为可将其分为1111组,组距为组,组距为5 5。从第从第1 1组组8080,8585)开始,开始,将各组的频数、频率和频率将各组的频数、频率和频率/组距组距 填入表中填入表中第28页/共37页第29页/共37页80859095135110 115 120 125 130100 105第30页/共37页课堂练习:课堂练习:1、为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件(1)列出样本的频率分布表;(2)(2)根据上述结果,估计此种产品为二级品或三级品的概率约是多少解:解:(1)样本的频率分布表为:0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品(2)此种产品为二级品或三级品的概率约为此种产品为二级品或三级品的概率约为0.270.430.7 第31页/共37页2.有一个容量为有一个容量为50的样本,数据的分组及其的样本,数据的分组及其频数如下所示频数如下所示,请将其制成频率直方图请将其制成频率直方图频率分布表如下:频率分布表如下:分组分组频率频率25,30)30,35)35,40)40,45)45,50)389111050,55)55,6054合计合计500.060.160.180.220.200.100.081.00频数频数第32页/共37页 小结:频率分布直方图频率分布直方图应用应用步骤1.1.求极差2.2.决定组距与组数3.3.将数据分组4.4.列频率分布表5.5.画频率分布直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起点稍微再小一点小组的起点稍微再小一点.第33页/共37页小结小结1.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律总体分布是指总体取值的频率分布规律.我们通常用样本的频率分我们通常用样本的频率分布表或频率分布直方图去估计总体的分布布表或频率分布直方图去估计总体的分布.2.2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方频率分布表和频率分布直方图,是对相同数据的两种不同表达方式式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况分布情况.通过作图既可以从数据中提取信息,又可以利用图形传通过作图既可以从数据中提取信息,又可以利用图形传递信息递信息.3.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况的分布情况.第34页/共37页作业作业金太阳导学测评金太阳导学测评(十五)(十五)第35页/共37页例例3、对某电子元件进行寿命跟踪调查,情况如下:、对某电子元件进行寿命跟踪调查,情况如下:1)、列出频率分布表)、列出频率分布表2)、估计电子元件寿命在)、估计电子元件寿命在100h400h以内的频率以内的频率3)、估计电子元件寿命在)、估计电子元件寿命在400h以上频率以上频率第36页/共37页感谢您的观看!第37页/共37页