221用样本的频率分布估计总体分布 (3).ppt
《221用样本的频率分布估计总体分布 (3).ppt》由会员分享,可在线阅读,更多相关《221用样本的频率分布估计总体分布 (3).ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.2.12.2.1用样本的频率分布估计用样本的频率分布估计总体分布总体分布主备主备人:王朝远人:王朝远 张洪华张洪华 审审核人:牟必继核人:牟必继2.2.1 2.2.1 用样本的频率分用样本的频率分布估计总体分布布估计总体分布1、用样本去估计总体,是研究统计问题的一个基本思想、用样本去估计总体,是研究统计问题的一个基本思想2、前面我们学过的抽样方法有、前面我们学过的抽样方法有:简单随机抽样、系统抽样、简单随机抽样、系统抽样、分层抽样分层抽样,这些主要是用来收集数据,那么我们如何分析这些主要是用来收集数据,那么我们如何分析这些数据的规律呢?这些数据的规律呢?3、初中时我们学习过样本的频率分布,
2、包括频数、初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。频率的概念,频数分布表和频数分布直方图的制作。20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市探究:我国是世界上严重缺水的国家之一,探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。城市缺水问题较为突出。例例 某市政府为了节约生活用水,计划在本某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居市试行居民生活用水定额管理,即确定一个居民月用水量标准民月用水量标准a,a,用水量不超过用水量不超过a a的部分按平的部分
3、按平价收费,超过价收费,超过a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的日常生活不受影响,如果希望大部分居民的日常生活不受影响,那么标准那么标准a a定为多少比较合理呢定为多少比较合理呢?为了较合理地确定这个标准,你认为需为了较合理地确定这个标准,你认为需要做哪些工作?要做哪些工作?思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均位居民某年的月平均用水量用水量(单位:单位:t)t),如下表:,如下表:很容易发现的是一个居民月平均用水量的最很容易发现的是一个居民月平均用水量的最小值时小
4、值时0.2t0.2t,最大值是,最大值是4.3t4.3t,其他在,其他在0.2t0.2t4.3t4.3t之间之间,除此之外很难再发现这除此之外很难再发现这100100位居民的用水量位居民的用水量的其它信息了,实际上,我们很难从随意记录下的其它信息了,实际上,我们很难从随意记录下来的数据中直接看出规律,为此,我们需要对统来的数据中直接看出规律,为此,我们需要对统计数据进行整理与分析。计数据进行整理与分析。分析数据的一种基本方法是分析数据的一种基本方法是用图将它们画出来,或者用用图将它们画出来,或者用紧凑的表格改变数据的排列方式紧凑的表格改变数据的排列方式,作图可以达到两个目,作图可以达到两个目的
5、,一是从数据中提取信息,二是利用图形传递信息,表格的,一是从数据中提取信息,二是利用图形传递信息,表格则是通过改变数据的构成形式,为我们提供解释数据的新方式则是通过改变数据的构成形式,为我们提供解释数据的新方式 初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习下面将要学习的频率分布表和频率分布图的频率分布表和频率分布图,则是,则是从各个从各个小组数据在样本容量中所占比例大小的角度,小组数据在样本容量中所占比例大小的角度,来表示数据来表示数据分布的规律分布的规律.它可以使我们看到整个样本数据的它可以使我们看到整个样本数据的频率分布频率分布情况情
6、况.频率分布相关概念频率分布相关概念 频率:频率:样本中某个组的频数和样本容量的比,样本中某个组的频数和样本容量的比,叫做该数据的叫做该数据的频率频率。所有数据(或数据组)的频数的分布变化所有数据(或数据组)的频数的分布变化规律叫做规律叫做样本的频率分布。样本的频率分布。频数:频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数频率分布的表示形式有:频率分布的表示形式有:样本频率分布表样本频率分布表样本频率分布图样本频率分布图 样本频率分布样本频率分布条形图条形图 样本频率分布样本频率分布直方图直方图样本频率分布折线图样本频率分布折线图抛掷硬币的大量重复试验
7、的结果:抛掷硬币的大量重复试验的结果:35 964反面向上反面向上36 124正面向上正面向上频率频率频数频数实验结果实验结果0.501 1 0.498 9样本容量为样本容量为72 088频率分布条形图频率分布条形图0.10.20.30.40.50.60.701试验结果试验结果频率频率“正面向上正面向上”记记为为0“反面向上反面向上”记为记为1频率分布表频率分布表:注意:注意:各长方形长条的宽度要相同。各长方形长条的宽度要相同。相邻长条的间距要适当。相邻长条的间距要适当。结论:当试验次数结论:当试验次数无限增大时,两种试验无限增大时,两种试验结果的频率大致相等。结果的频率大致相等。长方形长条的
8、高度长方形长条的高度表示取各值的频率。表示取各值的频率。第一步第一步:求极差求极差(一组数据中的最大(一组数据中的最大值与最小值的差)值与最小值的差).样本频率分布表样本频率分布表思考思考1 1:上述上述100100个数据中的最个数据中的最大值和最小值分别是什么?由大值和最小值分别是什么?由此说明样本数据的变化范围是此说明样本数据的变化范围是什么?什么?0.20.24.34.3思考思考2:分成多少组合适呢分成多少组合适呢?第二步第二步:决定组距与组数决定组距与组数:组距组距:指每个小组的两个端点的距指每个小组的两个端点的距离;离;组数组数:k=k=极差极差组距,若组距,若k k为整数,为整数,
9、则组数则组数=k=k,否则,组数,否则,组数=k k+1.+1.将数据分组,当数据在将数据分组,当数据在100个以个以内时,内时,按数据多少常分按数据多少常分5-12组。组。(4.30.2)0.58.2.将8.2取整故,可取组距=0.5,组数=9如果将上述如果将上述100个数据按组个数据按组距为距为0.5进行分组,那么这进行分组,那么这些数据共分为多少组?些数据共分为多少组?第四步:列频率分布表第四步:列频率分布表.计算各小组的频率,作出计算各小组的频率,作出下面的下面的频率分布表频率分布表.第三步:确定分点,将数据分组第三步:确定分点,将数据分组.以组距为以组距为0.50.5将数据分组时,将
10、数据分组时,可以分成以下可以分成以下9 9组:组:0,0.5),0.5,1),0,0.5),0.5,1),4,4.5.,4,4.5.思考思考3:各组数据的取值各组数据的取值范围可以如何设定?范围可以如何设定?各组均为左闭右开区间,最后一组是闭区间 思考思考4:如何统计上述如何统计上述100100个数据在各个数据在各组中的频数组中的频数?如何计算样本数据在如何计算样本数据在各组中的频率各组中的频率?你能将这些数据用你能将这些数据用表格反映出来吗表格反映出来吗?列频率分布表列频率分布表:分组分组频数累计频数累计频数频数频率频率0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)
11、3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041001.000.02频率频率/组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04频率分布表一般分五列频率分布表一般分五列1 1、“分组分组”,2 2、“频数累计频数累计(可省),(可省),3 3、“频数频数”,4 4、“频率频率”,5 5、“频率频率/组距组距”最后一行是合计最后一行是合计频数的合计为频数的合计为样本容量样本容量频率合计为频率合计为1 1为了直观
12、反映样本数据在各组中的分布情况,我们将上述频为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:率分布表中的有关信息用下面的图形表示:月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234频率分布直方图频率分布直方图 第一步:第一步:画平面直角坐标系画平面直角坐标系.第二步:第二步:在横轴上均匀标在横轴上均匀标出各组分点,在纵轴上出各组分点,在纵轴上标出单位长度标出单位长度.第三步:第三步:以组距为宽,各组的频率以组距为宽,各组的频率与组距的商为高,分别画出各组对与组距的商为高,分别画出各
13、组对应的小长方形应的小长方形.y轴:频率频率/组距组距x轴:数据单位频率分布条形图和频率分布直方图两者是不同的概念,虽然它们的横坐标表示的内容是相同的,但是频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的面积。月均用水量月均用水量/t频率频率/组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O各组的频率在图中哪里显示出来?各组的频率在图中哪里显示出来?各小长方体的面积之和是否为定值?各
14、小长方体的面积之和是否为定值?各小长方形的面积之和为各小长方形的面积之和为1.1.宽度:组距宽度:组距高度:高度:频率频率组距组距知识探究(二):频率分布直方图知识探究(二):频率分布直方图 小长方形的面积小长方形的面积=组距组距频率频率=组距组距频率频率月均用水量月均用水量/t0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 你能根据上述频率分布直方图指出居民月均用水量的你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?一些数据特点吗?频率频率/组距组距(
15、1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率频率频率组距组距组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 同样一组数据,如果同样一组数据,如果组距不同,横轴、纵轴的单位不同,组距不同,横轴、纵
16、轴的单位不同,得到得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以时会影响我们对总体的判断,下面给出以0.1和和1为组距重新作出的为组距重新作出的频率分布直方图。频率分布直方图。如果市政府希望如果市政府希望85%85%左右的居民每月的用水量不超过左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准标准,根据上述频率分布表,你对制定居民月用水量标准(即(即a a的取值)有何建议?的取值)有何建议?问题:问题:月均用水量月均用水量/t频率频率频率频率组距组距组距组距
17、0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O0.150.250.020.220.080.140.040.040.06若将标准a定为2.5,则7474%的居民在的居民在2.52.5t t以下以下若将标准a定为3,则88%88%的居民在的居民在3t3t以下,标准可定为以下,标准可定为3t.3t.频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频
18、率分布折线图利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计:(1 1)上例的样本容量为)上例的样本容量为100100,如果增至,如果增至1 0001 000,其,其频率分布直方图的情况会有什么变化?假如增至频率分布直方图的情况会有什么变化?假如增至10 00010 000呢?呢?(2 2)样本容量越大,这种估计越精确样本容量越大,这种估计越精确.(3 3)当样本容量无限增大,组距无限缩小,那么)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线频率分布直方图就会无限接近于一条光滑曲线总体密度曲线总体密度曲线.总体密度曲线总体密度曲线月均
19、用月均用水量水量/tab(图中阴影部分的面积,表示总体在某个区间(图中阴影部分的面积,表示总体在某个区间(a,b)a,b)内取值的百分比)内取值的百分比).o频率频率/组距组距 当样本容量无限增大,分组的组距无限缩小,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线总体密度曲线 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 221用样本的频率分布估计总体分布 3 221 样本 频率 分布 估计 总体
限制150内