《2.2.1频率分布表课件.ppt》由会员分享,可在线阅读,更多相关《2.2.1频率分布表课件.ppt(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况.2.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分另一类是如何根据对样本的整理、计算、分析析,对总体的情况作出推断对总体的情况作出推断.回顾国际奥委会国际奥委会2003年年6月月29日决定,日决定,2008年北京年北京奥运会举办的日期比原定日期推迟两周,改在奥运会举办的日期比原定日期推迟两周,改在8月月8日至日至8月
2、月24日举行原因是日举行原因是7月末月末8月初北京地区月初北京地区得气温高于得气温高于8月中下旬月中下旬下表是随机抽取的近年来北京地区下表是随机抽取的近年来北京地区7月月25日至日至8月月24日的日最高气温,得到如下样本日的日最高气温,得到如下样本(单位:单位:C)7月月25日日至至8月月10日日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.332.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月月8日至日至8月月24日日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4
3、 25.6 24.7 30.0 30.1 29.5 30.3l怎样通过上表中的数据,分析比较两时间段的高温(怎样通过上表中的数据,分析比较两时间段的高温(33)状)状况呢?况呢?问题引入:问题引入:分析上面两样本的高温天数的频率用下表分析上面两样本的高温天数的频率用下表表示:表示:由此可得:近年来北京地区7月25日至8月10日的高温天气的频率明显高于频率明显高于8月8日至8月24日.知识新授:知识新授:1.频数与频率频数与频率 频数频数是指一组数据中,某范围内的数据出现是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到的次数;把频数除以数据的总个数,就得到频率频率.2.频
4、率分布表频率分布表 当总体很大或不便于获得时,可以用样本的当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布频率分布估计总体的频率分布.我们把反映总体我们把反映总体频率分布的表格称为频率分布的表格称为频率分布表频率分布表.说明说明:样本频率分布与总体频率分布有什么关系?:样本频率分布与总体频率分布有什么关系?不完全相同,但通过样本的不完全相同,但通过样本的频数分布、频率分频数分布、频率分布布可以估计总体的频率分布可以估计总体的频率分布.7月月25日至日至8月月10日日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.332.5 34.6 33.
5、0 30.8 31.0 28.6 31.5 28.88月月8日至日至8月月24日日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3时间时间总天数总天数高温天数高温天数频率频率7月月25日至日至8月月10日日17110.6478月月8日至日至8月月24日日1720.118频率分布表频率分布表:绘制频率分布表绘制频率分布表绘制频率分布表绘制频率分布表 1.前面引例例例1从某校高一年级的从某校高一年级的1002名新生中用系统抽样的方法抽取一名新生中用系统抽样的方法抽取一个容量为个容量
6、为100的身高样本,数据如下(单位:的身高样本,数据如下(单位:cm)试作出该样)试作出该样本的频率分布表本的频率分布表168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155
7、167163164158168167161162167168161165174156167166162161164166 这个例子与前面问题是不同的,这里的总体可以在一个实数这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体区间取值,称为连续型总体.S1 计算数据中最大值与最小值的差计算数据中最大值与最小值的差(极差),确定(极差),确定全全距距.S2 根据全距,决定组数和组距根据全距,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数最后一组取闭区间,且使分点比数据
8、多一位小数.S4 登记频数,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表.算法算法:16816517116717016517015217517416517016816917116616415516415817015516615815516016016415616216017016816417417116517916317218017417315916317216716016416915116815816817615516516516916217715817516516915116316616316717816515817016915915516315315516716316415
9、8168167161162167168161165174156167166162161164166S1 计算数据中最大值与最小值的差(极差),确定全距计算数据中最大值与最小值的差(极差),确定全距.极差极差极差极差1801801511512929;全距全距全距全距3030;取值区间取值区间取值区间取值区间150.5150.5,180.5180.5;组距和组数与数据的数量有关一般数据较多,分的组数也组距和组数与数据的数量有关一般数据较多,分的组数也多;数据较少,分的组数也少当数据个数在多;数据较少,分的组数也少当数据个数在50以内,分以内,分58组;组;当数据个数在当数据个数在50100之间,分
10、之间,分812组应当注意的是如果组内组应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,且没有数据出现,就应当放宽组距,保证每个组内都有数据,且每个数据只属于确定的一组在决定组数时,往往不是一次就每个数据只属于确定的一组在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数据能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小只有合理地确定多一位小数,并且第一组的起点要稍稍减小只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来;组距与组数,才能使数据分布的规律性比较明显地呈现出来;S2 根据
11、全距,决定组数和组距根据全距,决定组数和组距.组数组数组数组数1010;组距组距组距组距3 3;S3 分组:通常对组内数据所在区间取左闭右开区间,最后分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数一组取闭区间,且使分点比数据多一位小数.分组分组频数统计频数统计频数频数频率频率150.5,153.5)153.5,156.5)156.5,159.5)159.5,162.5)162.5,165.5)165.5,168.5)168.5,171.5)171.5,174.5)174.5,177.5)177.5,180.5合合 计计488112219147430.04
12、0.080.080.110.220.190.140.070.040.03412203153728693971001001 一般地一般地 ,编制频率分布表的步骤如下编制频率分布表的步骤如下 :(1)(1)求全距求全距 ,决定组数和组距决定组数和组距 ,组距组距 =全距全距 /组数组数 ;(2)(2)分组分组 ,通常对组内数值所在区间通常对组内数值所在区间 取左闭右开区间取左闭右开区间 ,最后一组取闭区间最后一组取闭区间 ;(3)(3)登记频数登记频数 ,计算频率计算频率 ,列出频率分布表列出频率分布表 .练习练习1.1.下面是不同厂家生产的手提电脑的重量下面是不同厂家生产的手提电脑的重量 (单位
13、单位 :kg),kg),试列出其频率分布表试列出其频率分布表 :练习练习2.2.一个容量为一个容量为2020的数据样本的数据样本 ,分组与频数为分组与频数为 :10,20 2 10,20 2 个个 、(20,30 3(20,30 3 个个 、(30,40 4(30,40 4个个 、(40,50 5(40,50 5 个个 、(50,60 4(50,60 4 个个 、(60,70 2(60,70 2个个 ,则样本数据在区间则样本数据在区间 (-,50 (-,50 上的可能性为上的可能性为()()A.5%B.25%C.50%D.70%D练习练习3.3.在一本书中在一本书中 ,分组统计分组统计 100
14、100个句子中的字数个句子中的字数 ,得出下列结果得出下列结果 :字数字数 1-5 1-5 个的个的 15 15 句句 ,字数字数 6-10 6-10 个的个的 27 27 句句 ,字数字数 11 11-15-15 个的个的 32 32 句句 ,字数字数 16-20 16-20 个的个的 15 15 句句 ,字数字数 21-25 21-25 个的个的 8 8 句句 ,字数字数 26-30 26-30 个的个的 3 3 句句 .请作出字数的频率分布请作出字数的频率分布表表 ,并利用组中值对该书中平均每个句子包含的字数作出估计并利用组中值对该书中平均每个句子包含的字数作出估计 .有一个容量为有一个
15、容量为45的样本数据的样本数据,分组后各组分组后各组的频数如下的频数如下:由此估计,不大于由此估计,不大于27.5的数据约为总的数据约为总体的体的 ()A.91%B.92%C.95%D.30%A练习练习4.4.从一个养鱼池中捕得从一个养鱼池中捕得m条条鱼,做上记号后放入池中鱼,做上记号后放入池中,数日数日后又捕得后又捕得n条鱼,其中条鱼,其中k条有记条有记号,估计池中有鱼多少条?号,估计池中有鱼多少条?练习练习5.5.回顾小结回顾小结回顾小结回顾小结 :总体分布的频率、频数的概念总体分布的频率、频数的概念;编制频率分布表的一般步骤编制频率分布表的一般步骤。(1)求全距求全距,决定组数和组距;决定组数和组距;全距全距是指是指整个整个取值区间取值区间的长度的长度,组距组距是指分成的区间的长度是指分成的区间的长度;(2)分组分组,通常对组内的数值所在的区间取通常对组内的数值所在的区间取左左闭右开区间闭右开区间,最后一组取最后一组取闭区间闭区间;(3)登记频数,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表
限制150内