《用样本估计总体人教A版(必修3)课件.ppt》由会员分享,可在线阅读,更多相关《用样本估计总体人教A版(必修3)课件.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.2 2.2 用样本估计总体用样本估计总体.2.1.2.1用样本的频率分布估计总体分布用样本的频率分布估计总体分布第一课时第一课时 问题提出问题提出1.1.随机抽样有哪几种基本的抽样方法?随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们基本特征,即用样本估计总体,是我们需要进一步学习的内容需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样.3.3.高一某班有高一某班有5050名学生,在数学必名学生,在
2、数学必修修结业考试后随机抽取结业考试后随机抽取1010名,其考试名,其考试成绩如下:成绩如下:8282,75 75,61 61,93 93,62 62,55 55,70 70,68 68,85 85,78.78.如果要求我们根据上述抽样数据,如果要求我们根据上述抽样数据,估计该班对数学模块估计该班对数学模块的总体学习水平,的总体学习水平,就需要有相应的数学方法作为理论指导,就需要有相应的数学方法作为理论指导,本节课我们将学习用本节课我们将学习用样本的频率分布估样本的频率分布估计总体分布计总体分布.频率分布表及直方图、频率分布表及直方图、折线图、密度曲线、折线图、密度曲线、茎叶图茎叶图3.1 2
3、.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7
4、0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7
5、1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考思考1 1:上述上述100100个数据中的最大值和最个数据中的最大值和最小值分别是什么?由此说明样本数据的小值分别是什么?由此说明样本数据的变化范围是什么?变化范围是什么?思考思考2 2:样本数据中的最大值和最小值样本数据中的最大值和最小值的差称
6、为的差称为极差极差.如果将上述如果将上述100100个数据个数据按按组距组距为为0.50.5进行分组,那么这些数据进行分组,那么这些数据共分为多少组?共分为多少组?0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.2思考思考3 3:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,各组数据的取值范围组,各组数据的取值范围可以如何设定?可以如何设定?思考思考4 4:如何统计上述如何统计上述100100个数据在各组个数据在各组中的中的频数频数?如何计算样本数据在各组中?如何计算样本数据在各组中的的频率频率?你能将这
7、些数据用表格反映出?你能将这些数据用表格反映出来吗?来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.思考思考5 5:上表称为样本数据的上表称为样本数据的频率分布表频率分布表,由此可以推测该市全体居民月均用水量由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了用水量标准提供参考依据,这里体现了一种什么统计思想?一种什么统计思想?用样本的频率分布估计总体分布用样本的频率分布估计总体分布.思考思考6 6:如果市政府希望如果市政府希望85%85%左右的居民每
8、月左右的居民每月的用水量不超过标准,根据上述频率分布表,的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即你对制定居民月用水量标准(即a a的取值)的取值)有何建议?有何建议?88%88%的居民月用水量在的居民月用水量在3t 3t以下,可建议取以下,可建议取a=3.a=3.思考思考7 7:在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以以上的居民用水不超标吗?哪些环节可能会导上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?致结论出现偏差?分组时,组距的大小可能会导致结论出现偏分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行
9、评价的差,实践中,对统计结论是需要进行评价的.思考思考1010:一般地,列出一组样本数据的频率一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?分布表可以分哪几个步骤进行?第一步,求极差第一步,求极差.(极差(极差=样本数据中最大值与最小值的差)样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决定组距与组数.(设(设k=k=极差极差组距,若组距,若k k为整数,则组为整数,则组数数=k=k,否则,组数,否则,组数=k+1=k+1)第三步,确定分点,将数据分组第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格.(频数(频数=
10、样本数据落在各小组内的个数,样本数据落在各小组内的个数,频率频率=频数频数样本容量)样本容量)上图称为上图称为频率分布直方图频率分布直方图,其中横轴表,其中横轴表示月均用水量,纵轴表示频率示月均用水量,纵轴表示频率/组距组距.频率分布直方图中各小长方形的和高度频率分布直方图中各小长方形的和高度在数量上有何特点?在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组距高度:高度:频率频率组距组距思考思考2 2:频率分布直方图中各小长方形的频率分布直方图中各小长方形的面积表示什么?各小长方
11、形的面积之和面积表示什么?各小长方形的面积之和为多少?为多少?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各小长方形的面积各小长方形的面积=频率频率各小长方形的面积之和各小长方形的面积之和=1 1(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一
12、个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.思考思考4 4:样本数据的频率分布直方图是根样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?分布直方图的作图步骤如何?第一步,画平面直角坐标系第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与第三步,以组距为宽,各组的频率与组距的
13、商为高,分别画出各组对应的组距的商为高,分别画出各组对应的小长方形小长方形.思考思考5 5:对一组给定的样本数据,频率分对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以在居民月均用水量样本中,你能以1 1为组为组距画频率分布直方图吗?距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关.月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O理论迁移理论迁移 例例1 1 某地区为了了解知识分子的
14、年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444,40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4
15、646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例约岁的知识分子所占的比例约是多少是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 27 27,3232)3 0.06 3 0.06 32 32,3737)3 0.06 3 0.06 37 37,4242)9 0.18 9 0.18 42 42,4747)16 0.32 16 0.32 47 47,5252)7
16、 0.14 7 0.14 52 52,5757)5 0.10 5 0.10 57 57,6262)4 0.08 4 0.08 62 62,6767)3 0.06 3 0.06 合合 计计 50 1.00 50 1.00样本频率分布表:样本频率分布表:将直方图各块顶端中点连线你会发现什么呢将直方图各块顶端中点连线你会发现什么呢?:?:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O思考:思考:若组距取得越小,则频率折线的
17、若组距取得越小,则频率折线的光滑程度会怎样?光滑程度会怎样?越光滑频率分布折线图频率分布折线图如果样本容量足够大,分组的组距取得足够如果样本容量足够大,分组的组距取得足够小,则频率折线图将趋于一条光滑的曲线:小,则频率折线图将趋于一条光滑的曲线:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O总体密度曲线总体密度曲线 例例2 2 甲乙两篮球运动员在上赛季每场比赛的甲乙两篮球运动员在上赛季每场比赛的得分如下,试比较两位运
18、动员的水平。得分如下,试比较两位运动员的水平。甲:甲:1212,1515,2424,2525,3131,3131,3636,3636,3737,39 39,4444,4949,5050;乙:乙:8 8,1313,1414,1616,2323,2626,2828,3333,3838,39 39,51.51.解决这个实际问题还用频率分布表或者解决这个实际问题还用频率分布表或者频率分布直方图来做吗?频率分布直方图来做吗?知识探究(三):频率分布茎叶图知识探究(三):频率分布茎叶图 此时可以考虑:频率分布茎叶图此时可以考虑:频率分布茎叶图第一步,将每个数据分为茎(十位数)和叶第一步,将每个数据分为茎(
19、十位数)和叶(个位数);(个位数);第二步,将最小的茎和最大的茎之间的第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在中间;数按大小次序排成一列,写在中间;第三步,将各个数据的叶按大小次序写在第三步,将各个数据的叶按大小次序写在其茎右(左)侧其茎右(左)侧.一般地,列出一组样本数据的频率分布一般地,列出一组样本数据的频率分布茎叶图可以分哪几个步骤进行?茎叶图可以分哪几个步骤进行?小结小结1.1.频率分布是指一个样本数据在各个小范围频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值内所占比例的大小,总体分布是指总体取值的频率分布规律的频率分布规律.我们通常用样本的频率分我们通常用样本的频率分布表或频率分布直方图去估计总体的分布布表或频率分布直方图去估计总体的分布.2.2.频率分布表和频率分布直方图,是对相同频率分布表和频率分布直方图,是对相同数据的两种不同表达方式数据的两种不同表达方式.用紧凑的表格改变用紧凑的表格改变数据的排列方式和构成形式,可展示数据的数据的排列方式和构成形式,可展示数据的分布情况分布情况.通过作图既可以从数据中提取信息,通过作图既可以从数据中提取信息,又可以利用图形传递信息又可以利用图形传递信息.
限制150内