人教A数学必修三全册统计学案2.2.2用样本的数字特征估计总体的数字特征 -.doc
综合复习材料高中资料§2.2.2用样本的数字特征估计总体的数字特征 学习目标 (1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特 征(如平均数、标准差),并做出合理的解释。(3)会用样本的基本数字特征估计总体的基本数字特征。(4)形成对数据处理过程进行初步评价的意识。 重点难点 重点:用样本平均数和标准差估计总体的平均数与标准差。难点:能应用相关知识解决简单的实际问题。 学法指导 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。 知识链接 用样本的频率分布去估计总体的分布,当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。 问题探究7一、情景设置: 美国NBA在20062007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29. 如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征. 二、探究新知: 知识探究(一):众数、中位数和平均数思考1:在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数?思考2:在城市居民月均用水量样本数据的频率分布直方图中(参考课本72页图2-2-5),你认为众数应在哪个小矩形内?由此估计总体的众数是什么? 思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?思考5:平均数是频率分布直方图的“重心”,在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?思考6:根据统计学中数学期望原理,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数. 由此估计总体的平均数是什么?思考7:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗? 频率0.40.30.20.14 5 6 7 8 9 10 环数O(甲)思考8:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会额成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义? 知识探究(二):标准差样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度. 思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7甲、乙两人本次射击的平均成绩分别为多少环?思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.1 4 5 6 7 8 9 O(乙)思考3:对于样本数据x1,x2,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,的平均数为,则标准差的计算公式是:那么标准差的取值范围是什么?标准差为0的样本数据有何特点?思考5:对于一个容量为2的样本:, 则在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?知识补充:1. 标准差的平方称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2. 现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3. 3.对于城市居民月均用水量样本数据,其平均数 ,标准差s=0.868.在这100个数据中,落在区间=1.105,2.841外的有28个;落在区间=0.237,3.709外的只有4个;落在区间=-0.631,4.577外的有0个. 一般地,对于一个正态总体,数据落在区间、 内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).三、典例分析:例 1 计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性. 甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7例2 画出下列四组样本数据的条形图,说明他们的异同点.(1) ,;(2) ,;(3) ,;(4) ,.分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。例3甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲 :25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39乙:25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产零件内径的尺寸看,谁生产的零件质量较高? (参考课本77) 例4以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学今年高考得了520分,他想报考这所大学还需收集哪些信息?例5 有20种不同的零食,它们的热量含量如下:110 120 123 165 432 190 174 235 428 318 249 280 162 146 210 120 123 120 150 140(1)以上20个数据组成总体,求总体平均数与总体标准差;(2)设计一个适当的随机抽样方法,从总体中抽取一个容量为7的样本,计算样本的平均数和标准差. 目标检测1、下列刻画一组数据离散程度的是 ( )A. 平均数 B.方差 C.中位数 D.众数2、下列说法错误的是 ( ) A.一个样本的众数、中位数、平均数不可能是同一个数B统计中,我们可以用样本平均数去估计总体平均数C.样本平均数既不可能大于,也不可能小于这个数中的所有数据D.众数、中位数、平均数从不同的角度描述了一组数据的集中趋势3、 若m个数的平均数是x,n个数的平均数是y,则这m+n个数的平均数是 ( ) A B C D4、某同学历次数学考试成绩是95,98,92,83,91和92,则他取得的数学成绩的平均数、中位数、众数、极差和标准差分别是 ( ) A.91.8,92,92,15,4.60 B.92,92,92,15,5.60 C.91.8,91,92,15,4.60 D.91,92,92,18,4.605、某校高一年级进行一次数学测试,抽取40人,算出平均成绩为80分,为准确起见,后来又抽取50人,算出其平均成绩为83分。通过两次抽样结果,估计这次数学测验成绩为 ( )A、81.7分 B、81.5分 C、 80分 D、83分6、在一次歌手大奖赛上,五位评委为某歌手打出的分数如下:9.4,8.4,9.9,9.6,9.5,去掉一个最高分和一个最低分后,所剩数据的平均值和标准差分别为 ( ) A.9.4, 0.1 B.9.4,0.01 C.9.5, 0.1 D.9.5,0.017、甲、乙两台机器同时生产 一种零件,现要检验它们的运 行情况,统计10天中两台机器每天出次品数分别是甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则出次品数较少的为 ( ) A.甲 B.乙 C.相同 D.不能确定8、.已知一组数的平均数是2,方差是,那么另一组数据的平均数和方差分别是 ( )A.2, B.2,1 C.4, D.4,39、计算:(1)1,2,3,4,5,6,7,8,9的方差 = 标准差s= ;( 2 )10,20,30,40,50,60,70,8 0,90的方差= ,标准差s= . 试比较两组数据的计算结果,得到的一般结论是 10、已知样本101,100,99,x,y的平均数为100,方差为2,这个样本中的数据x和y的值分别是 , 11、(选做)如果5个从小到大的整数所组成的数组的中位数是4,这个组唯一的众数是6,那么这个数组全体数字的和的最大值为 。 12、某班50位同学的身高分成如下三层:层数身高/cm人数11551651521651752731751858(1)画出频数分布直方图,并据此估计全班同学的平均身高;(2)现自第一层中抽取三个样本,分别为154,160,163;自第二层中抽取五个样本,分别为171,168,166,174,171;自第三层中抽取两个样本,分别为175,179,估计全班同学之平均身高;(3)比较(1)和(2)的结果,你有什么体会?13、甲、乙两种玉米苗中各抽 10 株,分别测得它们的株高如下(单位:cm):甲:25 41 40 37 22 14 19 39 21 42乙:27 16 44 27 44 16 40 40 16 40问:(1)哪种玉米的苗长得高? (2)哪种玉米的苗长得齐?14、在某高中篮球联赛中,甲、乙两名运动员的得分如下.甲的得分:14,17,25,26,30,3l,3537,38,39,44,48,51,53,54;乙的得分:6,15,17,18,2l,27,28,33,35,38,40,44,56.(1)用茎叶图表示上面的样本数据,并找出样本数据的中位数;(2)根据(1)中所求的数据分析甲、乙两名运动员哪一位发挥得更加稳定. 纠错矫正 收获与体会