【课件】总体离散程度的估计课件高一下学期数学人教A版(2019)必修第二册+.pptx
人 教A版 高 中 数 学 必 修 第 二 册9.2 用样本估计总体用样本估计总体 9.2.4 总体离散程度的估计总体离散程度的估计 把一组数据按大小顺序排列把一组数据按大小顺序排列,处在最中间的一个数据处在最中间的一个数据(或两个数据的平均数或两个数据的平均数););从频率分布直方图中估计中位数左从频率分布直方图中估计中位数左右两边的直方图的面积相等右两边的直方图的面积相等.一一组组数数据据中中重重复复出出现现次次数数最最多多的的数数;从从频频率率分分布布直直方方图图 中估计众数是最高的矩形的中点中估计众数是最高的矩形的中点.1.众数2中位数3平均数如果有如果有n n个数据个数据 那么这那么这n n个数的平均数个数的平均数 也可以从频率分布直方图中估计平均数也可以从频率分布直方图中估计平均数,平均数的估计值等平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中的于频率分布直方图中每个小矩形的面积乘以小矩形底边中的横坐标之和横坐标之和.温故知新温故知新 课堂引入课堂引入 平均数、中位数和众数平均数、中位数和众数为我们提供了一组数据为我们提供了一组数据的的集中趋势集中趋势的信息的信息,这是概括一组数据的特征这是概括一组数据的特征的有效方法的有效方法.但仅知道集中趋势的信息但仅知道集中趋势的信息,很多时候还不能使我很多时候还不能使我们做出有效的决策们做出有效的决策.提出问题提出问题 问题问题3 3、有两名射击队员在一次射击测试中各有两名射击队员在一次射击测试中各射靶射靶1010次次,每次命中的环数如下每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4乙 9 5 7 8 7 6 8 6 7 7如果你是教练,你如何对两位运动员的射击情如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应况作出评价?如果这是一次选拔性考核,你应当如何作出选择?当如何作出选择?计算甲、乙两名运动员射击成绩的平均数、中位数众数计算甲、乙两名运动员射击成绩的平均数、中位数众数解决问题解决问题 通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数众数都是平均数、中位数众数都是7.7.从这个角度看,两名运动员之间没有从这个角度看,两名运动员之间没有差别。差别。但从上图中看但从上图中看,甲的成绩比较分散甲的成绩比较分散,乙的成绩相对集中,即甲的成乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定。他们的射击成绩是存绩波动幅度比较大,而乙的成绩比较稳定。他们的射击成绩是存在差异的,那么,如何度量成绩的这种差异呢?在差异的,那么,如何度量成绩的这种差异呢?引入新知引入新知 一种简单的度量数据一种简单的度量数据离散程度离散程度的方法就是用的方法就是用极差极差。根据甲、乙运动员的根据甲、乙运动员的1010次射击成绩,可以得到次射击成绩,可以得到甲命中环数的极差甲命中环数的极差=10-4=6乙命中环数的极差乙命中环数的极差=9-5=4可以发现甲的成绩波动范围比乙大。极差在一定程度上刻画了数可以发现甲的成绩波动范围比乙大。极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少。很少。提出问题提出问题 我们知道,如果射击的成绩很稳定,那么大多数的射击我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远。幅度很大,那么大多数的射击成绩离平均成绩会比较远。因此,我们可以通过这两组射击成绩与它们的平均成绩因此,我们可以通过这两组射击成绩与它们的平均成绩的的“平均距离平均距离”来度量成绩的波动幅度。来度量成绩的波动幅度。思考:思考:如何定义如何定义“平均距离平均距离”?为了避免式中含有绝对值,通常改用平方来代替,即为了避免式中含有绝对值,通常改用平方来代替,即假设一组数据是假设一组数据是 ,用,用 表示这组数据的平均数表示这组数据的平均数。用每个数据与平均数的差的绝对值作为用每个数据与平均数的差的绝对值作为“距离距离”,即,即则这组数据到则这组数据到 的的“平均距离平均距离”为为我们将其定义为这组数据的我们将其定义为这组数据的方差:方差:引入新知引入新知 引入新知引入新知 有时为了计算方差的方便,我们还把方差写成以下形式有时为了计算方差的方便,我们还把方差写成以下形式由于由于方差的单位是原始数据的单位的平方方差的单位是原始数据的单位的平方,与原始数据不一致。,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即为了使二者单位一致,我们对方差开方,取它的算数平方根,即我们称其为这组数据的我们称其为这组数据的标准差标准差总体方差和总体标准差总体方差和总体标准差样本方差和样本标准差样本方差和样本标准差引入新知引入新知 标准差刻画了数据的数据的离散程度或波动幅度标准差刻画了数据的数据的离散程度或波动幅度,标准差越大,数,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小;据的离散程度越大;标准差越小,数据的离散程度越小;显然,显然,在刻画数据的分散程度上,方差和标准差是一样的,但在解决实际在刻画数据的分散程度上,方差和标准差是一样的,但在解决实际问题中,一般问题中,一般多采用标准差多采用标准差。通常我们用样本方差、标准差估计通常我们用样本方差、标准差估计总体方差、标准差总体方差、标准差即乙比甲的射击成绩稳定即乙比甲的射击成绩稳定如果要从这两名选手中选择一名参加比赛,要看一下他们的平均如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置。如果两人都排在前面,就选成绩成绩在所有参赛选手中的位置。如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲。稳定的乙选手,否则可以选甲。引入新知引入新知 特征:特征:标准差和方差刻画了数据的离散程度或波动幅度标准差(或方差)越大,数据的离散程度越大大,越不稳定;标准差(或方差)越小,数据的离散程度越小小,越稳定在刻画数据的分散程度上,方差和标准差是一样的.但在解决 实际问题中,一般多采用标准差标准差课堂典例课堂典例 例例6 6、在对树人中学高一学生身高的调查中在对树人中学高一学生身高的调查中,采用样本采用样本比例分配的分层随机抽样,如果不知道样本数据,只知比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生道抽取了男生2323人人,其平均数和方差分别为其平均数和方差分别为170.6170.6和和12.5912.59,抽取了女生,抽取了女生2727人人,其平均数和方差分别为其平均数和方差分别为160.6160.6和和38.62.38.62.你能由这些数据计算出总样本的方差,并对高你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗一年级全体学生的身高方差作出估计吗?解:把男生样本记为解:把男生样本记为 ,其平均数记为,其平均数记为 ,方差记为,方差记为 ;把女生样本记为把女生样本记为 ,其平均数记为,其平均数记为 ,方差记为,方差记为 ;把总体数据样本的平均数记为把总体数据样本的平均数记为 ,方差记为,方差记为 ;课堂典例课堂典例 由由根据按比例分配分层随机抽样总样本平均数与各层样根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为本平均数的关系,可得总样本平均数为高一年级全体学生的身高方差为高一年级全体学生的身高方差为51.486251.4862课堂典例课堂典例 样本标准差刻画了数据离平均数波动的幅度大小样本标准差刻画了数据离平均数波动的幅度大小,平均数和标准差平均数和标准差一起能反映数据取值的信息一起能反映数据取值的信息.如如,根据根据9.2.19.2.1节中节中100100户居民用户的月均用水量数据户居民用户的月均用水量数据,可以计算可以计算出样本平均数和样本标准差分别为出样本平均数和样本标准差分别为课堂典例课堂典例 练习练习1 甲甲、乙两机床同时加工直径为、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取的零件,为检验质量,从中抽取6件件测量数据为测量数据为(单位:单位:cm):甲:甲:9910098100100103乙:乙:9910010299100100(1)分别计算两组数据的平均数及方差;分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定根据计算说明哪台机床加工零件的质量更稳定探究探究总结:平均数总结:平均数、方差性质、方差性质 练习练习2练习3甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.解由题图可得,甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;乙:13,14,12,12,14.(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.变式变式样本样本数均为数均为9的四组数据,它们的平均数都是的四组数据,它们的平均数都是5,条形图如图所示,则标准,条形图如图所示,则标准差最大的一组是差最大的一组是()A第一组第一组B第二组第二组 C第三组第三组 D第四组第四组跟踪训练3甲、乙、丙三名学生在一项集训中的40次测试分数都在50,100内,将他们的测试分数分别绘制成频率分布直方图,如图所示,记甲、乙、丙的分数标准差分别为s1,s2,s3,则它们的大小关系为A.s1s2s3 B.s1s3s2C.s3s1s2 D.s3s2s1解析比较三个频率分布直方图知,甲为“双峰”直方图,两端数据最多,最分散,方差最大;乙为“单峰”直方图,数据最集中,方差最小;丙为“单峰”直方图,但数据分布相对均匀,方差介于甲、乙之间.综上可知s1s3s2.1 1、用定义计算样本方差和样本标准差、用定义计算样本方差和样本标准差2 2、分层抽样总样本方差的计算、分层抽样总样本方差的计算3 3、用频率分布直方图估计样本方差、用频率分布直方图估计样本方差 方差的估计值等于每一个小矩形底边中点值减去方差的估计值等于每一个小矩形底边中点值减去平均数的平方乘小矩形的面积的和平均数的平方乘小矩形的面积的和.课堂小结课堂小结 课堂小结课堂小结 (1)(1)标准准差差、方方差差描描述述了了一一组数数据据围绕平平均均数数波波动的的大大小小标准准差差、方方差差越越大大,数数据据的的离离散散程程度度越越大大;标准准差差、方方差差越越小小,数数据据的离散程度越小;的离散程度越小;(2)(2)标准差、方差的取准差、方差的取值范范围:00,)标准准差差、方方差差为0 0时,样本本各各数数据据全全相相等等,表表明明数数据据没没有有波波动幅幅度,数据没有离散性;度,数据没有离散性;(3)(3)标准准差差的的平平方方s s2 2称称为方方差差,有有时用用方方差差代代替替标准准差差测量量样本本数数据据的的离离散散程程度度方方差差与与标准准差差的的测量量效效果果是是一一致致的的,在在实际应用中一般多采用用中一般多采用标准差;准差;(4)(4)标准差的准差的单位与位与样本数据一致本数据一致标准差与方差的特征:标准差与方差的特征: