《222用样本数字特征估计总体数字特征(第2课时).ppt》由会员分享,可在线阅读,更多相关《222用样本数字特征估计总体数字特征(第2课时).ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.2.2 .2.2 用样本的用样本的数字特征数字特征 估计总体的数字特征估计总体的数字特征 第二课时第二课时 知识探究(二):标准差知识探究(二):标准差 样本的众数、中位数和平均数常用来表样本的众数、中位数和平均数常用来表示样本数据的示样本数据的“中心值中心值”,其中众数和中位数容,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息达样本数据中的少量信息. . 平均数代表了数据更平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大的数据对平均数
2、的影响也越大. .当样本数据质量当样本数据质量比较差时,使用众数、中位数或平均数描述数据比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度一个统计数字刻画样本数据的离散程度. . 思考思考1 1:在一次射击选拔赛中,甲、乙两名运动员在一次射击选拔赛中,甲、乙两名运动员各射击各射击1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4
3、 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分别为多少环?甲、乙两人本次射击的平均成绩分别为多少环?77乙甲, xx77乙甲, xx思考思考2 2:甲、乙两人射击的平均成绩相等,观察两甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异人成绩的频率分布条形图,你能说明其水平差异在那里吗?在那里吗?环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 104 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20
4、.20.10.14 5 6 7 8 9 104 5 6 7 8 9 10 O O(乙)(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定比较稳定. .思考思考3 3:对于样本数据对于样本数据x x1 1,x x2 2,x xn n,设想通过各,设想通过各数据到其平均数的平均距离来反映样本数据的分散数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?程度,那么这个平均距离如何计算? 12| |nxxxxxxn-+-+-L思考思考4 4:反映样本数据的分散程度的大小,最常用的反映样本数据的分散程度的大小,最常用的统计量
5、是标准差,一般用统计量是标准差,一般用s s表示表示. .假设样本数据假设样本数据x x1 1,x x2 2,x xn n的平均数为,则标准差的计算公式是:的平均数为,则标准差的计算公式是:22212()()()nxxxxxxsn-+-+-=L 那么标准差的取值范围是什么?标准差为那么标准差的取值范围是什么?标准差为0 0的样的样本数据有何特点?本数据有何特点? s0s0,标准差为,标准差为0 0的样本数据都相等的样本数据都相等. . 思考思考5 5:对于一个容量为对于一个容量为2 2的样本:的样本:x x1 1,x x2 2(x(x1 1x x2 2) ),则,则 , , 在数轴上,这两个统
6、计数据有什么几何意义?在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影由此说明标准差的大小对数据的离散程度有何影响?响? 122xxx+=212xxs-= 标准差越大离散程度越大,数据较分散;标准标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周差越小离散程度越小,数据较集中在平均数周围围. . 知识补充知识补充1.1.标准差的平方标准差的平方ss称为方差,有时用方差代替标称为方差,有时用方差代替标准差测量样本数据的离散度准差测量样本数据的离散度. .方差与标准差的测量方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差效
7、果是一致的,在实际应用中一般多采用标准差. .2.2.现实中的总体所包含的个体数往往很多,总体现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性但要求样本有较好的代表性. .3.3.对于城市居民月均用水量样本数据,其平对于城市居民月均用水量样本数据,其平均数均数 ,标准差标准差s=0.868s=0.868. .在这在这100100个数据中,个数据中,落在区间落在区间( -s-s, +s+s)=1.105=1.105
8、,2.8412.841外的有外的有2828个;个;落在区间落在区间( -2s-2s, +2s+2s)=0.237=0.237,3.7093.709外的外的只有只有4 4个;个;落在区间落在区间( -3s-3s, +3s+3s)=-0.631=-0.631,4.5774.577外的外的有有0 0个个. .1. 973x=xxxxxx 一般地,对于一个正态总体,数据落在区一般地,对于一个正态总体,数据落在区间(间( -s-s, +s+s)、()、( -2s-2s, +2s+2s)、)、( -3s-3s, +3s+3s)内的百分比分别为)内的百分比分别为68.3%68.3%、95.4%95.4%、9
9、9.7%99.7%,这个原理在产品质量控制中这个原理在产品质量控制中有着广泛的应用(参考教材有着广泛的应用(参考教材P79“P79“阅读与思阅读与思考考”). . xxxxxx例题分析例题分析例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明他们的异同点说明他们的异同点. .(1) 5(1) 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5;(2) 4(2) 4,4 4,4 4,5 5,5 5,5 5,6 6,6 6,6 6;O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)50 xs=O
10、 O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)50. 82xs=(3) 3(3) 3,3 3,4 4,4 4,5 5,6 6,6 6,7 7,7 7;(4) 2(4) 2,2 2,2 2,2 2,5 5,8 8,8 8,8 8,8.8.频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)51. 49xs=1.01.00.80.80.60.60.40.40.20.2(4 4)频率频率1 2 3 4 5 6 7 81 2 3 4 5 6 7
11、8 O O52. 83xs=例例2 2 甲、乙两人同时生产内径为甲、乙两人同时生产内径为25.40mm25.40mm的一种零件,的一种零件,为了对两人的生产质量进行评比,从他们生产的零件为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取中各随机抽取2020件,量得其内径尺寸如下(单位:件,量得其内径尺寸如下(单位:mmmm):):甲甲 :25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40
12、25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.44 25.40 25.42 25.35 25.41 25.39 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.3
13、2 25.32 25.3225.47 25.31 25.32 25.32 25.32 25.48 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?从生产零件内径的尺寸看,谁生产的零件质量较高? 25. 401x甲25. 406x乙0. 037s甲0. 068s乙 甲生产的零件内径更接近内径标准,且稳定程度甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高较高,故甲生产的零件质量较高. . 说明:说明:1.1.生产质量可以从总体的平均数与标准差两生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准个角度来衡量,但甲、乙两个总体的平均数与标准
14、差都是不知道的,我们就用样本的平均数与标准差差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差估计总体的平均数与标准差. . 2. 2.问题中问题中25.40mm25.40mm是内径的标准值,而不是是内径的标准值,而不是总体的平均数总体的平均数. .例例3 3 以往招生统计显示,某所大学录取的新生高以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在考总分的中位数基本稳定在550550分,若某同学今年分,若某同学今年高考得了高考得了520520分,他想报考这所大学还需收集哪些分,他想报考这所大学还需收集哪些信息?信息?要点:(要点:(1 1)查往年录取的新生的平均分
15、数)查往年录取的新生的平均分数. .若平若平均数小于中位数很多,说明最低录取线较低,可均数小于中位数很多,说明最低录取线较低,可以报考;以报考; (2 2)查往年录取的新生高考总分的标准差)查往年录取的新生高考总分的标准差. .若标准差较大,说明新生的录取分数较分散,最若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考低录取线可能较低,可以考虑报考. .例例4 4 在去年的足球甲在去年的足球甲A A联赛中,甲队每场比赛平均联赛中,甲队每场比赛平均失球数是失球数是1.51.5,全年比赛失球个数的标准差为,全年比赛失球个数的标准差为1.11.1;乙队每场比赛平均失球数是乙队每
16、场比赛平均失球数是2.12.1,全年比赛失球个,全年比赛失球个数的标准差为数的标准差为0.4.0.4.你认为下列说法是否正确,为你认为下列说法是否正确,为什么?什么? (1 1)平均来说甲队比乙队防守技术好;)平均来说甲队比乙队防守技术好;(2 2)乙队比甲队技术水平更稳定;)乙队比甲队技术水平更稳定;(3 3)甲队有时表现很差,有时表现又非常好;)甲队有时表现很差,有时表现又非常好;(4 4)乙队很少不失球)乙队很少不失球. .例例5 5 有有2020种不同的零食,它们的热量含量如下:种不同的零食,它们的热量含量如下:110 120 123 165 432 190 174 110 120 1
17、23 165 432 190 174 235 428 318 249 280 162 146 235 428 318 249 280 162 146 210 120 123 120 150 140210 120 123 120 150 140(1 1)以上)以上2020个数据组成总体,求总体平均数与总个数据组成总体,求总体平均数与总体标准差;体标准差;(2 2)设计一个适当的随机抽样方法,从总体中抽)设计一个适当的随机抽样方法,从总体中抽取一个容量为取一个容量为7 7的样本,计算样本的平均数和标准的样本,计算样本的平均数和标准差差. .(1 1)总体平均数为)总体平均数为199.75199.7
18、5,总体标准差为,总体标准差为95.26.95.26.(1 1)以上)以上2020个数据组成总体,求总体平均数与个数据组成总体,求总体平均数与总体标准差;总体标准差;(2 2)设计一个适当的随机抽样方法,从总体中)设计一个适当的随机抽样方法,从总体中抽取一个容量为抽取一个容量为7 7的样本,计算样本的平均数和的样本,计算样本的平均数和标准差标准差. .(2 2)可以用抽签法抽取样本,样本的平均数和)可以用抽签法抽取样本,样本的平均数和标准差与抽取的样本有关标准差与抽取的样本有关. . 小小 结结1.1.对同一个总体,可以抽取不同的样本,相对同一个总体,可以抽取不同的样本,相应的平均数与标准差都
19、会发生改变应的平均数与标准差都会发生改变. .如果样如果样本的代表性差,则对总体所作的估计就会产本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽出错误估计的可能性就非常大,由此可见抽样方法的重要性样方法的重要性. .2. 2.在抽样过程中,抽取的样本是具有随机性的,在抽样过程中,抽取的样本是具有随机性的,如从一个包含如从一个包含6 6个个体的总体中抽取一个容量为个个体的总体中抽取一个容量为3 3的样本就有的样本就有2020中可能抽样,因此样本的数字特中可能抽样,因此样本的数字特征也有随机性征也有随机性. . 用样本的数字特征估计总体的数字特征,是一用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案种统计思想,没有惟一答案. .3. 3.在实际应用中,调查统计是一个探究性学习在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去知识应用到自主研究性课题中去. .作业:作业:P81P81习题习题2.2 A2.2 A组:组:6 6,7.7. B B组:组:1.1.
限制150内