《标准差的意义.ppt》由会员分享,可在线阅读,更多相关《标准差的意义.ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、标准差的意义现在学习的是第1页,共21页 现在学习的是第2页,共21页实际问题:有两位射击运动员在一次射击测试中各射靶实际问题:有两位射击运动员在一次射击测试中各射靶10次次,每次命中的环数如下:,每次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果是一次如果是一次选拔考核,你应该如何做选择?选拔考核,你应该如何做选择?计算可得计算可得77乙甲x,x两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没有什么那么两个人的水平就没有什么差异吗差异吗?现在学习的是第3页,共21页45678910环数环数频
2、率频率0.10.20.3(甲甲)456789100.10.20.30.4环数环数频率(乙乙)甲成绩比较甲成绩比较分散分散,乙成绩乙成绩相对集中相对集中看来,平均数还难以看来,平均数还难以概括样本的实际状态,概括样本的实际状态,因此因此,我们还需要从另外的我们还需要从另外的角度来考察这两组数据角度来考察这两组数据.现在学习的是第4页,共21页思思 考考:什么样的指标可以反映一组数据:什么样的指标可以反映一组数据 变变化范围的大小?化范围的大小?我们可以用一组数据中的最大值减去最小值我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围。用这种方所得的差来反映这组数据的变化范围。用
3、这种方法得到的差称为法得到的差称为极差极差 极差最大值最小值极差最大值最小值 现在学习的是第5页,共21页 在生活中,我们常常会和极差打交道在生活中,我们常常会和极差打交道班级里个子最高的学生比个子最矮的学生高班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子子大多少?这些都是求极差的例子 例例1.(口答)求下列各题的极差。(口答)求下列各题的极差。(1)某班个子最高的学生身高为)某班个子最高的学生身高为1.70米,个子最矮米,个子最矮的学生的身高为的学生的身高为1.38米,求该班所有学生身高的米
4、,求该班所有学生身高的极差。极差。(2)小明家中,年纪最大的长辈的年龄是)小明家中,年纪最大的长辈的年龄是78岁岁,年纪最小的孩子的年龄是,年纪最小的孩子的年龄是9岁,求小明家中所有岁,求小明家中所有成员年龄的极差。成员年龄的极差。现在学习的是第6页,共21页甲的环数极差甲的环数极差=10-4=6=10-4=6乙的环数极差乙的环数极差=9-5=4.=9-5=4.极差对极差对极端值非常敏感极端值非常敏感,在一定程度上表明,在一定程度上表明样本数据的的样本数据的的波动情况波动情况但极差只能反映一组数但极差只能反映一组数据中两个极端值之间的差异情况,对其他数据的据中两个极端值之间的差异情况,对其他数
5、据的波动情况不敏感,到底是波动情况不敏感,到底是A A组还是组还是B B组数据更加稳定组数据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的呢?有必要重新找一个对整组数据波动情况更敏感的指标指标现在学习的是第7页,共21页 考察样本数据的分散程度的大小,最常用考察样本数据的分散程度的大小,最常用的统计量是的统计量是 标准差是样本平均数的一种标准差是样本平均数的一种平均距离平均距离,一般用一般用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:).,2,1(nixxix。xxxxxin的距离是的距离是到到表示这组数据的平均数表示这组数据的平均数假设样本数据是
6、假设样本数据是,.,21现在学习的是第8页,共21页 于是样本数据于是样本数据x1,x2,xn,到到x的平均距离的平均距离是是12|nxxxxxxsn平均距离平均距离标准差标准差由于上式含有绝对值,运算不太方便,因由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差此,通常改用如下公式来计算标准差22212()()()nxxxxxxsn 现在学习的是第9页,共21页考虑一个容量为考虑一个容量为2的样本的样本:.2,2,121221xxaxxxx记其样本的标准差为标准差的几何意义标准差的几何意义221xx 1x2xa 标准差标准差用来衡量一批数据的用来衡量一批数据的波动大小波动大
7、小(即这批数即这批数据偏离平均数的大小据偏离平均数的大小).现在学习的是第10页,共21页标准差的取值范围是什么标准差的取值范围是什么?标准差为标准差为0的样本数据的样本数据有什么特点有什么特点?标准差是怎样表现数据的离散程度的标准差是怎样表现数据的离散程度的?标准差的取值范围标准差的取值范围:0,+)标准差为标准差为0的样本数据都等于样本平均数的样本数据都等于样本平均数.标准差表现为:标准差越大,表明数据的离散程度标准差表现为:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程就越大;反之,标准差越小,表明各数据的离散程度就越小。度就越小。它用来描述样本数据的离散程度
8、。在实际应用中它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。,标准差常被理解为稳定性。标准差的作用标准差的作用:现在学习的是第11页,共21页例题分析例题分析例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明他们的异同点说明他们的异同点.(1)5(1)5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5;(2)4(2)4,4 4,4 4,5 5,5 5,5 5,6 6,6 6,6 6;O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)50 xs=O O频率频率1.00.8
9、0.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)50.82xs=现在学习的是第12页,共21页(3)3(3)3,3 3,4 4,4 4,5 5,6 6,6 6,7 7,7 7;(4)2(4)2,2 2,2 2,2 2,5 5,8 8,8 8,8 8,8.8.频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)51.49xs=1.01.00.80.80.60.60.40.40.20.2(4 4)频率频率1 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O
10、 O52.83xs=现在学习的是第13页,共21页 对于城市居民月均用水量样本数据,其平均数对于城市居民月均用水量样本数据,其平均数 =1.973=1.973,标准差,标准差s=0.868.s=0.868.在这在这100100个数据中,个数据中,落在区间(落在区间(-s-s,+s+s)=1.105=1.105,2.8412.841外的有外的有2828个;个;落在区间(落在区间(-2s-2s,+2s+2s)=0.237,3.709=0.237,3.709外的只有外的只有4 4个;个;落在区间(落在区间(-3s-3s,+3s+3s)=-0.631=-0.631,4.5774.577外的有外的有0
11、0个个.xxxxxxx一般地一般地,对于一个正态总体对于一个正态总体(,),(,),数据落在区间数据落在区间()()、()()、()()内的内的百分比分别为百分比分别为68.3%68.3%、95.4%95.4%、99.7%99.7%,这个原理在产,这个原理在产品质量控制中有着广泛的应用(参考教材品质量控制中有着广泛的应用(参考教材P79“P79“阅读阅读与思考与思考”).2,2,2 3,3 现在学习的是第14页,共21页.)()()(1222212xxxxxxnsn从数学的角度考虑,人们有时用标准差的从数学的角度考虑,人们有时用标准差的平方平方s s2 2_ _-方差来代替标准作为测量样本数据
12、分方差来代替标准作为测量样本数据分散程度散程度的工具。的工具。现在学习的是第15页,共21页如果数据如果数据 的平均数为的平均数为 ,方差为,方差为 ,那么那么nxxx,2,1x2s,)(1)1(2222212xxxxnsn,的方差仍为的方差仍为,数据数据221)2(saxaxaxn.)3(2221skkxkxkxn的的方方差差为为,数数据据现在学习的是第16页,共21页现在学习的是第17页,共21页问问:(1)哪一种玉米长得高?哪一种玉米长得高?(2)哪种玉米的苗长得齐?哪种玉米的苗长得齐?现在学习的是第18页,共21页小结小结1.1.用样本的数字特征估计总体的数字特征,是指用样本的众用样本
13、的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据统计数据.2.2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一组数据的平均水平的作用,代表一组数据的平均水平.标标准差描述一组数据围绕平均数波动的幅度准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策决策.3.3.对同一个总体,可以抽取不同的样本,相应的平均数对同一个总体,可以抽取不同的样本,
14、相应的平均数与标准差都会发生改变与标准差都会发生改变.如果样本的代表性差,则对总如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性可见抽样方法的重要性.现在学习的是第19页,共21页4.4.在抽样过程中,抽取的样本是具有随机性的,如从在抽样过程中,抽取的样本是具有随机性的,如从一个包含一个包含6 6个个体的总体中抽取一个容量为个个体的总体中抽取一个容量为3 3的样本就的样本就有有2020中可能抽样,因此样本的数字特征也有随机
15、性中可能抽样,因此样本的数字特征也有随机性.用用样本的数字特征估计总体的数字特征,是一种统计样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案思想,没有惟一答案.现在学习的是第20页,共21页练习:练习:(1)如果数据)如果数据 的平均数为的平均数为 ,方差为,方差为 ,中位数为,中位数为a,求数据,求数据3x1+5,3x2+5,3xn+5的平的平均数、标准差、方差、中位数。均数、标准差、方差、中位数。nxxx,2,1x2s(2)求数据)求数据2,1,0,-1,1的方差。的方差。(3)已知)已知40个数据中的前个数据中的前20个数据的平均数和方差分别个数据的平均数和方差分别为为60、20,后,后20个数据的平均数和方差分别为个数据的平均数和方差分别为80、40,求,求这这40个数据的平均数和方差。个数据的平均数和方差。现在学习的是第21页,共21页
限制150内