高一数学标准差优秀课件.ppt
高一数学标准差第1页,本讲稿共12页 平均数向我们提供了样本数据的重要信息平均数向我们提供了样本数据的重要信息,但是但是平均有时也会使我们作出对总体的片面判断因为平均有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括况显然是不能忽的因此,只有平均数还难以概括样本数据的实际状态样本数据的实际状态 如:有两位射击运动员在一次射击测试中各如:有两位射击运动员在一次射击测试中各射靶射靶10次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水那么两个人的水平就没有什么差异吗平就没有什么差异吗?2.标准差标准差第2页,本讲稿共12页45678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)第3页,本讲稿共12页直观上看直观上看,还是有差异的还是有差异的.如如:甲成绩比较分散甲成绩比较分散,乙成绩乙成绩相对集中相对集中(如图示如图示).因此因此,我们还需要从另外的角度来考察这两我们还需要从另外的角度来考察这两组数据组数据.例如例如:在作统计图在作统计图,表时提到过的极差表时提到过的极差.甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一起与平均数一起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显然显然,极差对极端值非常极差对极端值非常敏感敏感,注意到这一点注意到这一点,我们可以得到一种我们可以得到一种“去掉一个最高分去掉一个最高分,去掉一去掉一个最低分个最低分”的统计策略的统计策略.考察样本数据的分散程度的大小,最常用的统计量是标准差考察样本数据的分散程度的大小,最常用的统计量是标准差标准差是样本平均数的一种平均距离,一般用标准差是样本平均数的一种平均距离,一般用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:第4页,本讲稿共12页由于上式含有绝对值,运算不太方便,因此,通常改用如由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差下公式来计算标准差一个样本中的个体与平均数之间的距离关系可用下图表示一个样本中的个体与平均数之间的距离关系可用下图表示:考虑一个容量为考虑一个容量为2的样本的样本:第5页,本讲稿共12页显然显然,标准差越大标准差越大,则则a越大越大,数据的离散程度越大数据的离散程度越大;标准差越小标准差越小,数据的离散程度越数据的离散程度越小小.用计算器可算出甲用计算器可算出甲,乙两人的的成绩的标准差乙两人的的成绩的标准差由由 可以知道可以知道,甲的成绩离散程度大甲的成绩离散程度大,乙的成绩离散程度小乙的成绩离散程度小.由由此可以估计此可以估计,乙比甲的射击成绩稳定乙比甲的射击成绩稳定.上面两组数据的离散程度与标准差之间的关系可用图直观地上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来表示出来.45678910a第6页,本讲稿共12页例题例题1:画出下列四组样本数据的直方图画出下列四组样本数据的直方图,说明它们的异同点说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解解:四组样本数据的直方图是四组样本数据的直方图是:频率o1 2 3 4 56 7 80.10.20.30.40.50.60.70.80.91.0S=0.00(1)第7页,本讲稿共12页0.10.20.30.40.50.60.70.80.91.01234 5678频率o0.10.20.30.40.50.60.70.80.91.0S=1.49(2)频率o1 2 3 4 56 7 8S=0.82频率o1 2 3 456 7 80.10.20.30.40.50.60.70.80.91.0S=2.83第8页,本讲稿共12页四组数据的平均数都是四组数据的平均数都是5.0,标准差分别是标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数虽然它们有相同的平均数,但是它们有不同的标准差但是它们有不同的标准差,说说明数据的分散程度是不一样的明数据的分散程度是不一样的.标准差还可以用于对样本数据的另外一种解释标准差还可以用于对样本数据的另外一种解释.例如例如,在关于居在关于居民月均用水量的例子中民月均用水量的例子中,平均数平均数标准差标准差s=0.868,所以所以第9页,本讲稿共12页例例2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为了对两为了对两人的生产质量进行评比人的生产质量进行评比,从他们生产的零件中各抽出从他们生产的零件中各抽出20件件,量得其量得其内径尺寸如下内径尺寸如下(单位单位:mm)甲 25.46,25.32,25.45,25.39,25.36 25.34,25.42,25.45,25.38,25.42 25.39,25.43,25.39,25.40,25.44 25.40,25.42,25.35,25.41,25.39乙 25.40,25.43,25.44,25.48,25.48 25.47,25.49,25.49,25.36,25.34 25.33,25.43,25.43,25.32,25.47 25.31,25.32,25.32,25.32,25.48 从生产的零件内径的尺寸看从生产的零件内径的尺寸看,谁生产的质量较高谁生产的质量较高?第10页,本讲稿共12页分析分析:每一个工人生产的所有零件的内径尺寸组成一个总体每一个工人生产的所有零件的内径尺寸组成一个总体,由于零件的生产标准已经给出由于零件的生产标准已经给出(内径内径25.40mm),生产质量可以从总生产质量可以从总体的平均数与标准差两个角度来衡量体的平均数与标准差两个角度来衡量.总体的平均数与内径标准总体的平均数与内径标准尺寸尺寸25.00mm的差异在时质量低的差异在时质量低,差异小时质量高差异小时质量高;当总体的平均当总体的平均数与标准尺寸很接近时数与标准尺寸很接近时,总体的标准差小的时候质量高总体的标准差小的时候质量高,标准差大标准差大的时候质量低的时候质量低.这样比较两人的生产质量只要比较他们所生产的零这样比较两人的生产质量只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是但是这两个总体的平均数与标准差都是不知道的这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的根据用样本估计总体的思想思想,我们可以通过抽样分别获得相应的样体数据我们可以通过抽样分别获得相应的样体数据,然后比较这两然后比较这两个样本的平均数个样本的平均数,标准差标准差,以此作为两个总体之间的估计值以此作为两个总体之间的估计值.解解:用计算器计算可得用计算器计算可得:第11页,本讲稿共12页 从样本平均数看从样本平均数看,甲生产的零件内径比乙生产的更接近内甲生产的零件内径比乙生产的更接近内径标准径标准(25.40mm),但是差异很小但是差异很小;从样本标准差看从样本标准差看,由于由于从上述例子我们可以看到从上述例子我们可以看到,对一名工人生产的零件内径对一名工人生产的零件内径(总体总体)的质量判断的质量判断,与我们抽取的内径与我们抽取的内径(样本数据样本数据)直接相关直接相关.显然显然,我们可以从这名工人生产的零我们可以从这名工人生产的零件中获取许多样本件中获取许多样本(为什么为什么?).这样这样,尽管总体是同一个尽管总体是同一个,但由于样本不同但由于样本不同,相应的相应的样本频率分布与平均数样本频率分布与平均数,标准差等都会发生改变标准差等都会发生改变,这就会影响到我们对总这就会影响到我们对总体情况的估计体情况的估计.如果样本的的代表性差如果样本的的代表性差,那么对总体所作出的估计就会产生那么对总体所作出的估计就会产生偏差偏差;样本没有代表性时样本没有代表性时,对总体作出错误估计的可能性就非常大对总体作出错误估计的可能性就非常大.这也正是我这也正是我们在前面讲随机抽样时反复强调样本代表性的理由们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中在实际操作中,为了减少为了减少错误的发生错误的发生,条件许可时条件许可时,通常采取适当增加样本容量的方法通常采取适当增加样本容量的方法.当然当然,关键还是要关键还是要改进抽样方法改进抽样方法,提高样本的代表性提高样本的代表性.第12页,本讲稿共12页