《教育统计学第三章.ppt》由会员分享,可在线阅读,更多相关《教育统计学第三章.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、LOGO第三章第三章 集中量集中量第一节第一节 算术平均数算术平均数第二节第二节 中位数中位数第三节第三节 众数众数第第四四节节 加权平均数加权平均数 几何平均数几何平均数 调和平均数调和平均数一、算一、算术术平均数的概念平均数的概念算术平均数算术平均数是一是一组组同同质质数据数据值值的的总总和除以数和除以数据据总总个数所得的商。个数所得的商。简称平均数、简称平均数、均数均数或均值或均值,用用 (读读X杠)表示。杠)表示。(3.1)第一节第一节 算术平均数算术平均数二、算术平均数的计算方法二、算术平均数的计算方法 1.原始数据原始数据计算法计算法例例1 某班某班选选八名同学参加年八名同学参加年
2、级级数学数学竞赛竞赛,成,成绩绩分分别为别为82,90,95,88,90,94,80,93。求其平均成求其平均成绩绩。解:把解:把n=8,X1=82,X8=93代入公式代入公式(3.1),得),得2.频数分布表计算法频数分布表计算法 (3.2)用下列公式计算:用下列公式计算:为第一组到第为第一组到第K组的组中值组的组中值各组组中值与频数乘积之和各组组中值与频数乘积之和为频数总和为频数总和例例2:P26例例3 某年某年级级四个班的学生人数分四个班的学生人数分别为别为50人,人,52人,人,48人,人,51人,期末数学考人,期末数学考试试各班的平均成各班的平均成绩绩分分别为别为90分,分,85分,
3、分,88分,分,92分,求年分,求年级级的的平均成平均成绩绩。解:由公式(解:由公式(3.2)得)得 例例4 某班某班50人外语期末考试成绩的次数分布人外语期末考试成绩的次数分布如下,求全班学生的平均成绩。如下,求全班学生的平均成绩。表表3-1 某班某班50人外语成绩次数分布表人外语成绩次数分布表解:将表中数据代入公式(解:将表中数据代入公式(3.2),得),得 说明:利用次数分布求得的算术平均数是说明:利用次数分布求得的算术平均数是一个近似值。因为我们先假设组内的数据是均一个近似值。因为我们先假设组内的数据是均匀分布的,利用各组中值分别代表各组数据,匀分布的,利用各组中值分别代表各组数据,这
4、显然与实际不符,把这一误差叫分组误差这显然与实际不符,把这一误差叫分组误差(P26)。三、算数平均数的应用及其优缺点三、算数平均数的应用及其优缺点1、算术平均数具备一个良好的集中量所应具备、算术平均数具备一个良好的集中量所应具备的一些条件的一些条件 (1)反应灵敏)反应灵敏 (2)严密确定)严密确定 (3)简明易懂,计算方便)简明易懂,计算方便 (4)适合代数运算)适合代数运算 (5)受抽样变动的影响较小)受抽样变动的影响较小 2、算术平均数的优点、算术平均数的优点 (1)只知一组观测值的总和及总频数即可求出;)只知一组观测值的总和及总频数即可求出;(2)用加权法可以求出几个平均数的总平均数;
5、)用加权法可以求出几个平均数的总平均数;(3)用样本数据推断总体集中量时,算术平均数最接近)用样本数据推断总体集中量时,算术平均数最接近总体集中量的真值,它是总体平均数的最好估计值;总体集中量的真值,它是总体平均数的最好估计值;(4)在计算方差、标准差、相关系数以及进行统计推断)在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。时,都要用到它。3、算术平均数的缺点、算术平均数的缺点 (1)易受两极端数值的影响;)易受两极端数值的影响;(2)有个别数据模糊不清时,无法计算)有个别数据模糊不清时,无法计算 综上知,算术平均数的适用条件是:一组数据综上知,算术平均数的适用条件是:一组数据中
6、所有数据都比较准确、可靠;无两极端数值的影中所有数据都比较准确、可靠;无两极端数值的影响。响。一、中位数的概念及适用条件一、中位数的概念及适用条件1.概念概念中位数是位于一组有序数据中间位置的量数。中位数是位于一组有序数据中间位置的量数。也称中数,用也称中数,用M Md d表示。它是将一组有序数据的个表示。它是将一组有序数据的个数分为相等两部分的那个数据,它可能是原始数数分为相等两部分的那个数据,它可能是原始数据中的一个,也可能是通过计算得到的一个数据中的一个,也可能是通过计算得到的一个数。第二第二节节 中位数中位数2.适用条件适用条件(1)当一当一组组数据有极端数据有极端值值出出现时现时。(
7、2)当一当一组组有序数据两端有个有序数据两端有个别别数据模糊不清数据模糊不清或分或分组资组资料有不确定料有不确定组组限限时时。(3)当需要快速估当需要快速估计计一一组组数据的代表数据的代表值时值时。二、中位数的计算方法二、中位数的计算方法1.原始数据计算法原始数据计算法 一组数据未分组,先排序,中位数取决于数一组数据未分组,先排序,中位数取决于数据的个数是奇数还是偶数。据的个数是奇数还是偶数。当数据的个数为奇数时,则以第(当数据的个数为奇数时,则以第(N+1)/2个位置上的数据作为中位数。当数据的个数为偶个位置上的数据作为中位数。当数据的个数为偶数时,则取居中间的两个数据的平均数为中位数。数时
8、,则取居中间的两个数据的平均数为中位数。即取第(即取第(N+1)/2处作为中位数的位置,其位置处作为中位数的位置,其位置左右两数据的平均值即为中位数。左右两数据的平均值即为中位数。例如求例如求80,93,90,81,85,88,92,84的中位数的中位数。先排序:先排序:80,81,84,85,88,90,92,93 再求再求(N+1)/2=4.5,这说这说明中位数的位明中位数的位置在第四个和第五个数的中置在第四个和第五个数的中间间,即,即 Md=(85+88)/2=86.5(二)(二)频数分布表计算法频数分布表计算法 对对分分组组数据常将数据常将n/2位置位置对应对应的数据看成中位数。的数据
9、看成中位数。计计算公式算公式为为:(3.3)(由小向大计算)(由小向大计算)中位数所在组的下限中位数所在组的下限总频数总频数小于中位数所在组下限的频数总和小于中位数所在组下限的频数总和频数分布表上的组距频数分布表上的组距中位数所在组的频数中位数所在组的频数(3.4)(由大向小计算)(由大向小计算)中位数所在组的上限中位数所在组的上限总频数总频数大于中位数所在组上限的频数总和大于中位数所在组上限的频数总和频数分布表上的组距频数分布表上的组距中位数所在组的频数中位数所在组的频数以表以表3-2为例,说明中位数的计算为例,说明中位数的计算.表表3-2 48个学生数学成绩频个学生数学成绩频数分布表数分布
10、表 2.百分位数的计算方法百分位数的计算方法 在频数分布表上用内插法计算百分位数,计算公式为在频数分布表上用内插法计算百分位数,计算公式为 三三、百分位数的概念及其百分位数的概念及其计算方法计算方法 1.百分位数的概念百分位数的概念 百分位数是位于依一定顺序排列的一组数据中某一百百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值一般用分位置的数值一般用Pp表示表示。如第如第70百分位数(百分位数(P70)就是依从小到大排列的一组)就是依从小到大排列的一组数据中小于此数值有数据中小于此数值有70%个频数,大于此数值有个频数,大于此数值有30%个个频数的那个数值频数的那个数值。中位数就是第
11、中位数就是第50百分位数。百分位数。(3.5)百分位数百分位数与百分位数相对应的比数与百分位数相对应的比数总频数总频数百分位数所在组的下限百分位数所在组的下限小于百分位数所在组下限的频数总和小于百分位数所在组下限的频数总和百分位数所在组的频数百分位数所在组的频数组距组距例如表例如表32资料的第资料的第30百分位数百分位数Pp=P30=74表表3-2 48个学生数学成绩频个学生数学成绩频数分布表数分布表第三节第三节 众众 数数 一、众数的概念(用一、众数的概念(用Mo表示)表示)1.理论众数:与频率分布曲线最高点相对应的横理论众数:与频率分布曲线最高点相对应的横坐标上的一点。坐标上的一点。2.粗
12、略众数:一组数据中频数出现最多的那个数。粗略众数:一组数据中频数出现最多的那个数。实际中,一般求理论众数的近似值,或直接寻找实际中,一般求理论众数的近似值,或直接寻找粗略众数。粗略众数。二、众数的计算方法二、众数的计算方法 1.用观察法直接寻找粗略众数用观察法直接寻找粗略众数 在一组原始数据中,频数出现最多的那个数值就在一组原始数据中,频数出现最多的那个数值就是众数。是众数。例如:例如:2、4、3、6、4、5、4 在频数分布表中,频数最多一组的组中值就是粗在频数分布表中,频数最多一组的组中值就是粗略众数。例如下表的数据的粗略众数为略众数。例如下表的数据的粗略众数为Mo=77.5。表表3.3 5
13、0个学生语文分数的频数分布表个学生语文分数的频数分布表 2.用公式求理论众数的近似值用公式求理论众数的近似值 (1)皮尔逊的经验法)皮尔逊的经验法 只有当频数分布呈正态或接近正态时,才能使用。只有当频数分布呈正态或接近正态时,才能使用。表表3.3 50个学生语文分数的频数分布表个学生语文分数的频数分布表 (1)金氏插补法)金氏插补法 当频数分布呈偏态,即众数所在组以上各组频数当频数分布呈偏态,即众数所在组以上各组频数总和相差较多时,可以使用金氏插补法。总和相差较多时,可以使用金氏插补法。众数所在组的下限众数所在组的下限大于众数所在组上限那个相邻组的频数大于众数所在组上限那个相邻组的频数小于众数
14、所在组下限那个相邻组的频数小于众数所在组下限那个相邻组的频数组距组距例如:下表数据例如:下表数据表表3.4 66个学生作文分数的频数分布表个学生作文分数的频数分布表 二、众数的应用及其优缺点二、众数的应用及其优缺点 众数虽然简明易懂,较少受两极端数值的影响,但它并众数虽然简明易懂,较少受两极端数值的影响,但它并不具备一个良好集中量数的基本条件。如极不准确、稳定,不具备一个良好集中量数的基本条件。如极不准确、稳定,反应不灵敏,不适合代数运算,受抽样的影响较大等。因此,反应不灵敏,不适合代数运算,受抽样的影响较大等。因此,在一般情况下,众数应用也不广泛,但在一些特殊情况下也在一般情况下,众数应用也
15、不广泛,但在一些特殊情况下也常有应用。常有应用。众数适用的情况众数适用的情况 (1)当需要快速而粗略地寻求一组数据的代表值时;)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;)当一组数据出现不同质的情况时;(3)当次数分布中有两极端的数目时;)当次数分布中有两极端的数目时;(4)当粗略估计次数分布的形态时。)当粗略估计次数分布的形态时。1.1.当次数分布呈正态时:当次数分布呈正态时:2.2.当次数分布呈正偏态时:当次数分布呈正偏态时:且且3.3.当次数分布呈负偏态时:当次数分布呈负偏态时:且且四、算术平均数、中位数、众数三者的关系四、算术平均数、中位数、众数三者
16、的关系补充:补充:平均数、中位数与众数的比较平均数、中位数与众数的比较1.从对数据次数分布形态的适用性来看从对数据次数分布形态的适用性来看v对称分布:平均数对称分布:平均数v非对称分布:中位数、众数非对称分布:中位数、众数2.从计算的精确性看从计算的精确性看v平均数最精确、中位数次之、众数最差平均数最精确、中位数次之、众数最差3.从对统计分析的适用性看从对统计分析的适用性看v平均数既可作描述统计量,又可作推论统计量。平均数既可作描述统计量,又可作推论统计量。中位数与众数常用作描述统计量。中位数与众数常用作描述统计量。第四节第四节 加权平均数、几何平均数、调和平均数加权平均数、几何平均数、调和平
17、均数一、一、加权平均数加权平均数l l 加权平均数的概念加权平均数的概念加权平均数的概念加权平均数的概念 加权平均数是不同比重数据(或平均数)的平均数,加权平均数是不同比重数据(或平均数)的平均数,加权平均数是不同比重数据(或平均数)的平均数,加权平均数是不同比重数据(或平均数)的平均数,用用用用 或或或或 表示。表示。表示。表示。l l 加权平均数的计算方法加权平均数的计算方法加权平均数的计算方法加权平均数的计算方法一一一一 式中为权数式中为权数式中为权数式中为权数l l 加权平均数的应用加权平均数的应用加权平均数的应用加权平均数的应用当测量所得的数据,其单位权重并不相等时,要用加当测量所得
18、的数据,其单位权重并不相等时,要用加当测量所得的数据,其单位权重并不相等时,要用加当测量所得的数据,其单位权重并不相等时,要用加权平均数来求平均数。权平均数来求平均数。权平均数来求平均数。权平均数来求平均数。例如,一个学生某门学科期中测验成绩为例如,一个学生某门学科期中测验成绩为72分,期末分,期末测验成绩为测验成绩为86分,而期中与期末分数之比为分,而期中与期末分数之比为4:6,求此门,求此门课程学期总平均成绩。课程学期总平均成绩。l l 加权平均数的计算方法加权平均数的计算方法加权平均数的计算方法加权平均数的计算方法二二二二 例如,小学三年级英语测验,甲班例如,小学三年级英语测验,甲班32
19、人平均分人平均分72.6,乙班乙班40人平均分为人平均分为80.2,丙班,丙班36人平均分为人平均分为75,求全年,求全年级英语测验总平均分数。级英语测验总平均分数。二二、几何平均数、几何平均数 (一)概念(一)概念 它是它是n个数个数值连值连乘乘积积的的n次方根,用符号次方根,用符号 表示表示,计算公式算公式为(二)应用时机(二)应用时机1、求一组等比或近似等比数据的平均数时。、求一组等比或近似等比数据的平均数时。2、一组数据中,有少数偏大或偏小的数据,数据分布、一组数据中,有少数偏大或偏小的数据,数据分布呈现偏态,求平均数时。呈现偏态,求平均数时。3、在教育上,主要应用几何平均数求平均发展
20、速度或、在教育上,主要应用几何平均数求平均发展速度或对某项目标进行预测估计。对某项目标进行预测估计。例例6 求求2,8,32,125,502的几何平均的几何平均数。数。解:由于解:由于这组这组数属于近似等比数列,数属于近似等比数列,直接直接利用公式利用公式,得,得=31.72例例7 已知某校四年中各年度的学生人数分已知某校四年中各年度的学生人数分别为别为上一年上一年的的1.12倍,倍,1.09倍,倍,1.08倍和倍和1.06倍,求每年的平均增倍,求每年的平均增长长率。率。解:先求出平均发展速度解:先求出平均发展速度 然后用公式:平均增长率然后用公式:平均增长率=平均发展速度平均发展速度-1,求
21、出年平均增长率。求出年平均增长率。平均增长率平均增长率=1.09-1=0.09故所求的年平均增长率为故所求的年平均增长率为9%。l只用首末只用首末项项求几何平均数求几何平均数设设a0,a1,an是是n个年度中各年度某种数量个年度中各年度某种数量值值,其中,其中a0是初期量,是初期量,an是末期量。是末期量。X1,X2,Xn为为各年度各年度发发展速度,即展速度,即 (3.6)例例8 某重点高中某重点高中1994-1999年招收新生人数如年招收新生人数如下表,求年平均增下表,求年平均增长长率。率。表表3-2 某高中招生人数统计表某高中招生人数统计表解:由于解:由于a0=594,an=700,n=5
22、,所以年平均所以年平均发展速度为发展速度为 故年平均增长率为(故年平均增长率为(10.3-1)*100%=3%例例9 某校某校办办工厂在工厂在1984年年创产值创产值10万元,万元,该该厂厂计计划以年平均增划以年平均增长长率率为为5%的速度的速度递递增,增,试试估估计计到到2004年年该该厂可厂可创产值创产值多少万元。多少万元。解:解:an=a0(1+平均增长率平均增长率)n =10(1+0.05)20=26.53(万元)(万元)l调和平均数的应用调和平均数的应用 调和平均数在心理与教育研究方面的应用,主要是用调和平均数在心理与教育研究方面的应用,主要是用以描述学习速度方面的问题。以描述学习速
23、度方面的问题。三三、调和调和平均数平均数l调和平均数的调和平均数的概念概念 调和平均数是一组数据倒数的算术平均数的倒数,亦称调和平均数是一组数据倒数的算术平均数的倒数,亦称倒数平均数。用倒数平均数。用 表示。表示。例如:一个学生阅读两页书,读前一页的速度是每小例如:一个学生阅读两页书,读前一页的速度是每小时时20页,读后一页的速度是每小时页,读后一页的速度是每小时40页,问平均每小时阅页,问平均每小时阅读速度是多少?读速度是多少?如果用算术平均数计算该生阅读速度,则每小时为如果用算术平均数计算该生阅读速度,则每小时为30页,即:页,即:但与实际情况不符,因为但与实际情况不符,因为读第一页用时读
24、第一页用时 (分),读第二页用时(分),读第二页用时 (分)(分)两页共用两页共用 (分)。(分)。如果用算术平均数每小时为如果用算术平均数每小时为30页的阅读速度,则页的阅读速度,则分钟应当阅读分钟应当阅读 (页),而实际只读了(页),而实际只读了2页。页。l调和平均数的调和平均数的计算公式计算公式 调和平均数是一组数据倒数的算术平均数的倒数,用调和平均数是一组数据倒数的算术平均数的倒数,用公式公式 可表示为:可表示为:利用此公式求出上例平均阅读速度,并验证其合理性。利用此公式求出上例平均阅读速度,并验证其合理性。即每小时读即每小时读 页,每分钟则读页,每分钟则读 页,页,分钟分钟就读就读
25、页,恰与事实相符。页,恰与事实相符。又如:又如:4个学生每小时解题数目分别为个学生每小时解题数目分别为3、4、6、8。问。问平均每小时解题速度如何?平均每小时解题速度如何?调和平均数可这样解释:调和平均数可这样解释:调和平均数,即四个人的平均解题速度(而算术平均数为调和平均数,即四个人的平均解题速度(而算术平均数为平均每人在每小时内的解体数目),首先要求出每人解平均每人在每小时内的解体数目),首先要求出每人解1道题所用的时间,即道题所用的时间,即 ,四个人平均每解,四个人平均每解1题所用时间为题所用时间为 ,再求其倒数,再求其倒数 就是平均每小时解题速度。就是平均每小时解题速度。1、某班、某班60名学生的外名学生的外语语成成绩绩列成次数分布如下,列成次数分布如下,试试求其算求其算术术平均数和中位数。平均数和中位数。作业作业2、某、某县县教教师师人数人数1990年年为为2000人,人,1994年年为为2800人,求其平均增人,求其平均增长长率;若照此速度率;若照此速度增增长长,试试估估计计2002年年该县该县的教的教师师人数人数为为多多少?少?
限制150内