第三章-集中量-学前.ppt
集中量用来表现数据资料的集中量用来表现数据资料的典型水平或集中趋势。典型水平或集中趋势。常用的集中量包括算术平均常用的集中量包括算术平均数、中位数、众数、加权平均数数、中位数、众数、加权平均数等等。等等。数据的分布特征可以从三个方面进行侧数据的分布特征可以从三个方面进行侧度和描述度和描述:集中趋势集中趋势:数据分布中大量数据向某方向集中的程数据分布中大量数据向某方向集中的程度度;离中趋势:离中趋势:数据彼此分散的程度,反映数据远离其数据彼此分散的程度,反映数据远离其中心值的趋势;中心值的趋势;偏态和峰度:偏态和峰度:反映数据分布的形状反映数据分布的形状一、算术平均数算术平均数一般简称为平均数或均数、算术平均数一般简称为平均数或均数、均值。均值。主要适用于定距数据和定比数据。主要适用于定距数据和定比数据。一般用一般用,或者用(,或者用(X X杠)表示。杠)表示。算术平均数是最常用的集中量。算术平均数是最常用的集中量。1算术平均数的计算公式原始数据计算公式(3)由上述公式可得算术平均数的几个重要性质由上述公式可得算术平均数的几个重要性质离均差之和为零练习题1010个观测数据,计算算术平均数,个观测数据,计算算术平均数,再计算离均差再计算离均差25 27 28 27 25 29 30 34 32 33 次数分布表计算公式(3)表3-1 52名学生数学成绩平均数计算表成绩成绩组中值组中值Xc频数频数f fFXc计计 算算959597.52 2195909092.52 2185858587.53 3262.5808052.55 5262.5757577.58 8620707072.51111797.5656567.59 9607.5606062.55 5312.5555557.54 4230505052.52 2105454517.51 117.5合计合计523595.02、算术平均数的意义算术平均数是应用最普遍的一种集中量。算术平均数是应用最普遍的一种集中量。它是它是“真值真值”(true score)的最佳估计值。)的最佳估计值。真值是反映某种现象的真实水平的分数。真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值由于测量过程中的各种偶然因素的影响,真值往往很难得到。往往很难得到。在实际测量中,往往采用在实际测量中,往往采用“多次测量,取多次测量,取平均数平均数”的方法,用平均数去估计真值。的方法,用平均数去估计真值。3、算术平均数的优缺点 算术平均数具备一个良好的集中量所应算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、严密确定、简具备的一些特点:反应灵敏、严密确定、简明易懂、适合代数运算等等,因此是一个最明易懂、适合代数运算等等,因此是一个最常用的集中量。常用的集中量。主要不足:容易受两极端数值的影响;主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。一组数据中有模糊不清的数值时无法计算。4、计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示同质性原则:算术平均数只能用于表示同类数据的集中趋势。同类数据的集中趋势。平均数与个体数值相结合的原则:在解平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个释个体特征时,既要看平均数,也要结合个体的数据。体的数据。平均数与标准差、方差相结合原则:描平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分述一组数据时既要分析其集中趋势,也要分析离散程度。析离散程度。二、中位数中位数(中位数(median)又称为中数,是按)又称为中数,是按顺序排列的一组数据中位于中间位置的顺序排列的一组数据中位于中间位置的数。数。中位数是常用集中量的一种。中位数是常用集中量的一种。一般用一般用Md表示。它主要用于测度定表示。它主要用于测度定序数据的集中趋势。序数据的集中趋势。1、中位数的计算方法原始数据计算法首先将一组数据按顺序排列首先将一组数据按顺序排列 (2)75,48,80,88,84,90,100,95 例(1)42,32,46,54,49,Md=46 Md=(84+88)/2=86例 题计算中位数:例1:7、8、9、4、6、5、10、12、11例2:8、9、4、6、5、10、12、11次数分布表计算法由次数分布表计算中位数由次数分布表计算中位数需要用到累积次数分布表。需要用到累积次数分布表。当表中数据的累积方向不当表中数据的累积方向不同时,计算公式也不同。同时,计算公式也不同。由小到大累积频数计算公式公式中公式中:L:Lmdmd为中位数所在组的下限为中位数所在组的下限 n n1 1为中位数所在组下限以下的累积频数为中位数所在组下限以下的累积频数 n n为数据总和为数据总和 f fMdMd为中位数所在组的频数为中位数所在组的频数 i i为组距为组距(33)由大到小累积频数计算公式公式中公式中:U Umdmd为中位数所在组的上限为中位数所在组的上限 n n2 2为中位数所在组上限以上的累积频数为中位数所在组上限以上的累积频数 n n为数据总和为数据总和 f fMdMd为中位数所在组的频数为中位数所在组的频数 i i为组距为组距(34)计算步骤(由小到大):计算步骤(由小到大):求N/2确定中位数所在组。由小到大累计次数,直至略大于N/2为止,这组就是中位数所在组。确定中位数组有多少个频数,就能使由大到小的累计次数等于N/2。计算中位数所在组所取频数的距离。将结果与中位数所在组的下限求合,即中位数。表3-3 52名学生数学成绩中位数计算表成绩成绩频数频数f f累积频数累积频数计计 算算95952 25290902 25085853 34880805 54575758 840707011113265659 92160605 51255554 4750502 2345451 11合计合计52组别组别f f向上累加次数向上累加次数65 65 2 211811860 60 4 411611655 55 6 611211250 50 121210610645 45 2525949440 40 3434696935 35 2020353530 30 1111151525 44合计118百分位数百分位数的概念百分位数的概念 百分位数是位于依一定顺序排列的一百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值,一般用组数据中某一百分位置的数值,一般用 表示。表示。百分位数(频数分布表上)的计算方法公式中公式中:L Lp p为百分位数所在组的下限为百分位数所在组的下限 n n为百分位数所在组下限以下的累积频数为百分位数所在组下限以下的累积频数 p p为百分数为百分数 N N为数据总和为数据总和 f fp p为百分位数所在组的频数为百分位数所在组的频数 i i为组距为组距(35)中位数的特点及应用中位数是根据全部数据的个数来确定其位置的,中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:般用于下列情况:一组数据中有极端数据时;一组数据中有极端数据时;一组数据中有个别数据不确切、不清楚时;一组数据中有个别数据不确切、不清楚时;资料属于等级性质时。资料属于等级性质时。三众数众数(众数(mode)用)用MoMo表示,有两种定义:表示,有两种定义:理论众数理论众数是指与频数分布曲线最高点相是指与频数分布曲线最高点相对应的横坐标上的一点;对应的横坐标上的一点;粗略众数粗略众数是一组数据中出现次数最多的是一组数据中出现次数最多的那个数。那个数。众数也是一种集中量,也可用来表示一众数也是一种集中量,也可用来表示一组数据的集中趋势。组数据的集中趋势。众数的计算方法(1 1)观察法寻找粗略众数)观察法寻找粗略众数 未分组数据中出现次数最多的数即为众数。未分组数据中出现次数最多的数即为众数。次数分布表中,频数最多那一组数据的组中次数分布表中,频数最多那一组数据的组中值,即为众数。值,即为众数。(2 2)公式法计算理论众数的近似值)公式法计算理论众数的近似值 一般在心理与教育统计中常用的公式有皮尔一般在心理与教育统计中常用的公式有皮尔逊的经验公式和金氏插补法公式。逊的经验公式和金氏插补法公式。皮尔逊经验公式金氏插补法(36)(37)皮尔逊经验公式只有当数据分布呈正态或接皮尔逊经验公式只有当数据分布呈正态或接近正态时才能使用。当数据分布呈偏态时,一般近正态时才能使用。当数据分布呈偏态时,一般用金氏插补法计算众数。用金氏插补法计算众数。众数的优缺点众数的概念简单易懂,但众数的概念简单易懂,但比较粗略,不能灵敏地反映一比较粗略,不能灵敏地反映一组数据的变化,而且不适合进组数据的变化,而且不适合进一步代数运算。一步代数运算。4算术平均数、中位数、众数三者的关系在正态分布中:在正态分布中:在正偏态分布中在正偏态分布中:在负偏态分布中:在负偏态分布中:四、其它集中量除了算术平均数、中位数除了算术平均数、中位数和众数以外,在应用中还有一和众数以外,在应用中还有一些其它集中量。这些统计指标些其它集中量。这些统计指标可以从其它角度描述一组数据可以从其它角度描述一组数据的集中趋势。的集中趋势。一、加权平均数Wi称为权数,就是各变量在构成总体中的相对称为权数,就是各变量在构成总体中的相对重要性重要性适合解决各个平均数求整体总平均数之类的问题适合解决各个平均数求整体总平均数之类的问题。一个学生某门学科考试成绩为一个学生某门学科考试成绩为7070分分,平时成平时成绩为绩为8585分分,而考试成绩与平时成绩之比为而考试成绩与平时成绩之比为2:12:1那么那么学生最终成绩是多少学生最终成绩是多少?某专业有甲乙两个班级某专业有甲乙两个班级,甲班有甲班有3737个人个人,乙班乙班有有3636人人.在考试中在考试中,甲班平均成绩为甲班平均成绩为80,80,乙班平乙班平均成绩为均成绩为85.85.求整个专业的平均成绩是多少求整个专业的平均成绩是多少?几何平均数几何平均数(几何平均数(geometric meangeometric mean)是)是n n个数个数值连乘积的值连乘积的n n次方根,用或表示。计次方根,用或表示。计算公式为算公式为(310)注意:几何平均数计算的是平均的变化情况,如注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去果要计算平均增长率,需要从几何平均数中减去基数基数1例:以下是10位学生视反应时的数据:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0,15.6,18.0。问这10名被试视反应时的平均值是多少?例例 在一项有关阅读在一项有关阅读能力的实验中能力的实验中,阅读的遍数阅读的遍数与每遍的理解程度见下表与每遍的理解程度见下表,问被试阅读能力的平均进问被试阅读能力的平均进步率是多少步率是多少?平均增加比率平均增加比率又是多少又是多少?阅读的遍数阅读的遍数理解程度理解程度(%)(%)140252365475586697例 一种股票一种股票,1996-1999,1996-1999年的收益率分别为年的收益率分别为4.5%,4.5%,2.0%,3.5%,5.4%,2.0%,3.5%,5.4%,计算四年内的平均年收益率。计算四年内的平均年收益率。解:平均年收益率为平均年收益率为GM-1=103.84%-100%=3.84%3.调和平均数调和平均数是一组数据倒数的算术平均数的倒数,也就是倒数平均数。在教育方面主要用来求学习速度(3.113.11)再见!再见!