教育与心理统计第三章集中量数.ppt
教育与心理统计课件第三章集中量数现在学习的是第1页,共43页第三章 集中量数 学习目标学习目标学习目标学习目标n n1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法n n2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合 学习内容学习内容学习内容学习内容n n众数众数众数众数n n中位数中位数中位数中位数n n平均数平均数n n 众数、中位数和平均数的比较众数、中位数和平均数的比较现在学习的是第2页,共43页数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)偏态和峰态偏态和峰态偏态和峰态偏态和峰态(形状)(形状)(形状)(形状)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)现在学习的是第3页,共43页数据分布特征的测度数据特征的测度数据特征的测度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数平均数平均数平均数平均数平均数平均数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态分布的形状分布的形状集中趋势集中趋势离散程度离散程度现在学习的是第4页,共43页集中趋势(central tendency)1.1.一一一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的测度值适用于高层次的测量数据,但高层次数据低层次数据的测度值适用于高层次的测量数据,但高层次数据低层次数据的测度值适用于高层次的测量数据,但高层次数据低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据的测度值并不适用于低层次的测量数据的测度值并不适用于低层次的测量数据的测度值并不适用于低层次的测量数据现在学习的是第5页,共43页数值型数据:平均数现在学习的是第6页,共43页简单平均数(simple mean)1定义:设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n 所有观测值的总和除以观测数值的个数所得的商数。2计算方法(1)原始数据的计算方法例:某小组10个学生的数学测验分数为:79、62、84、90、71、76、83、98、77、78,其算术平均数为:简单均值简单均值简单均值简单均值现在学习的是第7页,共43页(2)分组数据的计算方法(组中值计算法)分组区间分组区间分组区间分组区间次数(次数(次数(次数(f f)组中值(组中值(组中值(组中值(X Xc c)95-95-90-90-85-85-80-80-75-75-70-70-65-65-60-60-55-55-50-50-45-45-6 65 57 77 77 78 83 32 20 02 21 197979292878782827777727267676262575752524747N=48方法:把组中值看成每一分组的平均数方法:把组中值看成每一分组的平均数现在学习的是第8页,共43页现在学习的是第9页,共43页平均数的数学性质n n1.1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于零 2.2.各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小3、所有的观测值都加上常数C,则平均值也增加常数C4、所有观测值都乘以不等于0的常数C,则平均值也增大C倍5现在学习的是第10页,共43页n平均数的优缺点平均数的优缺点n n优点:1.:1.反映灵敏反映灵敏 2.计算严密计算严密 3.3.计算简单 4.4.简明易解 5.5.适合于进一步用代数方法演算 6.6.较少受抽样变动的影响较少受抽样变动的影响 n n缺点:1.易受极端数据的影响易受极端数据的影响 2.若出现模糊不清的数据时,无法计算平均数现在学习的是第11页,共43页分类数据:众数现在学习的是第12页,共43页众数(mode)1.1.次数分布中出现次数最多的变量值次数分布中出现次数最多的变量值2.2.求法:(1 1)原始数据观察法观察法(2 2)经验公式法(皮尔逊)经验公式法(皮尔逊)*归类数据中:众数指出现次数最多那组的组中值归类数据中:众数指出现次数最多那组的组中值归类数据中:众数指出现次数最多那组的组中值归类数据中:众数指出现次数最多那组的组中值 现在学习的是第13页,共43页众数(原始数据)n n无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 42现在学习的是第14页,共43页分类数据的众数(次数最多的那个组)不同品牌饮料的次数分布不同品牌饮料的次数分布不同品牌饮料的次数分布不同品牌饮料的次数分布 饮料品牌饮料品牌次数次数相对次相对次数数百分数百分数(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100解解解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个分分类类变变量量,不不同同类类型型的的饮饮料料就就是是变变量量值值 所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可可口口可乐可乐”这一品牌,即这一品牌,即 MMo o可口可乐可口可乐可口可乐可口可乐现在学习的是第15页,共43页顺序数据的众数解解解解:这这里里的的数数据据为为顺顺序序数数据据。变变量量为为“回回答类别答类别”甲甲城城市市中中对对表表基基础础教教育育质质量量表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不不满满意意”这一类别,即这一类别,即 MMo o不满意不满意不满意不满意甲城市家庭对基础教育质量评价的次数甲城市家庭对基础教育质量评价的次数甲城市家庭对基础教育质量评价的次数甲城市家庭对基础教育质量评价的次数分布分布分布分布回答类别回答类别甲城市甲城市次数次数 (户户)百分数百分数(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0现在学习的是第16页,共43页n众数的意义与应用众数的意义与应用n n (1)当需要快速而粗略地寻求一组数据的代表值时n n (2 2)当当一一组组数数据据出出现现不不同同质质的的情情况况时时,可可用用众众数数表示典型情况表示典型情况n n (3)当当次次数数分分布布中中有有两两极极端端的的数数目目,除除了了一一般般用用中数外,有时也用众数中数外,有时也用众数n n (4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标现在学习的是第17页,共43页顺序数据:中位数和分位数现在学习的是第18页,共43页中位数(median)1.1.按大小排序后处于中间位置上的值MMdndn50%50%2 2、各变量值与中位数的离差绝对值之和最小,即、各变量值与中位数的离差绝对值之和最小,即现在学习的是第19页,共43页数值型数据的中位数(奇数个数据的算例)n n【例例】9个家庭的人均月收入数据n n原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630n n排排排排 序序序序:750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000n n位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 7 8 9 6 7 8 9中位数中位数 1080现在学习的是第20页,共43页数值型数据的中位数(偶数个数据的算例)n n【例例】:10个家庭的人均月收入数据n n排排排排 序序序序:660660 750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000n n位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 6 7 8 9 10 7 8 9 10 现在学习的是第21页,共43页数值型数据的中位数(重复数据的算例)【例例例例】1 1、3 3、5 5、6 6、6 6、8 8、9 95.5 6 6.5 Mdn=5.755.5 6 6.5 Mdn=5.75【例例例例】1 1、3 3、5 5、6 6、6 6、6 6、8 8、9 95.5 6 6.55.5 6 6.5 5.83 6.17 5.83 6.17 Mdn=5.83 Mdn=5.83现在学习的是第22页,共43页顺序数据的中位数(例题分析)解:解:解:解:中位数的位置为中位数的位置为 300/2 300/2150150 从从累累计计次次数数看看,中中位位数数在在“一一般般”这这一一组组别中别中 中位数为中位数为 Mdn=一般一般甲城市家庭对住房状况评价的次数分布甲城市家庭对住房状况评价的次数分布甲城市家庭对住房状况评价的次数分布甲城市家庭对住房状况评价的次数分布回答类别回答类别甲城市甲城市次数次数 (户户)累计次数累计次数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300现在学习的是第23页,共43页分组数据的中位数其中:中数所在组的实下限 :中数所在组以下各组次数之和(以下累积次数):中数所在组的次数 :组距现在学习的是第24页,共43页例子:n n*中数组的寻找方法:由下往上找,第一个中数组的寻找方法:由下往上找,第一个大于大于N/2N/2的组。的组。n n解:解:区组fF76-72-68-64-60-81225107625442177现在学习的是第25页,共43页n n中数的优缺点与应用n n (1)当一组观测结果中出现两个极端数目时n n (2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值n n (3)当需要快速估计一组数据的代表值时,也常用中数现在学习的是第26页,共43页加权平均数(weighted mean)定义:几个作用比重不同的算术平均数的平均数计算公式:例子:小学三年级举行英语测验。甲班32名学生的平均分为72.6,乙班40名学生平均分为80.2,丙班36名学生的平均分为75分。求全年级英语测验的总平均分数。现在学习的是第27页,共43页分组数据:设一组数据为:x1,x2,xk各组的组中值为:XC1,XC2,XCk 相应的频数为:f1,f2,fk现在学习的是第28页,共43页已改至此!已改至此!某电脑公司销售量数据分组表某电脑公司销售量数据分组表某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组组中值组中值(XC)次数次数(fi)Xc fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计合计12022200加权平均数加权平均数现在学习的是第29页,共43页调和平均数(harmonic mean)1.1.均值的另一种表现形式,用来描述学习速均值的另一种表现形式,用来描述学习速度方面的问题。度方面的问题。2.2.易受极端值的影响易受极端值的影响3.3.计算公式为原来只是计算原来只是计算时使用了不同时使用了不同的数据!的数据!其中,N:数据个数 X:具体的变量值现在学习的是第30页,共43页n n例:例:有一学生有一学生15分钟学会生词分钟学会生词30个,后个,后10分钟学会生词也是分钟学会生词也是30个,问该生每分个,问该生每分钟平均学会多少?钟平均学会多少?解:由题可得:题可得:答:答:现在学习的是第31页,共43页某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)Mi成交额成交额(元元)Mi fi成交量成交量(公斤公斤)fi甲甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合计合计3690048000【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种种蔬蔬菜菜该该日日的平均批发价格的平均批发价格解:据题意得,现在学习的是第32页,共43页几何平均数(geometric mean)1.1.n n 个变量值乘积的个变量值乘积的个变量值乘积的个变量值乘积的 n n 次方根次方根次方根次方根2.2.适用于对比率数据的平均适用于对比率数据的平均适用于对比率数据的平均适用于对比率数据的平均3.3.主要用于计算平均增长率主要用于计算平均增长率主要用于计算平均增长率主要用于计算平均增长率4.4.计算公式为计算公式为计算公式为计算公式为5.5.可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形其中,其中,n:数据的个数:数据的个数 X:变化的比例数据:变化的比例数据现在学习的是第33页,共43页n n几何平均数的应用n n (1)直接应用于基本公式计算几何平均数n n (2)应用于几何平均数的变式计算n n 学习方面的进步率n n 学生或人口增加率的估计n n 教育经费增加率现在学习的是第34页,共43页n n 【例例】某水泥生产企业19991999年的水泥产量为100100万万吨吨,2000年与19991999年年相相比比增增长长率率为为9%,20012001年年与与2000年相比增长率为16%16%,20022002年年与与2001年相比增长率为20%20%。求各年的年平均增长率。年平均增长率114.91%-1=14.91%现在学习的是第35页,共43页n n 【例例】一位投资者购持有一种股票,在20002000、20012001、2002和2003年收益率分别为4.5%4.5%、2.1%2.1%、25.5%、1.9%1.9%。计算该投资者在这四年内的平均收益率 比较:比较:比较:比较:算术平均:算术平均:算术平均:算术平均:几何平均:几何平均:现在学习的是第36页,共43页众数、中位数和平均数的比较现在学习的是第37页,共43页众数、中位数和平均数的关系负偏分布负偏分布负偏分布负偏分布负偏分布负偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数正偏分布正偏分布正偏分布正偏分布正偏分布正偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值现在学习的是第38页,共43页众数、中位数、平均数的特点和应用1.1.众数uu不受极端值影响uu具有不惟一性具有不惟一性uu数据分布偏斜程度较大时应用2.2.中位数uu不受极端值影响不受极端值影响uu数据分布偏斜程度较大时应用3.3.平均数平均数uu易受极端值影响uu计算方便,反应灵敏uu数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用现在学习的是第39页,共43页作业:作业:n n1 1、对对于于下下列列实实验验数数据据:1 1,100,11,9 9,5,6,9,9,7,1111,9 9,描描述述其其集集中中趋趋势势用用_最最最最为适宜,其值是为适宜,其值是为适宜,其值是为适宜,其值是_。n n2、已已知知5050个个数数据据XiXi(i=1i=1,2 2,.50.50)的的平平均均数数为为100100。若若Yi=Xi+10Yi=Xi+10,则则YiYi的的平平均均数数为为_;若若Zi=10XiZi=10Xi,则则ZiZi的的平平均数等于均数等于_。n n3 3、现有一列数据:4、4、5 5、3 3、5、5 5、2,这列数据的平均数、众数和全距依次是()A.4,4,2 B.4,5,3 C.5,4,4 D.5,5,1现在学习的是第40页,共43页4、求下列次数分布的平均数、中数、众数。、求下列次数分布的平均数、中数、众数。现在学习的是第41页,共43页5 5、求下列四个年级的总平均成绩、求下列四个年级的总平均成绩 6 6、下面是某学校几年来毕业生的人数,问平均增加率是多少?并、下面是某学校几年来毕业生的人数,问平均增加率是多少?并估计估计10年后的毕业人数有多少?年后的毕业人数有多少?7 7、有一组数据如下,计算它们的中数:、有一组数据如下,计算它们的中数:、有一组数据如下,计算它们的中数:、有一组数据如下,计算它们的中数:1212,1313,1313,1414,1515,1515,1515,1515,1515,1616现在学习的是第42页,共43页现在学习的是第43页,共43页