集中趋势和离中趋势的度量.ppt
集中趋势和离中趋势的度量现在学习的是第1页,共53页 集中趋势集中趋势是指一组数据向某一中心值靠拢的倾是指一组数据向某一中心值靠拢的倾向,测度集中趋势即要寻找数据一般水平的代表值向,测度集中趋势即要寻找数据一般水平的代表值或中心值。或中心值。第一节 集中趋势指标概述 集中趋势集中趋势指标即统计平均数,是反映若指标即统计平均数,是反映若干统计数据一般水平或集中趋势的综合指标。干统计数据一般水平或集中趋势的综合指标。它可能表现为总体内各单位某一数量标志的它可能表现为总体内各单位某一数量标志的一般水平,也可能表现为总体在某一段时期一般水平,也可能表现为总体在某一段时期内的数量一般水平。内的数量一般水平。现在学习的是第2页,共53页 统计平均数的特点统计平均数的特点统计平均数是一个代表值统计平均数是一个代表值统计平均数是一个代表值统计平均数是一个代表值统计平均数是一个抽象值统计平均数是一个抽象值统计平均数是一个抽象值统计平均数是一个抽象值 第一节 集中趋势指标概述数据集中区数据集中区变量变量x x现在学习的是第3页,共53页统计平均数的作用 两个同类现象而范围不同的总体一般水平。两个同类现象而范围不同的总体一般水平。两个同类现象而范围不同的总体一般水平。两个同类现象而范围不同的总体一般水平。将同一总体、同一性质的平均数按时间先后顺序将同一总体、同一性质的平均数按时间先后顺序将同一总体、同一性质的平均数按时间先后顺序将同一总体、同一性质的平均数按时间先后顺序排列起来可以反映现象发展变化的过程、趋势、规律排列起来可以反映现象发展变化的过程、趋势、规律排列起来可以反映现象发展变化的过程、趋势、规律排列起来可以反映现象发展变化的过程、趋势、规律性。性。性。性。和统计分组结合,揭示现象之间的依存关系。和统计分组结合,揭示现象之间的依存关系。和统计分组结合,揭示现象之间的依存关系。和统计分组结合,揭示现象之间的依存关系。第一节 集中趋势指标概述现在学习的是第4页,共53页类型 第一节 集中趋势指标概述动态平均数动态平均数静态平均数静态平均数统计平均数统计平均数数值平均数数值平均数位置平均数位置平均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数众数众数分位数分位数现在学习的是第5页,共53页一、算术平均数一、算术平均数基本公式基本公式 由于掌握的资料不同,在实际计算时又由于掌握的资料不同,在实际计算时又可以分别采用简单算术平均数和加权算术可以分别采用简单算术平均数和加权算术平均数的方法。平均数的方法。第二节数值平均数现在学习的是第6页,共53页简单算术平均数简单算术平均数资料未分组时可以采用简单算术平均资料未分组时可以采用简单算术平均数的方法。数的方法。第二节数值平均数现在学习的是第7页,共53页 和号和号第二节 数值平均数算术平均数算术平均数变量值的个数变量值的个数变量值变量值现在学习的是第8页,共53页(三)加权算术平均数三)加权算术平均数 当资料已经分组则采用加权算术平均数的当资料已经分组则采用加权算术平均数的方法方法 第二节 数值平均数现在学习的是第9页,共53页(四)需要注意的几个问题(四)需要注意的几个问题(四)需要注意的几个问题(四)需要注意的几个问题加权算术平均数不仅受各个变量值大小的加权算术平均数不仅受各个变量值大小的加权算术平均数不仅受各个变量值大小的加权算术平均数不仅受各个变量值大小的影响,而且受权数大小的影响。影响,而且受权数大小的影响。影响,而且受权数大小的影响。影响,而且受权数大小的影响。权数可以用比重形式。权数可以用比重形式。权数可以用比重形式。权数可以用比重形式。第二节 数值平均数现在学习的是第10页,共53页(四)需要注意的几个问题(四)需要注意的几个问题(四)需要注意的几个问题(四)需要注意的几个问题 简单算术平均数是加权算术平均数的特简单算术平均数是加权算术平均数的特简单算术平均数是加权算术平均数的特简单算术平均数是加权算术平均数的特例。例。例。例。第二节 数值平均数现在学习的是第11页,共53页(五)算术平均数的数学性质(五)算术平均数的数学性质(五)算术平均数的数学性质(五)算术平均数的数学性质 各变量值与算术平均数的离差之和为各变量值与算术平均数的离差之和为各变量值与算术平均数的离差之和为各变量值与算术平均数的离差之和为零。这一性质说明算术平均数是一组数零。这一性质说明算术平均数是一组数零。这一性质说明算术平均数是一组数零。这一性质说明算术平均数是一组数据的重心。据的重心。据的重心。据的重心。第二节 数值平均数现在学习的是第12页,共53页(五)算术平均数的数学性质(五)算术平均数的数学性质 各变量值与算术平均数的离差平方和为各变量值与算术平均数的离差平方和为最小。最小。第二节 数值平均数现在学习的是第13页,共53页二、调和平均数二、调和平均数 又叫倒数平均数,即各变量值的倒数的算术平均数又叫倒数平均数,即各变量值的倒数的算术平均数的倒数。调和平均数用的倒数。调和平均数用 表示。表示。第二节 数值平均数现在学习的是第14页,共53页调和平均数调和平均数 上述公式是加权调和平均数的公式。若各变量值的权上述公式是加权调和平均数的公式。若各变量值的权上述公式是加权调和平均数的公式。若各变量值的权上述公式是加权调和平均数的公式。若各变量值的权数都相等时,加权调和平均数简化为简单调和平均数。数都相等时,加权调和平均数简化为简单调和平均数。数都相等时,加权调和平均数简化为简单调和平均数。数都相等时,加权调和平均数简化为简单调和平均数。即即即即:第二节 数值平均数现在学习的是第15页,共53页 调和平均数公式中的权数调和平均数公式中的权数调和平均数公式中的权数调和平均数公式中的权数 是是是是各组的标志总量(算术平均数的分子数据)。各组的标志总量(算术平均数的分子数据)。各组的标志总量(算术平均数的分子数据)。各组的标志总量(算术平均数的分子数据)。当已知各组的变量值和算术平均数的分当已知各组的变量值和算术平均数的分当已知各组的变量值和算术平均数的分当已知各组的变量值和算术平均数的分 子数据,子数据,子数据,子数据,而缺乏分母数据而缺乏分母数据而缺乏分母数据而缺乏分母数据 时,可以采用调和平均数时,可以采用调和平均数时,可以采用调和平均数时,可以采用调和平均数的形式来计算。的形式来计算。的形式来计算。的形式来计算。调和平均数调和平均数 第二节 数值平均数现在学习的是第16页,共53页例:某车间各班组工人劳动生产率和实际产量资料如下:班组劳动生产率实际产量(件工时)(件)一101000二122400三154500四206000五306000合计19900要求:计算五个班组工人的平均劳动生产率。xmmx1002003003002001100解:平均劳动生产率为:(总工时)现在学习的是第17页,共53页几何平均数几何平均数几何平均数是几何平均数是几何平均数是几何平均数是n个变量值连乘积的个变量值连乘积的个变量值连乘积的个变量值连乘积的n n次方根,适应于计算次方根,适应于计算次方根,适应于计算次方根,适应于计算平均比率和平均速度。根据掌握的资料不同,有简单几何平均比率和平均速度。根据掌握的资料不同,有简单几何平均比率和平均速度。根据掌握的资料不同,有简单几何平均比率和平均速度。根据掌握的资料不同,有简单几何平均数和加权几何平均数两种。平均数和加权几何平均数两种。平均数和加权几何平均数两种。平均数和加权几何平均数两种。简单几何平均数适应于已知每个比率或每个速度求平均数的简单几何平均数适应于已知每个比率或每个速度求平均数的简单几何平均数适应于已知每个比率或每个速度求平均数的简单几何平均数适应于已知每个比率或每个速度求平均数的情况。情况。情况。情况。第二节 数值平均数现在学习的是第18页,共53页几何平均数几何平均数几何平均数几何平均数 加权几何平均数适应于比率或速度已分组的加权几何平均数适应于比率或速度已分组的加权几何平均数适应于比率或速度已分组的加权几何平均数适应于比率或速度已分组的情况。情况。情况。情况。第二节 数值平均数现在学习的是第19页,共53页1、2001年某月份甲、乙两农贸市场某农产品年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:价格和成交量、成交额资料如下:品种品种价格价格甲市场成交额甲市场成交额(万元)(万元)乙市场成交量乙市场成交量(万斤)(万斤)甲甲乙乙丙丙1.21.41.51.22.81.5211合计合计-5.54试问哪一个市场农产品的平均价格高?试问哪一个市场农产品的平均价格高?并说明原因。并说明原因。现在学习的是第20页,共53页2、已知某企业有如下资料:、已知某企业有如下资料:按计划完成百分比分组按计划完成百分比分组(%)实际产值(万元)实际产值(万元)809090100100110110120986105718601846n计算该企业平均计划完成百分比。计算该企业平均计划完成百分比。现在学习的是第21页,共53页n某厂生产某种机床配件,要经过三道工序,现生某厂生产某种机床配件,要经过三道工序,现生产一批该产品在各道生产工序上的合格率分别为产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计。根据资料计算三道生产工序的平均合格率。算三道生产工序的平均合格率。现在学习的是第22页,共53页 一、众数一、众数 第三节 位置平均数 众数众数是一组数据中是一组数据中是一组数据中是一组数据中出现次数最多的标志值。出现次数最多的标志值。出现次数最多的标志值。出现次数最多的标志值。一、众数现在学习的是第23页,共53页 众数不仅适应于变量数列,也适应于品众数不仅适应于变量数列,也适应于品众数不仅适应于变量数列,也适应于品众数不仅适应于变量数列,也适应于品质数列。如销售量最多的服装款式或色彩,质数列。如销售量最多的服装款式或色彩,质数列。如销售量最多的服装款式或色彩,质数列。如销售量最多的服装款式或色彩,即通常所讲的即通常所讲的即通常所讲的即通常所讲的“流行款式流行款式流行款式流行款式”,就属于这种意,就属于这种意,就属于这种意,就属于这种意义上的众数。义上的众数。义上的众数。义上的众数。第三节 位置平均数现在学习的是第24页,共53页众数的众数的确确定定如果各标志值分布很均匀,无明显的变化,如果各标志值分布很均匀,无明显的变化,则数列无众数。则数列无众数。2.如果是单项式数列或未分组的数据,出如果是单项式数列或未分组的数据,出现次数最多的那一个标志值就是众数。现次数最多的那一个标志值就是众数。3.由组距式数列确定众数,先根据次数的多少由组距式数列确定众数,先根据次数的多少确定众数组,然后可按下述公式之一计算:确定众数组,然后可按下述公式之一计算:第三节 位置平均数现在学习的是第25页,共53页计算公式计算公式 第三节 位置平均数现在学习的是第26页,共53页二、中位数二、中位数(MedianMedian)第三节 位置平均数 中位数是指将总体各中位数是指将总体各中位数是指将总体各中位数是指将总体各单位标志值按照大小顺序单位标志值按照大小顺序单位标志值按照大小顺序单位标志值按照大小顺序排列后,处于中间位置的排列后,处于中间位置的排列后,处于中间位置的排列后,处于中间位置的那个标志值,用那个标志值,用那个标志值,用那个标志值,用M M M Me e e e表示。表示。现在学习的是第27页,共53页 第三节 位置平均数 中位数将变量数列分为相等的两部分,中位数将变量数列分为相等的两部分,中位数将变量数列分为相等的两部分,中位数将变量数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志一部分的标志值小于中位数,另一部分的标志一部分的标志值小于中位数,另一部分的标志一部分的标志值小于中位数,另一部分的标志值大于中位数。值大于中位数。值大于中位数。值大于中位数。如何确定中位数?如何确定中位数?1.1.由未分组的数据确定中位数由未分组的数据确定中位数2.2.由单项数列确定中位数由单项数列确定中位数3.3.由组距数列确定中位数由组距数列确定中位数现在学习的是第28页,共53页1.1.由未分组的数据确定中位数由未分组的数据确定中位数 根据未分组的数据确定中位数时,首先将总体各单位根据未分组的数据确定中位数时,首先将总体各单位的标志值资料按大小顺序排列,然后按照的标志值资料按大小顺序排列,然后按照 (n n表示资料的项数)来确定中位数的位次,再根据表示资料的项数)来确定中位数的位次,再根据中位数的位次找出对应的标志值即可。中位数的位次找出对应的标志值即可。第三节 位置平均数现在学习的是第29页,共53页2.2.由单项数列确定中位数由单项数列确定中位数 由单项数列确定中位数时,先向上或向下累由单项数列确定中位数时,先向上或向下累计次数,然后按下式确定中位数的位次:计次数,然后按下式确定中位数的位次:根据中位数的位次,将累计次数刚根据中位数的位次,将累计次数刚好超过中位数位次好超过中位数位次 组确定为中位数组,组确定为中位数组,该组所对应的标志值即为中位数。该组所对应的标志值即为中位数。第三节 位置平均数现在学习的是第30页,共53页3.由组距数列确定中位数 由组距数列确定中位数,先向上或向下累计频由组距数列确定中位数,先向上或向下累计频数,然后按确定中位数的位次,再用公式计算中位数,然后按确定中位数的位次,再用公式计算中位数的近似值。数的近似值。方法同单项方法同单项数列数列 第三节 位置平均数现在学习的是第31页,共53页计算公式计算公式 第三节 位置平均数现在学习的是第32页,共53页 一一、离中趋势:含义、离中趋势:含义 离中趋势是指一组数据中各数据值离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)以不同程度的距离偏离其中心(平均数)的趋势,又称标志变动度。的趋势,又称标志变动度。第四节 离中趋势的度量 离中趋势指标是用来综合反映数据的离中程度的一类指标。n极差n分位差n平均差n方差n标准差n离散系数现在学习的是第33页,共53页极差(RangeRange)极差最大变量值极差最大变量值 -最小变量值最小变量值组距数列极差可近似值为:组距数列极差可近似值为:极差极差 最大组的上限最大组的上限 -最小组的下限最小组的下限 第四节 离中趋势的度量现在学习的是第34页,共53页优点优点计算简便计算简便 含义清楚含义清楚 缺点缺点 没有考虑到中间变量值的变动情况,测定离中趋势时没有考虑到中间变量值的变动情况,测定离中趋势时不准确。不准确。第四节 离中趋势的度量现在学习的是第35页,共53页分位差 是从一组数据中剔除了一部分极端值之后重新计是从一组数据中剔除了一部分极端值之后重新计算的类似于极差的指标。常用的有四分位差、八分位算的类似于极差的指标。常用的有四分位差、八分位差和十分位差等差和十分位差等 四分位差是第三个四分位数减去第一个四四分位差是第三个四分位数减去第一个四分位数的差的一半分位数的差的一半 第四节 离中趋势的度量现在学习的是第36页,共53页平均差 平均差(平均差(Mean deviationMean deviation)是数据组中各数据)是数据组中各数据值与其算术平均数离差绝对值的算术平均数,常用值与其算术平均数离差绝对值的算术平均数,常用符号符号“M.DM.D”表示。表示。简单平均式简单平均式加权平均式加权平均式 由于平均差是根据数列中所有数值计算出来的,受极端值影响较小,所以对整个统计数列的离中趋势有较充分的代表性。但是在计算过程中,数学处理方法不够理想,所以,其应用受限 第四节 离中趋势的度量现在学习的是第37页,共53页方差VarianceVariance与标准差Standard deviationStandard deviation 方差是数据组中各数据值与其算术平均数方差是数据组中各数据值与其算术平均数离差平方的算术平均数。方差的平方根就是标离差平方的算术平均数。方差的平方根就是标准差。准差。简单平均式加权平均式标准差是应用最广泛的离中趋势指标标准差是应用最广泛的离中趋势指标 第四节 离中趋势的度量现在学习的是第38页,共53页离散系数(Coefficient of variation)上述三个指标带有计量单位,而且其离中趋上述三个指标带有计量单位,而且其离中趋势大小与变量平均水平的高低有关。势大小与变量平均水平的高低有关。要比较数据平均水平不同的两组数据的离要比较数据平均水平不同的两组数据的离中程度的大小,就有必要计算它们的相对离中中程度的大小,就有必要计算它们的相对离中程度指标,即离散系数。程度指标,即离散系数。常用的离散系数指标是标准常用的离散系数指标是标准差差系数。系数。第四节 离中趋势的度量现在学习的是第39页,共53页 标准差系数是将一组数据的标准差与其算术标准差系数是将一组数据的标准差与其算术平均数对比的结果。平均数对比的结果。标准差系数标准差系数 第四节 离中趋势的度量现在学习的是第40页,共53页例例已已知知甲甲乙乙两两个个水水稻稻品品种种分分别别在在五五块块田田里里试试种种,资资料料如如下下,试试计计算算有有关关指指标标,比比较较甲甲乙乙两两个个水水稻稻品品种种的的收收获获率率哪哪一一个个具具有有较较强强的的稳稳定定性性,可可以推广以推广.甲 乙平均亩产量 面积 平均亩产 面积 (千克/亩)(亩)(千克/亩)(亩)459 2.2 439 2.3 452 2.1 445 2.0 440 2.0 450 2.5 453 1.9 461 1.9 461 1.8 478 2.3 合 计 10.0 合 计 11.0 现在学习的是第41页,共53页现在学习的是第42页,共53页例例 甲平均亩产x 面积 f xf x-x (x-x)(x-x)f 459 2.2 1010 6 36 79.2 452 2.1 950 -1 1 2.1 440 2.0 880 -13 169 338.0 453 1.9 860 0 0 0 461 1.8 830 8 64 115.2 合计 10.0 4530 -534.5现在学习的是第43页,共53页 乙平均亩产x 面积 f xf x-x (x-x)(x-x)f 439 2.3 1010 -16 256 588.8 445 2.0 890 -10 100 200.0 450 2.5 1125 -5 25 62.5 461 1.9 875 6 36 68.4 478 2.3 1100 23 529 1216.7 合计 11.0 5000 -2136.4 现在学习的是第44页,共53页现在学习的是第45页,共53页现在学习的是第46页,共53页甲水稻品种的收获率具有较强的稳定性甲水稻品种的收获率具有较强的稳定性,可以推可以推广广.现在学习的是第47页,共53页练习题练习题1 1、加权算术平均式转变为简单算术平均式的条件是各组变加权算术平均式转变为简单算术平均式的条件是各组变量值完全相等。()量值完全相等。()2 2、三种水果,每公斤价格分别为三种水果,每公斤价格分别为5 5元、元、4 4元和元和2.52.5元。各买元。各买2 2公斤和各买公斤和各买1010元的平均价格都是每公斤元的平均价格都是每公斤4 4元。()元。()3 3、在变量数列中,若标志值较小的组,而权数大时,计算在变量数列中,若标志值较小的组,而权数大时,计算出来的平均数()出来的平均数()A A、接近标志值较大的一组、接近标志值较大的一组B B、接近标志值较小的一组、接近标志值较小的一组C C、不受权数影响、不受权数影响D D、仅受标志值影响、仅受标志值影响现在学习的是第48页,共53页4、若单项式数列的所有标志值都减少一倍,而权数都增加若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数()一倍,则其算术平均数()A、增加一倍、增加一倍B、不变、不变C、减少一倍、减少一倍D、无法判断、无法判断5、比较两个单位的资料,甲的标准差小于乙的标准差,则比较两个单位的资料,甲的标准差小于乙的标准差,则()()A、两个单位的平均数代表性相同、两个单位的平均数代表性相同B、甲单位的平均数代表性大于乙单位、甲单位的平均数代表性大于乙单位C、乙单位的平均数代表性大于甲单位、乙单位的平均数代表性大于甲单位D、不能确定哪个单位的平均数代表性大、不能确定哪个单位的平均数代表性大现在学习的是第49页,共53页6 6、将未分组资料整理成组距变量数列,然后,分别按未分将未分组资料整理成组距变量数列,然后,分别按未分组资料和组距变量数列计算平均数,其结果()组资料和组距变量数列计算平均数,其结果()A A、一定相同、一定相同B B、不一定相同、不一定相同C C、往往相差很大、往往相差很大D D、无法比较、无法比较7 7、对于同一资料,直接利用未分组资料计算的算术平均数对于同一资料,直接利用未分组资料计算的算术平均数和先将其编成单项变量数列,再计算算术平均数,其结果和先将其编成单项变量数列,再计算算术平均数,其结果()()A A、一致、一致B B、不一致、不一致C C、有时一致、有时一致D D、有时不一致、有时不一致现在学习的是第50页,共53页8、众数()众数()A、是位置平均数、是位置平均数B、不受极端值的影响、不受极端值的影响C、是总体中出现次数最多的变量值、是总体中出现次数最多的变量值D、适用于总体次数多、且有明显的集中趋势的情形、适用于总体次数多、且有明显的集中趋势的情形E、是有序数列中间位置的变量值、是有序数列中间位置的变量值9、衡量平均指标代表性大小可使用的指标有()衡量平均指标代表性大小可使用的指标有()A、平均差、平均差B、标准差、标准差C、算术平均数、算术平均数D、调和平均数、调和平均数E、离散系数、离散系数现在学习的是第51页,共53页10、某工厂所属三车间劳动生产率及产量资料如下:某工厂所属三车间劳动生产率及产量资料如下:试计算试计算(1)各车间的平均劳动生产率)各车间的平均劳动生产率(2)全厂的平均劳动生产率)全厂的平均劳动生产率甲车间甲车间乙车间乙车间丙车间丙车间劳动生产率劳动生产率(元(元/人)人)人数人数(人)(人)劳动生劳动生产率产率(元(元/人)人)产值产值(元)(元)产值产值(元)(元)人数人数(人)(人)80080010001000100010001200120012001200以上以上20205050303095095010501050130013001425014250630006300032500325009600960077000770002500025000101070702020合计合计100100109750109750111600111600100100现在学习的是第52页,共53页11、甲、乙两个企业职工人数及工资资料如下表:甲、乙两个企业职工人数及工资资料如下表:按工资分组按工资分组(元)(元)甲企业职工人数甲企业职工人数(人)(人)乙企业各组职工乙企业各组职工所占比重(所占比重(%)8080以下以下8080100100100100120120120120140140140140以上以上1081082862862402401821821241240.100.100.240.240.360.360.180.180.120.12合计合计9409401.001.00试分别计算甲、乙两个企业职工的平均工资,并计算试分别计算甲、乙两个企业职工的平均工资,并计算有关指标比较哪个单位的平均工资更具有代表性。有关指标比较哪个单位的平均工资更具有代表性。现在学习的是第53页,共53页