第四章集中趋势的测量精选文档.ppt
《第四章集中趋势的测量精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章集中趋势的测量精选文档.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章集中趋势的测量本讲稿第一页,共八十七页一、集中趋势的含义一、集中趋势的含义 指一组数据向某一个典型值或代表值集中的情况。如指一组数据向某一个典型值或代表值集中的情况。如“大大部分学生是女生部分学生是女生”、“平均年龄为平均年龄为2424岁岁”等。主要形式有:等。主要形式有:平均数、中位数、众数。平均数、中位数、众数。vv一组数据向其中心值靠拢的倾向和程度。一组数据向其中心值靠拢的倾向和程度。一组数据向其中心值靠拢的倾向和程度。一组数据向其中心值靠拢的倾向和程度。vv测度集中趋势就是寻找数据一般水平的代表值或中心值。测度集中趋势就是寻找数据一般水平的代表值或中心值。测度集中趋势就是寻找数据
2、一般水平的代表值或中心值。测度集中趋势就是寻找数据一般水平的代表值或中心值。vv不同类型的数据用不同的集中趋势测度值。不同类型的数据用不同的集中趋势测度值。不同类型的数据用不同的集中趋势测度值。不同类型的数据用不同的集中趋势测度值。vv低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。高层次数据的集中趋势测度值并不适用于低层次的测量数据。高层次数据的集中趋势测度
3、值并不适用于低层次的测量数据。高层次数据的集中趋势测度值并不适用于低层次的测量数据。vv选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。握的数据的类型来确定。握的数据的类型来确定。握的数据的类型来确定。第一节第一节 集中趋势的含义及作用集中趋势的含义及作用本讲稿第二页,共八十七页v二、作用二、作用v 1、反映总体各单位变量分布的集中趋势和一般水平,、反映总体各单位变量分布的集中趋势和一般水平,说明社会现象在一定历史条件下的共同性质
4、。如用家说明社会现象在一定历史条件下的共同性质。如用家庭户平均人数说明家庭结构的一般性质。庭户平均人数说明家庭结构的一般性质。v 2、便于比较同类现象在不同单位间的发展水平,对社会现、便于比较同类现象在不同单位间的发展水平,对社会现象的特征能够从数量方面在空间上进行比较。如不同省份家象的特征能够从数量方面在空间上进行比较。如不同省份家庭户平均人数不同,说明不同省份家庭观念不同。庭户平均人数不同,说明不同省份家庭观念不同。v 3、对社会现象的特征能够从数量方面在时间上进行比较,、对社会现象的特征能够从数量方面在时间上进行比较,能够比较同类现象在不同时期的发展变化趋势或规律。能够比较同类现象在不同
5、时期的发展变化趋势或规律。v 4、分析社会现象之间的相互依存关系。如生活水平、分析社会现象之间的相互依存关系。如生活水平的高低与家庭人口数的多少成反方向变化。的高低与家庭人口数的多少成反方向变化。本讲稿第三页,共八十七页v第二节第二节 平均数平均数v一、算术平均数一、算术平均数v(一)、定义:算术平均数(一)、定义:算术平均数(Arithmetic mean)也称为均值也称为均值(Mean),是全部数据算术平均的结果。算术平均法是计算平均指标最,是全部数据算术平均的结果。算术平均法是计算平均指标最基本、最常用的方法。计算公式为:基本、最常用的方法。计算公式为:v 算术平均数算术平均数=总体标志
6、总量总体标志总量/总体单位总量总体单位总量v =(X1+X2+X3+Xn)/N v =Xi/Nv 其中:其中:为连加符号;为连加符号;N为总体单位数。为总体单位数。本讲稿第四页,共八十七页v很多社会经济现象,总体标志总量常常是总体单位变量很多社会经济现象,总体标志总量常常是总体单位变量值的算术总和。例如,工人工资总额是总体中每个工人值的算术总和。例如,工人工资总额是总体中每个工人工资的总和,某地区小麦总产量是所有耕地小麦产量的工资的总和,某地区小麦总产量是所有耕地小麦产量的总和。在总体标志总量和总体单位总量的基础上,就可总和。在总体标志总量和总体单位总量的基础上,就可以计算平均指标。以计算平均
7、指标。v算术平均数在统计学中具有重要的地位,是集中趋势的最主算术平均数在统计学中具有重要的地位,是集中趋势的最主要度量值,通常用(读作要度量值,通常用(读作 )表示。根据所掌握数据形式)表示。根据所掌握数据形式的不同,算术平均数有简单算术平均数和加权算术平均数。的不同,算术平均数有简单算术平均数和加权算术平均数。本讲稿第五页,共八十七页v(二)简单算术平均数(二)简单算术平均数(Simple arithmetic mean)v未经分组整理的原始数据,其算术平均数的未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除计算就是直接将一组数据的各个数值相加除以数值个数。设统计
8、数据为以数值个数。设统计数据为,则算术平均,则算术平均数的计算公式为:数的计算公式为:v 本讲稿第六页,共八十七页例例3.3 某班级某班级40名同学统计学的考试成绩原始资名同学统计学的考试成绩原始资料如表料如表3.12所示。所示。v表表3.2 40名同学统计学原始成绩名同学统计学原始成绩本讲稿第七页,共八十七页v该班该班40名同学统计学的平均成绩为:名同学统计学的平均成绩为:本讲稿第八页,共八十七页v(三)、加权算术平均数(三)、加权算术平均数(Weighted arithmetic mean)v 当数据资料比较多,且已编制成变量数列的当数据资料比较多,且已编制成变量数列的情况下,就要计算加权
9、算术平均数,以反映情况下,就要计算加权算术平均数,以反映总体中各总体单位某一数量的情况。总体中各总体单位某一数量的情况。本讲稿第九页,共八十七页v 公式为:公式为:vX=(X1f1+X2f2+Xnfn)/(f1+f2+fn)=Xifi/fiv 其中:其中:f为权数,即变量在总体中出现的次为权数,即变量在总体中出现的次数。数。本讲稿第十页,共八十七页v由于变量数列可分为单项数列(单项分组)和组距数列由于变量数列可分为单项数列(单项分组)和组距数列(组距分组),(组距分组),v计算加权算术平均值的方法也有两种:计算加权算术平均值的方法也有两种:v由单项分组资料求算术平均值由单项分组资料求算术平均值
10、v 计算公式为:计算公式为:v X=Xifi/fiv 例如:例如:P48 例例2v 由组距分组资料求算术平均值由组距分组资料求算术平均值v 计算公式为:计算公式为:v X=Xmid*f/fv 其中:其中:Xmid表示各组组中值,表示各组组中值,f表示每组次数。表示每组次数。v注意:组中值是假定值(近似值),与实际有差距,但误注意:组中值是假定值(近似值),与实际有差距,但误差很小。差很小。本讲稿第十一页,共八十七页v根据分组整理的数据计算算术平均数,就要根据分组整理的数据计算算术平均数,就要以各组变量值出现的次数或频数为权数计算以各组变量值出现的次数或频数为权数计算加权的算术平均数。设原始数据
11、被分成组,加权的算术平均数。设原始数据被分成组,各组的变量值为各组的变量值为,各组变量值的次数或频,各组变量值的次数或频数分别为数分别为,则加权的算术平均数为:,则加权的算术平均数为:本讲稿第十二页,共八十七页v例例3.4 根据例根据例3.3提供的提供的40名同学的统计学名同学的统计学成绩原始资料分组整理如表成绩原始资料分组整理如表3.13,根据此,根据此表资料计算平均成绩。表资料计算平均成绩。v表表3.3 40名同学统计学成绩汇总表名同学统计学成绩汇总表本讲稿第十三页,共八十七页v根据(根据(3.12)式得)式得本讲稿第十四页,共八十七页v根据(根据(3.12)式计算的平均成绩是)式计算的平
12、均成绩是76.5分,分,而与根据(而与根据(3.11)式计算的平均成绩)式计算的平均成绩77.23分分相比,相差相比,相差0.73分,显然分,显然77.23分是准确的平分是准确的平均成绩,因为(均成绩,因为(3.11)式所用的是原始数据)式所用的是原始数据的全部信息。而(的全部信息。而(3.12)式是用各组的组中)式是用各组的组中值代表各组的实际数据,使用代表值时是假值代表各组的实际数据,使用代表值时是假定各组数据在各组中是均匀分布的,但实际定各组数据在各组中是均匀分布的,但实际情况与这一假定会有一定的偏差,使得利用情况与这一假定会有一定的偏差,使得利用分组资料计算的平均数与实际的平均值会产分
13、组资料计算的平均数与实际的平均值会产生误差,它是实际平均值的近似值。生误差,它是实际平均值的近似值。本讲稿第十五页,共八十七页v加权算术平均数其数值的大小,不仅受各组加权算术平均数其数值的大小,不仅受各组变量值()大小的影响,而且受各组变量值变量值()大小的影响,而且受各组变量值出现的频数即权数()大小的影响。如果某出现的频数即权数()大小的影响。如果某一组的权数大,说明该组的数据较多,那么一组的权数大,说明该组的数据较多,那么该组数据的大小对算术平均数的影响就越大,该组数据的大小对算术平均数的影响就越大,反之,则越小。实际上,我们将(反之,则越小。实际上,我们将(3.12)式)式变形为下面的
14、形式,就更能清楚地看出这一变形为下面的形式,就更能清楚地看出这一点。点。本讲稿第十六页,共八十七页本讲稿第十七页,共八十七页v由(由(3.13)式可以清楚地看出,加权算术平均数)式可以清楚地看出,加权算术平均数受各组变量值()和各组权数即频率大小的影响。受各组变量值()和各组权数即频率大小的影响。频率越大,相应的变量值计入平均数的份额也越频率越大,相应的变量值计入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,大,对平均数的影响就越大;反之,频率越小,相应的变量值计入平均数的份额也越小,对平均相应的变量值计入平均数的份额也越小,对平均数的影响就越小。这就是权数权衡轻重作用的实数的影响
15、就越小。这就是权数权衡轻重作用的实质。质。本讲稿第十八页,共八十七页v当我们掌握的权数不是各组变量值出现的频数,当我们掌握的权数不是各组变量值出现的频数,而是频率时,可直接根据(而是频率时,可直接根据(4.3.3)式计算算术)式计算算术平均数。平均数。本讲稿第十九页,共八十七页v如例如例3.2,根据各组的频数计算的频率分别为:,根据各组的频数计算的频率分别为:0.05、0.2、0.4、0.25、0.1,各组频率之和,各组频率之和为为1,则用频率计算的加权算术平均数为:,则用频率计算的加权算术平均数为:本讲稿第二十页,共八十七页本讲稿第二十一页,共八十七页v从计算结果看,用频率加权计算的结果与用
16、从计算结果看,用频率加权计算的结果与用频数加权计算的结果是一致的。频数加权计算的结果是一致的。本讲稿第二十二页,共八十七页v在实际生活中,我们也会经常遇到由相对数在实际生活中,我们也会经常遇到由相对数计算平均数的情况。一般地说,求相对数的计算平均数的情况。一般地说,求相对数的平均数应采用加权平均的方法,此时,用于平均数应采用加权平均的方法,此时,用于加权平均的权数不再是频数或频率,而应根加权平均的权数不再是频数或频率,而应根据相对数的含义,选择适当的权数。下面举据相对数的含义,选择适当的权数。下面举一个实例说明。一个实例说明。本讲稿第二十三页,共八十七页v例例3.5 某公司所属某公司所属10个
17、企业资金利润率分组个企业资金利润率分组资料如表资料如表3.4,要求计算该公司,要求计算该公司10个企业的平个企业的平均利润率。均利润率。v表表3.4 某公司所属某公司所属10个企业资金利润率分个企业资金利润率分组资料组资料本讲稿第二十四页,共八十七页v该例子的平均对象是各企业的资金利润率,该例子的平均对象是各企业的资金利润率,表中的企业数虽然是次数或频数,但却不是表中的企业数虽然是次数或频数,但却不是合适的权数。要正确计算公司合适的权数。要正确计算公司10个企业的平个企业的平均资金利润率,因为资金利润率均资金利润率,因为资金利润率=利润总额利润总额/资金总额,所以计算平均资金利润率需要以资金总
18、额,所以计算平均资金利润率需要以资金总额为权数,才能符合该指标的性质。资金总额为权数,才能符合该指标的性质。因此,该公司因此,该公司10个企业的平均利润率为:个企业的平均利润率为:本讲稿第二十五页,共八十七页v(四)算数平均数的数学性质(四)算数平均数的数学性质v算术平均数在统计学中具有重要的地位,它是进行统计分析和统算术平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。从统计思想上看,算术平均数是一组数据的重心计推断的基础。从统计思想上看,算术平均数是一组数据的重心所在,它是消除了一些随机因素影响后或者数据误差相互抵消后所在,它是消除了一些随机因素影响后或者数据误差相互抵消后
19、的必然性的结果。例如每年分季度的观测数据,各年同季的数据的必然性的结果。例如每年分季度的观测数据,各年同季的数据由于受一些偶然性随机因素的影响,其数值表现出一定的差异性,由于受一些偶然性随机因素的影响,其数值表现出一定的差异性,但将各年同季的数据加以平均,计算的算术平均数,就消除了一但将各年同季的数据加以平均,计算的算术平均数,就消除了一些随机因素的影响,反映出季节变动必然性的数量特征。再如,些随机因素的影响,反映出季节变动必然性的数量特征。再如,对同一事物进行多次测量,由于测量误差所致,或者其它因素的对同一事物进行多次测量,由于测量误差所致,或者其它因素的偶然影响,使得测量结果不一致,但利用
20、算术平均数作为其代表偶然影响,使得测量结果不一致,但利用算术平均数作为其代表值,则可以使误差相互抵消,反映出事物固有的数量特征。另外,值,则可以使误差相互抵消,反映出事物固有的数量特征。另外,算术平均数具有下面一些重要的数学性质,这些数学性质在实际算术平均数具有下面一些重要的数学性质,这些数学性质在实际中有着广泛的应用,同时也体现了算术平均数的统计思想。中有着广泛的应用,同时也体现了算术平均数的统计思想。本讲稿第二十六页,共八十七页本讲稿第二十七页,共八十七页v二、调和平均数(二、调和平均数(Harmonic mean)v在实际工作中,经常会遇到只有各组变量值在实际工作中,经常会遇到只有各组变
21、量值和各组标志总量而缺少总体单位数的情况,和各组标志总量而缺少总体单位数的情况,这时就要用调和平均数法计算平均指标。这时就要用调和平均数法计算平均指标。v为了方便调和平均数的概念和计算方法的说为了方便调和平均数的概念和计算方法的说明,我们先看一个简单的例子。明,我们先看一个简单的例子。本讲稿第二十八页,共八十七页v例例3.6 市场上早、中、晚蔬菜的价格分别是市场上早、中、晚蔬菜的价格分别是早晨:早晨:0.67元元/公斤,中午公斤,中午0.5元元/公斤,晚上公斤,晚上0.4元元/公斤。现在,我们分别按四种方法在购公斤。现在,我们分别按四种方法在购买蔬菜,分别计算平均价格(不管按什么方买蔬菜,分别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 集中 趋势 测量 精选 文档
限制150内