集中趋势和离散趋势优秀课件.ppt
《集中趋势和离散趋势优秀课件.ppt》由会员分享,可在线阅读,更多相关《集中趋势和离散趋势优秀课件.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、集中趋势和离散趋势第1页,本讲稿共95页观察:一个平均工资掩盖了多少差异3 3月月2525日,北京市统计局宣布,日,北京市统计局宣布,20082008年,北京市职工年平均工资为年,北京市职工年平均工资为4471544715元,折合每月元,折合每月37263726元,比元,比20072007年增长了年增长了1212。与往年一样,这样。与往年一样,这样的数据又是引来一片质疑声。因为它和太多市民对实际收入的感受差距很大,也解释不了为什么大家的收入逐年增长,而消费却总的数据又是引来一片质疑声。因为它和太多市民对实际收入的感受差距很大,也解释不了为什么大家的收入逐年增长,而消费却总是无法提振的尴尬。是无
2、法提振的尴尬。有关部门对上述职工平均工资的统计给出了一些解释,使得社会对这一数据在统计意义上的正确性没有多少疑问,却对它的代有关部门对上述职工平均工资的统计给出了一些解释,使得社会对这一数据在统计意义上的正确性没有多少疑问,却对它的代表性和实际意义产生了更多的怀疑。按照相关解释,目前的职工平均工资统计,所涉及的统计对象还只是企事业单位、机关与社会表性和实际意义产生了更多的怀疑。按照相关解释,目前的职工平均工资统计,所涉及的统计对象还只是企事业单位、机关与社会团体,并没有将社会中小企业纳入。而且职工工资总额计算方法不是按实际发到职工手里的现金计算,还包括单位代扣代缴的社会团体,并没有将社会中小企
3、业纳入。而且职工工资总额计算方法不是按实际发到职工手里的现金计算,还包括单位代扣代缴的社会保险、住房公积金等。保险、住房公积金等。这样一解释,大家有些明白了,原来北京市职工年平均工资统计里的这样一解释,大家有些明白了,原来北京市职工年平均工资统计里的“职工职工”只是你我中间的一部分人群,这部分人群的收入可能是比较高而且稳定的,自只是你我中间的一部分人群,这部分人群的收入可能是比较高而且稳定的,自然平均工资也相对偏高一些。但这种然平均工资也相对偏高一些。但这种“有你没我有你没我”的统计,如何能反映整个城市的收入全貌呢?再从收入本身来说,按照的统计,如何能反映整个城市的收入全貌呢?再从收入本身来说
4、,按照中国保险报中国保险报人士的统计,北京地人士的统计,北京地区养老保险单位缴费比例区养老保险单位缴费比例2020,个人缴费比例,个人缴费比例8 8;医疗保险单位缴费比例;医疗保险单位缴费比例7.57.5,个人缴费比例,个人缴费比例 2 2;生育保险缴费比例为;生育保险缴费比例为0.60.6,单位承担;失业保险单,单位承担;失业保险单位缴费比例位缴费比例2 2,个人缴费比例,个人缴费比例1 1;工伤保险按行业性质分为;工伤保险按行业性质分为0.60.6、1.21.2、2 2三档基准费率,只由单位承担。以上合计,社保总负担至少已占个人工资总额的三档基准费率,只由单位承担。以上合计,社保总负担至少
5、已占个人工资总额的4242左右,外加单位和个人各缴左右,外加单位和个人各缴(扣扣)12)12以内的住房公积金,以内的住房公积金,“职工工资职工工资”里面将有可能高达里面将有可能高达6666的份额并不在市民的腰包里。而剩下的份额并不在市民的腰包里。而剩下3434的的“职工工资职工工资”,也还只是税前收入。难怪与大家的实际感受有如此大的差异。,也还只是税前收入。难怪与大家的实际感受有如此大的差异。统计的口径是这样,再回到平均的概念上来。很多年来,我们的职工平均工资统计数据只有平均数,而没有覆盖社会不同群体(如国企高管、公务员、教师、农民工)以及不统计的口径是这样,再回到平均的概念上来。很多年来,我
6、们的职工平均工资统计数据只有平均数,而没有覆盖社会不同群体(如国企高管、公务员、教师、农民工)以及不同行业(如金融、电信、私企、电力、石油)的具体分布数据。这样的统计无法显示不同行业以及同一行业内职工与管理人员巨大的收入差异,网民将这样的统计形象地概括为:同行业(如金融、电信、私企、电力、石油)的具体分布数据。这样的统计无法显示不同行业以及同一行业内职工与管理人员巨大的收入差异,网民将这样的统计形象地概括为:“张家有财一千万,十个邻居穷光蛋,平均下来算一算,个个都有上百万张家有财一千万,十个邻居穷光蛋,平均下来算一算,个个都有上百万”。一个与太多市民收入真实情况不相符的统计层面的工资增长,自然
7、无法得到大家在幸福感上的共鸣。一个与太多市民收入真实情况不相符的统计层面的工资增长,自然无法得到大家在幸福感上的共鸣。可见,一个可见,一个“平均平均”,掩盖了多少差异;一个,掩盖了多少差异;一个“增长增长”,隐藏了多少问题。,隐藏了多少问题。当然,并不是说平均值的统计方法是不需要的。当然,并不是说平均值的统计方法是不需要的。GDPGDP的人均值在分析一个国家经济增长阶段时有很大的价值,历史地看,平均值的变化也总的人均值在分析一个国家经济增长阶段时有很大的价值,历史地看,平均值的变化也总是有其时代意义的。但是,平均值的统计方法也是有缺陷的,因为它反映不了贫富分化和财富流向的变动。是有其时代意义的
8、。但是,平均值的统计方法也是有缺陷的,因为它反映不了贫富分化和财富流向的变动。在统计数字与社会现实的差异面前,我们是应该为了统计数字的在统计数字与社会现实的差异面前,我们是应该为了统计数字的“喜人增长喜人增长”而无视社会现实,还是应该为了真实地反映社会现实,修正统而无视社会现实,还是应该为了真实地反映社会现实,修正统计部门的计算口径和方法?答案是明摆着的,只有真实的数据才能让大家了解目前社会存在的真正问题,也才能为正确的决策提供有价值的参考。计部门的计算口径和方法?答案是明摆着的,只有真实的数据才能让大家了解目前社会存在的真正问题,也才能为正确的决策提供有价值的参考。这样真实的统计也许很难,但
9、在失真和真实之间,统计部门其实没有选择。这样真实的统计也许很难,但在失真和真实之间,统计部门其实没有选择。【作者:陈联科作者:陈联科 来源:京华时报来源:京华时报】第2页,本讲稿共95页数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)离散趋势离散趋势离散趋势离散趋势 (分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)第3页,本讲稿共95页数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值
10、值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度KurtosisKurtosisKurtosis四分位差四分位差四分位差四分位差四分位差四分位差极差极差极差极差极差极差偏偏偏偏偏偏 态态态态态态SkewnessSkewnessSkewnessModeMedianMeanRangeQuartilesVariance and Standard Deviation第4页,本讲稿共95页集中趋势的测度集中趋势集中趋势是对频数分布资料的集中状况和平均水平的综合测度。而离散趋势离散趋势是对频数分布资
11、料的差异程度和离散程度的测度,用来衡量集中趋势所测度的代表性,或者反映变量值的稳定性和均匀性。常用来表达数列集中趋势的测度有算术平均数、调和平均数、几何平均数、中位数和众数。这些测度在统计学中也称为平均指标或平均数,可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。第5页,本讲稿共95页集中趋势(Central tendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一
12、个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定第6页,本讲稿共95页均值(概念要点)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据第7页,本讲稿共95页均值(计算公式)设一组数据为:设一组数据为:X X1 1,X X2 2,X XN N 简单均值简单均值简单均值简单均值的计算公式为的计算公式为设分组后的数据为:设分组后的数据为:X X1 1,X X2 2,X XK K 相应的频数为:相应的频数为:F F1 1,F F2 2,F FK K加权均值加权均值加权均值加权均值的计算公式为的计算公式为第8
13、页,本讲稿共95页简单均值(算例)原始数据:10591368第9页,本讲稿共95页加权均值(算例)表表表表4-1 4-1 某车间某车间某车间某车间5050名工人日加工零件均值计算表名工人日加工零件均值计算表名工人日加工零件均值计算表名工人日加工零件均值计算表按零件数分组按零件数分组按零件数分组按零件数分组组中值(组中值(组中值(组中值(X Xi i)频数(频数(频数(频数(F Fi i)X Xi iF Fi i105105 110110110110 115115115115 120120120120125125125125 130130130130 135135135135 140140107
14、.5107.5112.5112.5117.5117.5122.5122.5127.5127.5132.5132.5137.5137.53 35 58 8141410106 64 4322.5322.5562.5562.5940.0940.01715.01715.01275.01275.0795.0795.0550.0550.0合计合计合计合计50506160.06160.0计算计算50 50 名工人日加工零件数的均值名工人日加工零件数的均值第10页,本讲稿共95页加权均值(权数对均值的影响)甲乙两组各有甲乙两组各有1010名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据
15、如下 甲组:甲组:甲组:甲组:考试成绩(考试成绩(考试成绩(考试成绩(X X):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(F F):):):):1 1 81 1 8 乙组:乙组:乙组:乙组:考试成绩(考试成绩(考试成绩(考试成绩(X X):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(F F):):):):8 1 18 1 1第11页,本讲稿共95页均值(数学性质)1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小第12页,本讲稿共95页2.调和平均数调和平均数调和平均数又称“倒数平均数”,它是根据各标志值的倒
16、数来计算的平均数,即各个标志值倒数的算术平均数的倒数。调和平均数也分简单调和平均数和加权调和平均数。简单调和平均数的计算公式为:即设m为权数,则加权调和平均数的计算公式为:则第13页,本讲稿共95页调和平均数(概念要点)1.集中趋势的测度值之一2.均值的另一种表现形式3.易受极端值的影响4.用于定比数据5.不能用于定类数据和定序数据6.计算公式为原来只是计原来只是计算时使用了算时使用了不同的数据不同的数据!第14页,本讲稿共95页调和平均数(算例)表表表表 某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜蔬菜蔬菜名称名称名称名称批
17、发价格批发价格批发价格批发价格(元元元元)X Xi i成交额成交额成交额成交额(元元元元)X Xi iF Fi i成交量成交量成交量成交量(公斤公斤公斤公斤)F Fi i甲甲甲甲乙乙乙乙丙丙丙丙1.201.200.500.500.800.8018000180001250012500640064001500015000250002500080008000合计合计合计合计36900369004800048000【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种种蔬蔬菜该日的平均批发价格菜该日的平均批发价格第15页,本讲稿共95页3.几何平均数几
18、何平均数几何平均数是计算平均比率和平均速度最适用的一种方法。几何平均数有简单几何平均数和加权几何平均数之分。简单几何平均数是次方根。个标志值连乘积的其计算公式为:在用几何平均数法计算平均数时,如果大于2,可采用对数法计算。计算公式为:第16页,本讲稿共95页几何平均数(概念要点)1.1.集中趋势的测度值之一集中趋势的测度值之一2.2.N N 个变量值乘积的个变量值乘积的 N N 次方根次方根3.3.适用于特殊的数据适用于特殊的数据4.4.主要用于计算平均发展速度主要用于计算平均发展速度5.5.计算公式为计算公式为6.6.可看作是均值的一种变形可看作是均值的一种变形第17页,本讲稿共95页几何平
19、均数(算例)一一位位投投资资者者持持有有一一种种股股票票,19961996年年、19971997年年、19981998年年和和19991999年年收收益益率率分分别别为为4.5%4.5%、2.0%2.0%、3.5%3.5%、5.4%5.4%。计计算算该该投投资资者者在在这这四四年年内的平均收益率。内的平均收益率。平均收益率平均收益率103.84%-1=3.84%103.84%-1=3.84%第18页,本讲稿共95页需要指出的是,当把几何平均数应用于经济现象时,必须注意经济现象本身的特点。只有当标志总量表现为各个标志值的连乘积时,才适合采用几何平均数方法来计算平均标志值。一般来说,计算社会经济现
20、象在各个时期的平均发展速度时,要采用几何平均数。例如,工农业总产值年平均发展速度、全国人口年平均发展速度等。第19页,本讲稿共95页4.中位数中位数中位数是一种按其在数列中的特殊位置而决定的平均数。把总体各单位标志值按大小顺序排列后,处在中点位次的标志值就是中位数,它将全部标志值分成两个部分,一半标志值比它大,一半标志值比它小,而且比它大的标志值个数和比它小的标志值个数相等。要求得中位数,首先要确定中位数的位次。未分未分组资组资料料时时,中位数位次 当总体位数 为奇数时,中位数就是中位数位次上的那个数据;当 为偶数时,中位数是中位数位次上2项数据的算术平均数。第20页,本讲稿共95页分分组资组
21、资料料时时,中位数位次可以利用中位数所在组的下限来测算中位数,即中位数的下限公式为:中位数中位数所在组的下限中位数所在组的次数总次数即各组次数总和小于中位数组的各组次数之和中位数所在组的组距式中:第21页,本讲稿共95页也可以利用中位数所在组的上限来测算中位数,即中位数的上限公式为:式中:中位数所在组的上限大于中位数组的各组次数之和中位数最大的特点是:它是序列中间1项或2项的平均数,不受极端值的影响,所以在当一个变量数列中含有特大值与特小值的情况下,采用中位数较为适宜。正式由于中位数的这一特点,在统计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度较大或频数分布有偏态时,为避免计算标志值
22、所得的算术平均数偏大或偏小,就可利用中位数来表示现象的一般水平。第22页,本讲稿共95页中位数(概念要点)1.1.集中趋势的测度值之一集中趋势的测度值之一2.2.排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%3.3.不受极端值的影响不受极端值的影响4.4.主要用于定序数据,也可用数值型数据,但不能用于定类数据主要用于定序数据,也可用数值型数据,但不能用于定类数据5.5.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即第23页,本讲稿共95页中位数(位置的确定)未分组数据:未分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:组距
23、分组数据:组距分组数据:第24页,本讲稿共95页未分组数据的中位数(计算公式)第25页,本讲稿共95页定序数据的中位数(算例)【例例例例】计计算算甲甲城城市市家家庭庭对对住住房房满满意意状况评价的中位数状况评价的中位数解:解:解:解:中位数的位置为:中位数的位置为:300/2300/2150150从从累累计计频频数数看看,中中位位数数的的在在“一一般般”这这一一组组别别中中。因此因此 MMe e一般一般一般一般表表表表 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲
24、城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302424132132225225270270300300合计合计合计合计300300第26页,本讲稿共95页数值型未分组数据的中位数(5个数据的算例)原始数据原始数据:24 22 21 26 20排排 序序:20 21 22 24 26位位 置置:1 2 3 4 5中位数中位数 22第27页,本讲稿共95页数值型未分组数据的中位数(6个数
25、据的算例)原始数据原始数据:10 5 9 12 6 8排排 序序:5 6 8 9 10 12位位 置置:1 2 3 4 5 6位置位置N+126+123.5中位数中位数 8+928.5第28页,本讲稿共95页1.1.根据位置公式确定中位数所在的组根据位置公式确定中位数所在的组2.2.采用下列近似公式计算:4.4.该公式假定中位数组的频数在该组内均匀分布该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数(要点及计算公式)第29页,本讲稿共95页数值型分组数据的中位数(算例)表表表表 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 集中 趋势 离散 优秀 课件
限制150内