财务管理统计学第四章平均指标.pptx
第一节第一节 平均指标平均指标第二节第二节 标志变异指标标志变异指标第三节第三节 偏度与峰度偏度与峰度1基本要求:基本要求: 平均指标和标志变异指标是进行统计描述的重平均指标和标志变异指标是进行统计描述的重要指标。通过本章的学习,要求学生深刻理解平要指标。通过本章的学习,要求学生深刻理解平均指标和变异指标的基本概念和分析方法;掌握均指标和变异指标的基本概念和分析方法;掌握各种平均指标的计算方法和运用原则以及几种平各种平均指标的计算方法和运用原则以及几种平均数的关系,并能对平均指标进行分析;了解影均数的关系,并能对平均指标进行分析;了解影响平均指标大小的因素;明确平均指标与标志变响平均指标大小的因素;明确平均指标与标志变异指标的区别;掌握各种标志变异指标的计算方异指标的区别;掌握各种标志变异指标的计算方法,并能运用标志变异指标说明平均指标的代表法,并能运用标志变异指标说明平均指标的代表性。性。 2一、平均指标概述一、平均指标概述二、数值平均数二、数值平均数三、位置平均数三、位置平均数3(一)含义(一)含义 反映社会经济现象总体各单位某一数量标反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所到达的一般水平志在一定时间、地点条件下所到达的一般水平的综合指标,概括地表明各种统计数列的基本的综合指标,概括地表明各种统计数列的基本数值特征,显示数列的一般水平或分布的数值特征,显示数列的一般水平或分布的集中集中趋势。趋势。4平均指标在统计中的作用平均指标在统计中的作用1.1.可以消除因总体不同而带来的总体数量上的可以消除因总体不同而带来的总体数量上的差异,从而使不同总体可以对比。差异,从而使不同总体可以对比。2.2.可以对比现象在不同时间的一般水平的变化,可以对比现象在不同时间的一般水平的变化,反映现象发展变化的趋势及规律性。反映现象发展变化的趋势及规律性。3.3.可以分析现象之间的依存关系。可以分析现象之间的依存关系。4.4.可以进行数量上的估计推断。可以进行数量上的估计推断。 5基本特点基本特点1.1.必须应用于必须应用于同质总体同质总体2.2.是一种代表值,是一种代表值,把总体单位数量标志值间的差把总体单位数量标志值间的差异抽象化,反映总体分布的集中趋势异抽象化,反映总体分布的集中趋势3.3.说明一定历史条件下的一般水平说明一定历史条件下的一般水平4.4.以大量观察法为基础以大量观察法为基础6 7算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数8总体单位总数总体标志总量平均数算术总产量总成本平均成本人数总成绩平均成绩直接承担者直接承担者9适用于总体资料未经分组适用于总体资料未经分组整理、尚为原始资料的情况整理、尚为原始资料的情况nXnXXXXniin12110 岁247168733232221242520nXX某小组共某小组共7 7人,其年龄分别为人,其年龄分别为 2020、2525、2424、2121、2222、2323、3333(岁)(岁)11fxfffffXfXfXXnnn21221112日产量(件)日产量(件)x工人人数(人)工人人数(人)fxf1011121314701003801501007001100456019501400合计合计800971013件)(14.12800971010015038010070100141501338012100117010fxfX以以组中值作为各组的代表值,假定各组标志组中值作为各组的代表值,假定各组标志值在组内分布是均匀的。值在组内分布是均匀的。142.2.某班同学英语考试成绩如下,计算其平均成绩某班同学英语考试成绩如下,计算其平均成绩 成绩分组成绩分组(X)人数人数(f) 比重比重(%)组中值组中值 X f 60以下以下6070708080909010059158312.522.537.5207.555657585 952755851125680285合合 计计 40 100 2950 分)(75.73402950fxfX15u加权算术平均数的另一公式加权算术平均数的另一公式ffxffxffxffxfxfxxnnnn22112211 ffx(分)75.73%5 . 795%2085%5 .3775%5 .2265%5 .1255ffxx16a a)加权算术平均数受两个因素的影响,一个是分)加权算术平均数受两个因素的影响,一个是分配数列中各组的标志值配数列中各组的标志值x xi i,另一个是各组标志值出,另一个是各组标志值出现的次数现的次数f fi i或频率或频率f/ff/fb b)各组标志值出现的次数在计算平均数的过程中)各组标志值出现的次数在计算平均数的过程中起着权衡轻重的作用,故常将其称作起着权衡轻重的作用,故常将其称作“权数权数”。c c)权数的形式:次数和频率)权数的形式:次数和频率权数尽管可以以绝对数或相对数的形式出现,但权权数尽管可以以绝对数或相对数的形式出现,但权数的实质是数的实质是结构相对数。结构相对数。(3 3)权数的作用和形式)权数的作用和形式17d d)下列情况,分组资料可以不考虑权数,而用简)下列情况,分组资料可以不考虑权数,而用简单算术平均数。单算术平均数。当各组的权数相同时。当各组的权数相同时。nxnAxAffxfxfxxnn221118变量值与其算术平均数的离差之和等变量值与其算术平均数的离差之和等于零,即:于零,即:变量值与其算术平均数的离差平方和变量值与其算术平均数的离差平方和为最小,即:为最小,即:0)(xx最小值2)(xx19设设X=(2,4,6,8),),则其调和平均数可则其调和平均数可由定义计算如下:由定义计算如下:48161412121416181816141214是总体各单位标志值倒数的算术平均数是总体各单位标志值倒数的算术平均数的倒数,又叫的倒数,又叫倒数平均数倒数平均数20适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况XnXXXnHn111121iiXnH21适用于总体资料经过分适用于总体资料经过分组整理形成变量数列的情况组整理形成变量数列的情况imiXiimXmXmXmXmmmmHmmm122112122例:某工厂工人日产零件数资料:例:某工厂工人日产零件数资料:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。件36.5870147035700103301mXmH23XfXfXfXXfmXmHXfm11,则设24 (三)几何平均数三)几何平均数是是n n项标志值连乘积的项标志值连乘积的n n次方根次方根 1.1.简单几何平均数:简单几何平均数:应用:平均发展速度的计算应用:平均发展速度的计算nnxxxxGn21ffffnffxxxxGn21212.2.加权几何平均数加权几何平均数25【例例1 1】某流水生产线有前后衔接的五道工序。某日某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为各工序产品的合格率分别为9595、9292、9090、8585、8080,求整个流水生产线产品的平均合格率。,求整个流水生产线产品的平均合格率。%24.88%80%85%90%92%955nxG26【例例2】某某金融机构以复利计息。近金融机构以复利计息。近12年来的年利年来的年利率有率有4年为年为3,2年为年为5,2年为年为8,3年为年为10,1年为年为15。求平均年利率。求平均年利率。 平均年利率为平均年利率为=106.85%-100%=6.85%85.1062154. 215. 110. 108. 105. 103. 1121213224ffxG27(四)三者的关系(四)三者的关系算术平均数受极大值的影响较大,调和平均数受算术平均数受极大值的影响较大,调和平均数受极小值的影响较大极小值的影响较大同一资料而言,其结果有如下关系:同一资料而言,其结果有如下关系: HGX280M29u有时众数是一个合适的代表值有时众数是一个合适的代表值 比如在服装行业中,生产商、批发商和比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均更感兴趣的是最普遍的尺寸而不是平均尺寸。尺寸。 30日产量(件)日产量(件)工人人数(人)工人人数(人)101011111212131314147070100100380380150150100100合计合计800800【例例1 1】已知某企业某日工人的日产量资料如下已知某企业某日工人的日产量资料如下: :0M众数的确定众数的确定1.1.单项数列单项数列计算该企业该日全部工人日产量的众数计算该企业该日全部工人日产量的众数312.2.组距数列组距数列先确定众数组,然后计算:先确定众数组,然后计算:021100mmdLM下限公式:021200mmdUM上限公式:1001mmff式中:1002mmff众数组的组距:0md32例:上年某市例:上年某市8080个中型工业企业资料个中型工业企业资料)( 5 .1710)2025()1025(1025100百万元M)( 5 .1710)2025()1025(2025200百万元M10mf0mf10mf33q当数据分布存在明显的集中趋势,且有显当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;著的极端值时,适合使用众数;q当数据分布的集中趋势不明显或存在两个当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(以上分布中心时,不适合使用众数(前者无前者无众数,后者为双众数或多众数,也等于没有众数,后者为双众数或多众数,也等于没有众数众数)。)。众数的应用众数的应用34(二)中位数(二)中位数( Me Me ) 将总体各单位按其标志值大小顺序排列,处于将总体各单位按其标志值大小顺序排列,处于中点位置那个单位的标志值,即为中位数。中点位置那个单位的标志值,即为中位数。1.1.由未分组资料确定中位数。由未分组资料确定中位数。确定方法:首先将各总体单位的标志值,按照大小确定方法:首先将各总体单位的标志值,按照大小顺序排列,然后确定中位数的位置,处于中位数的顺序排列,然后确定中位数的位置,处于中位数的位置的标志值就是中位数。位置的标志值就是中位数。35212221nnnexxxm(当(当n为奇数,中位数为处于中间为奇数,中位数为处于中间位置的标志值)位置的标志值)(当(当n为偶数,中位数为处于中间为偶数,中位数为处于中间位置的两个标志值的平均数)位置的两个标志值的平均数)362.2.由单项式分组资料确定中位数。由单项式分组资料确定中位数。确定方法:单项式分组已经将资料序列化,这时总确定方法:单项式分组已经将资料序列化,这时总体单位数体单位数n=n=ff,确定,确定确定中位数的位置要通过累确定中位数的位置要通过累计次数计算。计次数计算。212221fffexxxm(当(当f为奇数)为奇数)(当(当f为偶数)为偶数)37中位数中位数例如,例如,某工厂工人的某工厂工人的日产量分配数日产量分配数列如列如下下表。表。f f3030为偶数为偶数(件)260221615122xxxxmeff383.3.由组距分组数列确定中位数由组距分组数列确定中位数(1 1)确定)确定“中位数组中位数组” 向上累计次数等于向上累计次数等于(2 2)假定中位数组内分布是均匀的,计算出)假定中位数组内分布是均匀的,计算出中位数。中位数。2f39eeeemmmemdfSfLM12eeeeemmmmdffSUM2向上累计时向上累计时向下累计时向下累计时eeeeemmmdfmSfUM1240百万元)(5.22102354020Me)(5.221020405530百万元Me554035,402 f中位数组为中位数组为“20-30”41u众数、中位数、算术平均数的关系众数、中位数、算术平均数的关系当次数分布呈对称的钟分布时,三者相等;当次数分布呈对称的钟分布时,三者相等;当次数右偏时,当次数右偏时,当次数左偏时,当次数左偏时, 皮尔逊经验公式:皮尔逊经验公式:XMMe0XMMe2300MMXe42有四分位数、十分位数和百分位数有四分位数、十分位数和百分位数意义:反映总体分布的位置特征,作为考察意义:反映总体分布的位置特征,作为考察分布的集中趋势和变异状况的有效工具,尤分布的集中趋势和变异状况的有效工具,尤其在强调其在强调“稳健性稳健性”和和“耐饥性耐饥性”等数据分等数据分析中有重要运用。析中有重要运用。43 四分位数四分位数 (Quartile)(Quartile):将全部总体单位按标志将全部总体单位按标志值大小等分为四部分的三个数值,分别记为值大小等分为四部分的三个数值,分别记为Q Q1 1、Q Q2 2、Q Q3 3,分别叫做,分别叫做“下分位数下分位数”、“中位数中位数”和和“上分位上分位数数”。 4) 1(3214) 1(241321nQnnQnQ的位次的位次的位次44一、标志变异指标概述一、标志变异指标概述二、极差与分位差二、极差与分位差三、平均差三、平均差四、标准差与方差四、标准差与方差五、成数指标五、成数指标六、变异系数六、变异系数45语文语文 数学数学英语英语 总成绩总成绩 平均成绩平均成绩甲甲乙乙丙丙606555656565706575195195195656565请请比较三名同学学习成绩的差异。比较三名同学学习成绩的差异。46一、标志变异指标的概述一、标志变异指标的概述(一)(一)概念:反映总体各单位标志值之间差异程度的概念:反映总体各单位标志值之间差异程度的综合指标。反映总体变量的分布特征、变动范围或综合指标。反映总体变量的分布特征、变动范围或离散程度。离散程度。标志变异指标和平均指标是一对相互联系的对应指标志变异指标和平均指标是一对相互联系的对应指标,平均指标反映总体各单位标志值的标,平均指标反映总体各单位标志值的集中集中趋势,趋势,而标志变异指标则是总体各单位标志值的而标志变异指标则是总体各单位标志值的离中离中趋势趋势47q用来衡量和比较平均数代表性的大小用来衡量和比较平均数代表性的大小变异指标值越大,平均指标的代表性越小;反之,变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大平均指标的代表性越大q用来反映社会经济活动过程的均衡性和稳定性用来反映社会经济活动过程的均衡性和稳定性(二)作用(二)作用48测定标志变异度的绝对量指标测定标志变异度的绝对量指标测定标志变异度的相对量指标测定标志变异度的相对量指标49(一)minmaxXXR50( (二二) )分位差分位差 是对全距指标的改进是对全距指标的改进, ,从变量数列中剔除部分极端从变量数列中剔除部分极端值后重新计算的类似于全距的指标,有四分位差等。值后重新计算的类似于全距的指标,有四分位差等。 四分位差:从总体分别中剔除最大和最小各四分位差:从总体分别中剔除最大和最小各1/41/4的的单位,再对中间剩下的总体半数单位计算全距,称为单位,再对中间剩下的总体半数单位计算全距,称为“内四分位间距(内四分位间距(Q.RQ.R)四分位差(四分位差(QDQD) 13.QQRQ2.13QQDQ51三、平均差三、平均差 是总体各单位标志值与其算术平均数的离差绝对值是总体各单位标志值与其算术平均数的离差绝对值的算术平均数,用的算术平均数,用A.D A.D 表示表示 作用:平均差反映各标志值的差异程度,平均差越作用:平均差反映各标志值的差异程度,平均差越大,说明总体各标志值差异程度越大,平均数的代表大,说明总体各标志值差异程度越大,平均数的代表性越小;平均差越小,说明各标志值差异程度越小,性越小;平均差越小,说明各标志值差异程度越小,平均数的代表性越大。平均数的代表性越大。52公式: nxxDA.ffxxDA.53(元)甲1000 x(元)乙1000 x)(1205100012001000800.元甲nxxDA)(605100011001000900.元乙nxxDA54例:根据下列资料,计算平均差例:根据下列资料,计算平均差 按日产量(件)按日产量(件) 工人数工人数组中值组中值 Xf 3040405050606070 102015 5 35455565 350900825 325 1306010585合合 计计 50 2400 380fXX 48502400fxfx6 .750380ffXxAD55q优点优点: :不易受极端数值的影响,能综合反映全部单不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;位标志值的实际差异程度;q缺点缺点: :用绝对值的形式消除各标志值与算术平均数用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计离差的正负值问题,不便于作数学处理和参与统计分析运算。分析运算。56(一)标准差标准差 是各单位标志值与其算术平均数的离差平方的算是各单位标志值与其算术平均数的离差平方的算术平均数的开平方根,用术平均数的开平方根,用来表示来表示适用未分组资料)()(2221nxnxnxxnii适用分组资料)()(22121fxfffxffxxniiinii57仍用前面车间两小组工人月工资的例子仍用前面车间两小组工人月工资的例子:200005)10001200()1000900()1000800()(22222nxx甲5000)(22nxx乙(元)甲14120000 (元)乙7 .705000 5848502400fxfx按日产量分组(件)按日产量分组(件) 工人数工人数 组中值组中值 Xf 3040405050606070 1020155 35455565 350900825325 16901807351620 合合 计计 50 2400 4225 fxx2)( 19. 9504225121niiiniiffxx59(二)方差(二)方差(2 2)用于抽样调查、相关分析及质量控制等用于抽样调查、相关分析及质量控制等(三)性质(三)性质u在总体分组的条件下,总方差可以分解为组内方在总体分组的条件下,总方差可以分解为组内方差的平均数和组间方差两部分,即加法定理差的平均数和组间方差两部分,即加法定理: :222ffii22iiiffxx22)(60五、成数指标五、成数指标61具有某种标志表现的具有某种标志表现的单位数所占的成数单位数所占的成数NNP1不具有某种标志表现不具有某种标志表现的单位数所占的成数的单位数所占的成数NNQ010101NNNNNNNNNQP且有成数成数62PNNNNNfXfXP10101PQPQPQQPPQNNNPNPffXXp22010212201)(25. 05 . 02max时,有当QP63100XDAVDA100XV六、变异系数六、变异系数6402.19100826 .15100111XV47.19100768 .14100222XV因为因为 所以一班平均成绩的代表性比二班好。所以一班平均成绩的代表性比二班好。21VV65一、矩及测度一、矩及测度矩:又叫动差,用来描述分布的特征矩:又叫动差,用来描述分布的特征(一)矩的基本形式(一)矩的基本形式niiniikiknikikffaxnax111)(,)(66(二)原点矩(二)原点矩显然,一阶原点矩是变量的算术平均数,二阶原点显然,一阶原点矩是变量的算术平均数,二阶原点矩是变量平方的算术平均数矩是变量平方的算术平均数niiniikiknikkffxnxkkxai111, 0阶原点矩”阶矩,即“关于原点的则得到变量若67(三)中心矩(三)中心矩显然,任何分布的一阶中心矩永远等于零,二阶中显然,任何分布的一阶中心矩永远等于零,二阶中心矩就是分布的方差心矩就是分布的方差niiniikinikikffxxknxxkkxxxa111)(,)(,阶中心矩阶矩,即的关于分布中心就得到变量若68二、偏度及测度二、偏度及测度1.1.含义:是反映变量数列偏斜程度的指标,即指分布含义:是反映变量数列偏斜程度的指标,即指分布不对称的方向和程度。不对称的方向和程度。单峰分布单峰分布对称分布对称分布非对称分布非对称分布左偏态左偏态右偏态右偏态692.2.偏度系数偏度系数SKSK通常取值在通常取值在-3+3-3+3之间,其绝对值大,则偏之间,其绝对值大,则偏斜程度大,反之,亦然。斜程度大,反之,亦然。当分布呈右偏时,当分布呈右偏时,SKSK0 0;当分布呈左偏时,;当分布呈左偏时,SKSK0 0;若;若SK=0SK=0,则为对称分布。,则为对称分布。/)(0MxSK70峰度指标峰度指标的计算公式:的计算公式:判断标准(都是与相同标准差的正态分布比较):判断标准(都是与相同标准差的正态分布比较):,峰度3440 0,高峰度分布,高峰度分布=0=0,正态分布,正态分布0 0,低峰度分布,低峰度分布71当峰度指标当峰度指标00时,表示分布比正态分布更集中时,表示分布比正态分布更集中在平均数周围,分布呈尖峰状态;在平均数周围,分布呈尖峰状态;=0=0分布为正态分分布为正态分布;布;00时,表示分布比正态分布更分散,分布呈低时,表示分布比正态分布更分散,分布呈低峰态,如下图所示:峰态,如下图所示:72