第三章集中和离散.ppt
《第三章集中和离散.ppt》由会员分享,可在线阅读,更多相关《第三章集中和离散.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 集中趋势和离中趋势31 集中趋势的测度32 离中趋势的测度33 偏态与峰度的测定 31集中趋势的测度n 集集中中趋趋势势是是指指一一组组数数据据(或或总总体体各各单单位位标标志志值值)向向某某一一中中心心值值靠靠拢拢的的倾倾向向,测测度度集集中中趋趋势势也也就就是是寻寻找找资资料料一一般般水水平平代表值或中心值,即平均指标。代表值或中心值,即平均指标。n 所所谓谓平平均均指指标标,是是说说明明同同质质总总体体内内各各单单位位某某一一数数量量标标志志在一定时间、地点条件下所达到的一般水平。在一定时间、地点条件下所达到的一般水平。n 趋趋势势的的测测度度值值(平平均均指指标标)主主要要有有
2、算算术术平平均均数数、调调和和平平均均数数、几几何何平平均均数数、众众数数和和中中位位数数等等。本本节节将将分分别别介介绍绍它它们们的计算方法、特点及应用场合。的计算方法、特点及应用场合。n 2n n2002年,全国职工平均工资为12422元,其中,金融、保险业最高,为19135元,而农、林、牧渔业最低,为6398元,相当于最高的33.44%。n一、算术平均数一、算术平均数n 算算术术平平均均数数是是集集中中趋趋势势中中最最常常用用、最最重重要要的的测测度度值值。它是将总体标志总量除以总体单位总量而得到的均值。它是将总体标志总量除以总体单位总量而得到的均值。n(一)算术平均数的基本公式(一)算
3、术平均数的基本公式n算术平均数总体标志总量算术平均数总体标志总量/总体单位总量总体单位总量n 注注意意,式式中中分分子子、分分母母指指标标必必须须属属于于同同一一总总体体,即即各各标标志志值值与与各各单单位位之之间间是是一一一一对对应应的的。这这也也是是算算术术平平均均数与强度相对指标的区别。数与强度相对指标的区别。n(二)(二)两种计算形式两种计算形式:n 首先看两个资料。首先看两个资料。n5n例一例一:设有一组大学生的月生活费支出为:150,200,240,300,350,500(单位:元)。(x=290)n例二:例二:有一班级的大学生月生活费支出如下表:n 月生活费(元)月生活费(元)x
4、人数(人)人数(人)f频率(频率(%)n 150 3 5.36n 200 5 8.93n 240 7 12.50 n 300 24 42.85n 350 16 28.57n 500 1 1.79n 合 计 56 100.00n n 6n 加权算术平均数计算表加权算术平均数计算表n n 月生活费(元)月生活费(元)x人数(人)人数(人)f频率(频率(%)xfx*频率频率n15035.364508.04n20058.93100017.86n240712.50168030.00n3002442.857200128.55n3501628.575600100.00n50011.795008.95n合合计
5、计56100.0016430293.40资料栏资料栏计算栏计算栏n解:解:该班级学生平均月生活费该班级学生平均月生活费=(公式)(公式)=16430/56=293.39(元元)nn7n1 1、简单算术平均数(适用于未分组资料)简单算术平均数(适用于未分组资料)n计算公式为:计算公式为:n 如如果果所所给给的的数数据据是是已已经经分分组组的的次次数数分分布布数数列列,则则算算术术平平均均数数的的计算应采用加权算术平均数的形式。计算应采用加权算术平均数的形式。n nn8n2 2、加权算术平均数(适用于分组资料)、加权算术平均数(适用于分组资料)n(为为什什么么由由分分组组资资料料计计算算平平均均指
6、指标标不不能能将将各各组组的的标标志志值值简简单单平平均均?)。n计算公式为:计算公式为:nn式中:式中:f代表各组的代表各组的次数或频数(即各组的单位数)。次数或频数(即各组的单位数)。n比较两个公式,并解释比较两个公式,并解释为什么次数为什么次数f f又称之为权数?又称之为权数?n 平平均均数数的的大大小小不不仅仅取取决决于于各各组组标标志志值值x的的大大小小,同同时还受各组次数时还受各组次数f多少的影响。多少的影响。n 各各组组标标志志值值次次数数的的多多少少在在平平均均数数的的计计算算中中具具有有权权衡衡轻轻重重的的作作用用,因因而而把把各各组组的的次次数数又又称称为为权权数数,用用各
7、各组组的的次次数数去去乘乘以以各各组组的的标标志志值值,就就是是对对各各组组的的标标志志值值进进行行加加权权。所所以以,用用这这种种方方法法计计算算的的算算术术平平均均数数,称称为为加加权权算算术平均数。术平均数。n 试想,如果各组次数完全相同,结果会怎样?试想,如果各组次数完全相同,结果会怎样?n11n实务中给定的权数资料,既可以是绝对数,也可以实务中给定的权数资料,既可以是绝对数,也可以是相对数,即频率或称权数系数。当权数为相对数时,是相对数,即频率或称权数系数。当权数为相对数时,加权算术平均数的表达公式如何呢?加权算术平均数的表达公式如何呢?n nnn算术平均数既可依据单项变量数列计算也
8、可依据组距算术平均数既可依据单项变量数列计算也可依据组距数列计算;既可根据绝对数计算,也可根据相对数或平数列计算;既可根据绝对数计算,也可根据相对数或平均数进行计算。均数进行计算。n 1212n n 如如果果根根据据相相对对数数或或平平均均数数进进行行计计算算,则则应应注注意意的的问题是问题是:n(1 1)只能用加权形式计算;只能用加权形式计算;n(2 2)权数的选择问题。权数的选择问题。n 例例 见表所给资料。见表所给资料。n 表一表一 某市某局某市某局1818个企业税收计划完成情况个企业税收计划完成情况n 计划完成(计划完成(%)企业数(个)企业数(个)计划任务数(万元)计划任务数(万元)
9、n 9595100 5 100100 5 100n 100 100105 8 1200105 8 1200n1051103100n110以上以上260n合合计计181460n要求:计算要求:计算18个企业税收收入平均计划完成程度。个企业税收收入平均计划完成程度。n14n 计算表计算表n 计划完成(计划完成(%)组中值组中值x x(%)计划任务数计划任务数f f(万元)万元)实际完成数实际完成数xfxf(万元)万元)n 9595100 97.5 100 97.5100 97.5 100 97.5n 100 100105 102.5 1200 1230.0105 102.5 1200 1230.0
10、n105110107.5100107.5n110以上以上112.56067.5n合合计计14601502.5n计算栏计算栏nn解:平均计划完成程度解:平均计划完成程度x x=xf/xf/f fn=1502.5/1460=102.91%n15n表二表二(用于计算调和平均数用于计算调和平均数)n n 计划完成(计划完成(%)企业数(个)企业数(个)实际完成数(万元)实际完成数(万元)n 9595100 5 97.5100 5 97.5n 100 100105 8 1230.0105 8 1230.0n1051103107.5n110以上以上267.5n合合计计181502.5n要求同上:计算要求同
11、上:计算18个企业税收收入平均计划完成程度。个企业税收收入平均计划完成程度。n16n计算表计算表n计划完成(计划完成(%)组中值组中值x x(%)实际完成数实际完成数m 计划任务数计划任务数m/m/xn (万元)万元)(万元)万元)n 9595100 97.5 100 97.5 97.597.5 100 100 n100100105 102.5 1230.0 1200 105 102.5 1230.0 1200 105110107.5107.5100n110以上以上112.567.560n合合计计1502.51460nn计算栏计算栏n解:解:=1502.5/1460=102.91%nnn17n
12、(三三)算术平均数的数学性质算术平均数的数学性质n 1 1、各个变量值与算术平均数的离差总和等于零。各个变量值与算术平均数的离差总和等于零。n表达式表达式:(x-x)=0或或(x-x)f=0n2、各各个个变变量量值值与与算算术术平平均均数数的的离离差差平平方方总总和和为为最最小小值。值。n表达式表达式:(x-x)2=最小最小nn或或 最小最小n n 18 二、调和平均数二、调和平均数n又又称称“倒倒数数平平均均数数”,它它是是根根据据各各变变量量值值的的倒倒数数来来计计算算的的平平均均数数。具具体体地地讲讲,调调和和平平均均数数是是各各变变量量值值倒数的算术平均数的倒数。倒数的算术平均数的倒数
13、。n(一)调和平均数的计算方法(一)调和平均数的计算方法n 1 1、简单调和平均数(适用于未分组资料)简单调和平均数(适用于未分组资料)n计算公式为:计算公式为:n x xH=n(1/x1+1/x2+1/xn)/n(1/(1/x)n19n2 2、加权调和平均数(适用于分组资料)、加权调和平均数(适用于分组资料)n 计算公式计算公式 :n n以以m m加权的调和平均数与以加权的调和平均数与以f f加权的算术平均数的关系加权的算术平均数的关系.n 2020 n因为,各组标志总量因为,各组标志总量 m=m=xfxfn所以,各组的单位数(次数)所以,各组的单位数(次数)f=m/xf=m/xn则:则:x
14、=x=xf/xf/f f=m/m/m/x=m/x=x xH Hn 由二者的关系式得出,加权调和平均数是加权算由二者的关系式得出,加权调和平均数是加权算术平均数的变形,二者在经济内容、计算结果上是完术平均数的变形,二者在经济内容、计算结果上是完全一致的,仅计算形式不同而已。全一致的,仅计算形式不同而已。n 2121n(二)加权算术平均数和加权调和平均数的采用(二)加权算术平均数和加权调和平均数的采用n 1 1、由平均数计算、由平均数计算n 举例举例 以某种蔬菜为例,资料见表3-4。n 某种蔬菜的有关资料某种蔬菜的有关资料 n 表一表一 n 价格价格x x(元元/公斤)公斤)采购金额采购金额m m
15、(元)元)n 早早 市市 0.50 10.000.50 10.00n 中中 市市 0.45 13.500.45 13.50n 晚晚 市市 0.40 8.000.40 8.00n 合合 计计 31.5031.50 n22n 表二表二 n 价格价格x x(元元/公斤)公斤)采购量采购量f f(公斤)公斤)n 早早 市市 0.50 200.50 20n 中中 市市 0.45 300.45 30n 晚晚 市市 0.40 200.40 20n 合合 计计 70 70n 分别依据表一和表二的资料,计算该种蔬菜的平均价分别依据表一和表二的资料,计算该种蔬菜的平均价格。格。n 思路:思路:平均每公斤价格平均每
16、公斤价格购买金额购买金额/采购量采购量 =0.45=0.45(元(元公斤)公斤)n 23n2 2、由相对数计算、由相对数计算n 例题见前述计划完成程度的计算。例题见前述计划完成程度的计算。n 结论:结论:在由相对数或平均数计算平均数时,在什么在由相对数或平均数计算平均数时,在什么情况下采用加权算术平均数或加权调和平均数,情况下采用加权算术平均数或加权调和平均数,首先首先要要明确所求平均指标的分子、分母是什么,明确所求平均指标的分子、分母是什么,而后而后再根据所再根据所掌握的资料条件来选择。掌握的资料条件来选择。如果如果所掌握的权数资料是计算所掌握的权数资料是计算公式的分母数值时,则直接采用加权
17、算术平均数的形式;公式的分母数值时,则直接采用加权算术平均数的形式;如果如果所掌握的权数资料是计算公式的分子数值时,则需所掌握的权数资料是计算公式的分子数值时,则需采用加权调和平均数的形式。采用加权调和平均数的形式。n 2424 三、几何平均数三、几何平均数n几几何何平平均均数数是是计计算算平平均均比比率率或或平平均均发发展展速速度度的的最最适适用用的一种方法。的一种方法。n 凡凡是是变变量量值值的的连连乘乘积积等等于于总总比比率率或或总总速速度度的的现现象象,都采用几何平均数反映现象总体的一般水平。都采用几何平均数反映现象总体的一般水平。n根据所掌握资料的不同,也有简单和加权两种形式根据所掌
18、握资料的不同,也有简单和加权两种形式:n(一)简单几何平均数(一)简单几何平均数n 是是n n个变量值连乘开个变量值连乘开n n次方根的结果。次方根的结果。nn25三、几何平均数三、几何平均数n(二)加权几何平均数(二)加权几何平均数n 2626四、切尾均值n切尾均值是一种新的集中趋势测度方法,在大赛中切尾均值是一种新的集中趋势测度方法,在大赛中得到广发应用。得到广发应用。切尾均值切尾均值是去掉大小两端的若干数值后计算是去掉大小两端的若干数值后计算中间数中间数据的均值据的均值。27四、切尾均值n式中:式中:n表示观察值的个数;表示观察值的个数;n表示切尾系数表示切尾系数,n各观察值是经排队后由
19、小到大形成的顺序统各观察值是经排队后由小到大形成的顺序统计量值。计量值。n 28 五、位置平均数n(一)众数(一)众数n(二)中位数(二)中位数n(三)分位数(三)分位数n(一)众数一)众数n1、众数的概念众数的概念n 众众数数是是总总体体中中出出现现次次数数最最多多的的标标志志值值,即即最最普普遍遍、最最常常见见的的标标志志值值。众众数数只只有有在在总总体体单单位位较较多多而而又又有有明明确确的的集集中中趋趋势势的的资资料料中中才才有意义。有意义。n2、众数的确定、众数的确定n 单单项项数数列列中中,出出现现次次数数最最多多的的那那个个组组的的标标志志值值就就是是众众数数。若若在在数数列中有
20、两组的次数是相同的,且次数最多,则就是双众数或复众数。列中有两组的次数是相同的,且次数最多,则就是双众数或复众数。n 组距数列中组距数列中,众数的确定要分两步:众数的确定要分两步:n第一步,用直接观察法确定众数组即次数最多的那一组;第一步,用直接观察法确定众数组即次数最多的那一组;n第第二二步步,计计算算众众数数的的近近似似值值。比比较较精精确确的的方方法法是是用用众众数数组组次次数数与与相相邻两组次数之差来推算众数的近似值。邻两组次数之差来推算众数的近似值。n29五、位置平均数五、位置平均数n众数一般有两种计算公式:众数一般有两种计算公式:n1n下限公式:下限公式:M0=L+dn1+2n上限
21、公式:上限公式:M0=U-2/(1+2)dn n 组距数列众数的确定一般与其相邻两组的频数分组距数列众数的确定一般与其相邻两组的频数分布有关。若众数组前一组的频数比众数组后一组的频布有关。若众数组前一组的频数比众数组后一组的频数多,则众数小于众数组的组中值;反之,众数大于数多,则众数小于众数组的组中值;反之,众数大于其组中值。若众数组前一组的频数等于其后一组的频其组中值。若众数组前一组的频数等于其后一组的频数,则众数就是众数组的组中值。数,则众数就是众数组的组中值。n31n五、位置平均数五、位置平均数n(二)中位数(二)中位数n1、中位数的概念中位数的概念n 中中位位数数是是将将总总体体单单位
22、位某某一一变变量量的的各各个个变变量量值值按按大大小小顺序排列,处在数列中间位置的那个变量值就是中位数。顺序排列,处在数列中间位置的那个变量值就是中位数。n2 2、中位数的确定、中位数的确定n(1 1)未分组资料确定中位数未分组资料确定中位数n在资料未分组的情况下,将各变量值按大小顺序排列后,在资料未分组的情况下,将各变量值按大小顺序排列后,n 首先首先,确定中位数的位置,即,确定中位数的位置,即(n+1)/2(n+1)/2;n 然后然后,根据中点位置确定中位数。,根据中点位置确定中位数。n n 3232(二)中位数(二)中位数n2 2、中位数的确定、中位数的确定n 单项数列单项数列 n(2
23、2)分组资料确定中位数分组资料确定中位数 组距数列组距数列n 由单项数列计算中位数由单项数列计算中位数:n 首先,计算各组的累积次数;首先,计算各组的累积次数;n 然然后后,根根据据中中点点位位置置(总总次次数数/2/2)在在累累积积次次数中确定中位数所在组,以确定中位数。数中确定中位数所在组,以确定中位数。(二)中位数(二)中位数n2 2、中位数的确定、中位数的确定n(2 2)分组资料确定中位数分组资料确定中位数n由组距数列计算中位数由组距数列计算中位数(情况要复杂一些):(情况要复杂一些):n分三步骤:分三步骤:n第一步,计算累积次数;第一步,计算累积次数;n第二步,计算中位数位置(总次数
24、第二步,计算中位数位置(总次数/2/2),以),以 确定中位数组;确定中位数组;n第三步,用比例推算法估计中位数的近似值。第三步,用比例推算法估计中位数的近似值。组距数列中位数的计算公式组距数列中位数的计算公式n下限公式下限公式:n上限公式上限公式:n下限公式的比例推算法:下限公式的比例推算法:累积次数累积次数Sm-1=180中点位置中点位置 f/2=215nn中位数所在组次数中位数所在组次数fm=180n215-180=35n中位数在该组分摊组距的比例为:中位数在该组分摊组距的比例为:35/180五、位置平均数n(三)分位数(三)分位数n中位数是将统计分布从中间分成面积相等的两中位数是将统计
25、分布从中间分成面积相等的两部分(即两边数据个数相等)。与中位数性质部分(即两边数据个数相等)。与中位数性质相似的还有相似的还有四分位数四分位数n十分位数十分位数n百分位数百分位数五、位置平均数n(三)分位数(三)分位数n1、四分位数、四分位数n又称四分位点,它是通过又称四分位点,它是通过3个点将全部数据个点将全部数据等分为等分为4部分,其中每部分包含部分,其中每部分包含25%的数据,的数据,处在分位点上的数值就是四分位数处在分位点上的数值就是四分位数。n很显然,其中中间的四分位数就是中位数。所很显然,其中中间的四分位数就是中位数。所以,通常所说的的四分位数是指第一个和第三以,通常所说的的四分位
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 集中 离散
限制150内