《实用统计学第3章.ppt》由会员分享,可在线阅读,更多相关《实用统计学第3章.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 统计数字的描述统计数字的描述 三个统计学家出去打猎,遇到一头很大的鹿。第一个统计学家开枪,但没有打中,偏离左边一英寸。第二个统计学家开枪也没有打中,偏离右边一英寸。第三个统计学家没有开枪,却欢呼雀跃大声喊道:“从平均的意义说我们打中了”。佚名主要内容n3.1总量指标n3.2相对指标n3.3平均指标n3.4标志变异指标n3.5分布的偏态与峰度3.1总量指标3.1.1 总量指标的概念和作用概念:概念:总量指标是用来表明在一定时间、地点、条件下某种总量指标是用来表明在一定时间、地点、条件下某种社会经济现象的总体规模或水平的指标,又称社会经济现象的总体规模或水平的指标,又称绝对指标绝对指
2、标。作用:作用:(1)反映国情、国力和企事业单位人、财、物的状况;(2)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;(3)是计算相对指标和平均指标的基础。3.1.2 总量指标的分类n按反映总体的内容不同总体标志总量:总体中每个单位的某一数量标志值的总和,用来说明总体数量标志的规模和水平。如企业职工工资总额、企业总资产、GDP、进出口贸易总额。总体单位总量:总体内全部单位的总计数,用来说明总体本身规模的大小。如企业员工工人数、企业机器设备总数。n按反映的时间状况不同时点指标:反映总体在某一时点上的总量指标;如截至2007年5月1日,全球总人口为60.345亿人。时期指标:
3、反映总体在一段时间内的总量指标。如2007年度我国GDP增量为246619亿元。n按采用的计量单位不同实物量指标:根据事物、现象的属性、特点和用途,采用自然单位、度量衡单位、标准实物量单位和复合单位计量的总量指标。如,我国2007年全年能源消费总量26.5亿吨标准煤,比上年增长7.8%。煤炭消费量25.8亿吨,增长7.9%;原油消费量3.4亿吨,增长6.3%;天然气消费量673亿立方米,增长19.9%;价值量指标:货币作为计量单位而得到的总量指标。如,2007年末我国国家外汇储备15282亿美元,比上年末增加4619亿美元。劳动量指标:以劳动时间作为计量单位的总量指标。3.2相对指标相对指标3
4、.2.1 相对指标的概念相对指标是两个有联系的指标相比的比率,用以反相对指标是两个有联系的指标相比的比率,用以反映现象间的数量联系程度,又叫映现象间的数量联系程度,又叫相对数相对数。举例:n我院招生计划完成率100%;n08年天津住宅开发总面积中,普通住宅、公寓、别墅各占80%、13%和7%,相对比例关系为8:1.3:0.7;n07年年末全国总人口为132129万人。全年出生人口1594万人,出生率为12.10;死亡人口913万人,死亡率为6.93;自然增长率为5.17。3.2.2 相对指标的种类 1计划完成相对数(计划完成率)2结构相对数 3比例相对数 4比较相对数 5强度相对数 6动态相对
5、数 1计划完成相对数也叫计划完成率,是将本期实际完成数与本期计划数相比的比率,用来说明一定时期内某种计划的完成程度,一般用百分数表示:几种情况:n两个总量指标之比,如某企业计划实现利润2000万,实际实现1500万,计划完成相对数为75%。n两个相对指标之比,如某企业成本利润率计划提高5%,实际提高了8%,则计划完成程度为(1+8%)/(1+5%)=102.9%。n两个平均指标之比,如某地区计划人均住房面积提高到30平米,实际提高到35平米,则计划完成程度为35/30=117%n对长期计划完成情况的检查。(自学)(同一总体)2结构相对数n结构相对指标是在分组的基础上,总体中各组成部分的数值与总
6、体数值之比,用以表示现象内部的结构情况,即各组成部分占总体的比重。结构相对指标通常用百分数来表示,同一总体各结构相对指标总和应为100%。其计算公式为:n举例:07年天津住宅开发总面积中,普通住宅、公寓、别墅各占80%、13%和7%。07全年国内生产总值246619亿元,第一产业增加值28910亿元,第二产业增加值121381亿元,第三产业增加值96328亿元,分别为:11.72%、49.22%、39.06%(同一总体)3比例相对数n在同一总体内不同部分之比。用于对比总体内部不同部分之间的比例关系。n举例:2007我国全年货物进出口总额21738亿美元,其中,货物出口12180亿美元,货物进口
7、9558亿美元,比例为127.41%。2007年全国出生人口性别比(男性比女性)为120.2%,这个数字在1982年为108.5%,1987年为110.9%,1990年为111.3%,1995年115.6%,2000年为116.9%。我国2007年三次产业产值结构为:11.7:49.2:39.1。(同一总体)(不同总体)4比较相对数n将同类(同一)指标在不同地区、单位之间作静态对比的比率。它可以说明同一时期内某种同类现象在不同单位之间同一时期内某种同类现象在不同单位之间的差异程度,一般用系数或百分数来表示。其计算公式为:注意分子、分母必须是同一性质的总量指标、相对指标或平均指标举例(2007年
8、)国名GDP(亿美元)人均GDP(美元)GDP比较人均GDP比较美国日本德国中国13980052900328003010046280414803971022804.6 4.6 1.8 1.8 1.1 1.1 1 120.3 20.3 18.218.217.4 17.4 1 15.强度相对指标 n由两个性质不同、不属于同一总体而又有联系的同一时期的指标值相比的比率,用以说明现象的强度、密度和普遍说明现象的强度、密度和普遍程度程度,其计算公式为:n举例:07年年末全国总人口为132129万人。全年出生人口1594万人,出生率为12.10;死亡人口913万人,死亡率为6.93;自然增长率为5.17。
9、人口密度138.02人/平方公里。n07年我国人均国民生产总值2280美元。城镇居民人均可支配收入13786元,农村居民人均纯收入4140元。n2006年我国我国军费开支占财政收入的7.57%,占当年GDP的1.41%。(不同总体)6.动态相对指标n不同时期同类指标对比得到的比率,用以说明社会经济现象的在时间上的运动、发展和变化。通常将用来作为对比标准的时期称为基期,而将需要研究并同基期对比的时期称为报告期。其计算公式为:n举例:今年1-11月,全国财政收入累计48177.12亿元,完成预算的109.3%,比去年同期增长33.5%,预计今年全年财政收入将达到5.1万亿元左右,比上年增长31%左
10、右。六种相对指标的比较六种相对指标的比较不同时期比较同一时期比较不同现象比较同类现象比较动 态相对数强 度相对数不同总体比较同一总体中比 较相对数部分与部分比较部分与总体比较实际与计划比较比例相对数结构相对数计划完成相对数收入增收入增长率长率人均人均GDP/人人口密度口密度各国各国GDP比比国民经济国民经济三次产业三次产业比例比例第三产业第三产业占国民经占国民经济的比重济的比重就业计划就业计划完成程度完成程度综合练习:我国近年来财政收入增长状况项目2007年2006增长率相对数财政收入(亿元)总计51304.0338760.233.40133.4133.4:100100税收收入税收收入4561
11、2.9988.91%34125.988.04%33.6688非税收收入5691.0411.09%4634.3211.96%22.8011GDP(亿元)24661920940717.77-人均财政收入(元)人均财政收入(元)3882.873882.872933.512933.5132.36-财政收入占财政收入占GDPGDP比比0.210.210.190.19-综合练习:我国近年来财政收入增长状况项目2007年2006增长率相对数财政收入(亿元)总计51304.0338760.233.4033.40133.4133.4:100100税收收入税收收入45612.9988.91%34125.988.0
12、4%33.6688非税收收入5691.0411.09%4634.3211.96%22.8011GDP(亿元)24661920940717.77-人均财政收入(元)人均财政收入(元)3882.873882.872933.512933.5132.36-财政收入占财政收入占GDPGDP比比0.210.210.190.19-动态相对数强 度相对数强度相对数结构相对数比例相对数主要内容n3.1总量指标n3.2相对指标n3.3平均指标n3.4标志变异指标n3.5分布的偏态与峰度3.3平均指标3.3.1平均指标的概念和作用n对统计数据分布的特征,常从以下三方面来进行描述和测度:分布的集中趋势集中趋势,反映各
13、数据集中在什么水平上;分布的离散程度离散程度,反映各数据离开其中心值的趋势;分布的偏态和峰度偏态和峰度,反映数据分布的形态特征。n集中趋势(CentralTendency)反映的是一组数据向某一中心值靠拢的倾向。测度集中趋势也就是寻找数据一般水平的代表值或中心值。n常用的度量集中趋势的特征量有数值平均数数值平均数(算术平(算术平均数、调和平均数、几何平均数)均数、调和平均数、几何平均数)和位置平均数位置平均数(众数和中位数)(众数和中位数)两大类。n数值平均数数值平均数,根据所有变量值来计算,即统计数列中任何一项数据的变动,都将在一定程度上影响到平均数结果。n位置平均数位置平均数,是总体中处于
14、特殊位置上的个别单位或部分单位的标志值来确定的代表值,某些数据的变动,不一定会影响到位置平均数的水平。n身高的数值平均数与位置平均数(2)平均数的作用用来比较同类现象在不同空间中的发展水平。各国人口平均年龄;各地平均工资水平;用来反映总体在不同时间状态下的发展过程和趋势。我国历年居民家庭平均消费水平变化用以分析现象之间的依存关系。工人劳动生产率VS平均单位产品成本利用样本平均数推算总体平均数。根据1000个日本人的身高,推断日本国民的平均身高3.3.2数值平均数的种类和计算方法数值平均数的种类和计算方法n算术平均数(Arithmeticmean)n调和平均数(Harmonicmean)n几何平
15、均数(Geometricmean)1.算术平均数(Arithmeticmean)基本算式为:n简单算术平均数n加权算术平均数以各标志值与其相应的各组单位数(次数)作乘积,并加总得到总体标志总量,同时将各组单位数加总求出总体单位总量,最后二者相除即可 n单项数列计算加权算术平均数直接对各组变量值进行加权平均计算(p64例3-10)n组距数列计算加权算术平均数需要先求出各组变量值的组中值,然后,对组中值进行加权平均计算。n举例:根据某日某车间200名工人加工零件的资料,计算平均每个工人的零件生产量,资料见下表。按零件数分组(个)职工人数f(人)人数比重组中组中值值xxf40505060607070
16、80809020408050100.100.200.400.250.054555657585900220052003750850合计2001.0012900某车间职工加工零件平均数计算表【解】根据公式,得:或算术平均数的数学性质算术平均数的数学性质n(1)各变量值与其平均数离差之和等于零,即:n(2)各变量值与其平均数离差平方之和为最小值,即:2.调和平均数(Harmonicmean)倒数平均数倒数平均数,是各变量值倒数的算术平均数的倒数,分为简单调和平均数和加权调和平均数两种形式。简单调和平均数简单调和平均数适用于未分组数列未分组数列。其计算公式如下:式中:调和平均数;n变量值个数;Xi各变
17、量值。加权调和平均数。加权调和平均数适用于分组数列分组数列。以标志值的标志总量作为权数,其公式为:式中:各组的标志总量、权数。简单调和平均数的计算n假如某种蔬菜在早、中、晚市的每市斤的单价分别为0.5元、0.4元、0.2元,若早、中、晚市各买一市斤,其平均价格用简单算术平均数计算,结果是0.37(=0.5+0.4+0.2/3)元。但若早、中、晚市各买一元钱,其平均价格是多少?n【解】计算方法应先把总重量计算出来,然后再将总金额除以总重量。即:用公式表达即为:加权调和平均数的计算n例:仍用前面对蔬菜计算平均价格为例,如果现在早、中、晚市所花钱数不再是一元钱,而是如下表的情形,求购进的该种蔬菜的平
18、均价格。调和平均数计算表时间时间单价(元单价(元/斤)斤)x所花钱数(元)所花钱数(元)m购买量(斤)购买量(斤)m/x早市早市中市中市晚市晚市0.50.40.243287.510合计合计925.5【解】平均价格元/斤3.几何平均数(Geometricmean)n几何平均数是n个变量值连乘积的n次方根。几何平均数是计算平均比率和平均速度最适用的一种方法。1.简单几何平均数简单几何平均数或:或:式中:几何平均数;X变量值;n变量值的个数;连乘符号。加权几何平均数加权几何平均数。当掌握的数据资料为分组资料,且各个变量值出现的次数不相同时,应采用加权几何平均数的公式计算:式中:fi变量值的次数。加权
19、几何平均数也可以采用对数的方法来计算:简单几何平均数简单几何平均数n【例】某产品生产需要经过六道工序,每道工序的合格率分别为98%、91%、93%、98%、98%、91%,求这六道工序的平均合格率。n【解】因为成品的合格率等于各道工序产品合格率的连乘积,所以要用几何平均数来计算这六道工序的平均合格率。即:加权几何平均数加权几何平均数n【例】某市从1990年以来的14年,各年的工业增加值的年增长率资料如表,计算这14年的平均增长率。几何平均数计算表n【解】首先根据公式计算平均发展速度:时时间间年数年数工业增加值的年增长率工业增加值的年增长率1990-1993年年1994-1998年年1999-2
20、003年年45510.28.79.6合合计计14再还原成平均增长率平均增长率=平均发展速度-100%=109.45%-100%=9.45%学生:老师,我可不可以不转这个弯子,直接对增长率进行几何平均?教师:不行,因为增长率不一定都是正的,有时会出现负数,给开方造成困难。为了能正确地解释最终的结果,我们还是要绕这个弯子。3.3.3 位置平均数的分类与计算位置平均数的分类与计算1.众数(Mode)n众数是指在现象总体中出现次数最多的那个标志值标志值。如果所有标志值出现的次数相等,此时没有众数;如果有两个标志值出现的次数相等,而且最多,称为复众数。n用众数代表现象的一般水平的前提:第一,总体单位数应
21、足够多;第一,总体单位数应足够多;第二,标志值的分布有明显的集中趋势,即在某标志第二,标志值的分布有明显的集中趋势,即在某标志值上集中的单位特别多。值上集中的单位特别多。众数的求法由单项式数列确定众数。在单项式数列中,哪一组变量值出现的次数最多,对应的变量值即为众数。P70例3-16由组距式数列计算众数。组距式数列求众数的方法如下:1.确定众数组,根据次数的多少或比重的大小判断众数所在的组。2.根据内插近似公式计算众数近似值。下限公式:上限公式:式中:众数;众数组的下限;众数组的上限;d 众数组的组距;1众数组次数与上一组次数之差;2众数组次数与下一组次数之差。由组距式数列计算众数按零件数分按
22、零件数分组组(个个)职工人数职工人数(人人)f405050606070708080902040805010合合计计200某车间职工加工零件平均数计算表按下限公式:按上限公式:首先确定众数组:60702.中位数(Median)n中位数指将总体单位的某一数量标志的各个变量值(即标志值)按大小顺序排列后居于变量数列中间的变量值。中位数也叫位置平均数。通常用表示。n中位数就是将某变量的全部数据均等地分为两半的那个变量值。其中,一半数值小于中位数,另一半数值大于中位数。中位数的求法由未分组资料确定中位数。按大小顺序排列各变量值,然后据下式确定中位数的位置:中位数位置:nn为奇数时,居位置的变量值即为中位
23、数;n当n为偶数时,第位置前后两项的算术平均数即为中位数。P72例3-18由变量数列确定中位数。确定中位数的位置为,通过计算的累计次数来找中位数,累计次数从最低水平组或最高水平组开始均可。对于单项式数列,需先计算出各组的累计次数(通常向上累计),再以确定中点位置,找出中位数。对于是组距式数列,利用仅能找到中位数所在的变量值的范围,还需利用内插近似公式确定具体的中位数。下限公式:上限公式:式中:中位数;L、U中位数所在组的下限与上限;fm中位数所在组的次数;f各组的次数总和;Sm-1中位数所在组以前各组的累计次数(即中位数所在组以前一组的向上累计次数);Sm+1中位数所在组以后各组的累计次数(即
24、中位数所在组以后一组的向下累计次数);d中位数所在组的组距。由单项数列确定中位数由单项数列确定中位数 n【例】某班同学按年龄分组资料如表所示,求中位数。n年龄中位数的位置为(50+1)/2=25.5,说明位于第25与第26位同学之间,根据累计次数可确定中位数为第三组的变量值19岁。(累计次数中第一个大于 的累计次数对应的那一组)年龄(岁)年龄(岁)学生人数学生人数较小制累计次数较小制累计次数较大制累计次数较大制累计次数1718192021582692513394850504537112合合计计50由组距数列确定中位数由组距数列确定中位数按零件数分组(个)职工人数(人)向上累计次数/向下累计次数
25、40505060607070808090204080501020601401902002001801406010合计200【解】首先根据以上方法,确定中位数所在组,然后计算中位数按下限公式计算:按上限公式计算:中位数所在组以前一组中位数所在组以前一组的向上累计次数的向上累计次数中位数所在组以后一组中位数所在组以后一组的向下累计次数的向下累计次数众数(众数(M0)、中位数()、中位数(Me)和算术平均数)和算术平均数()比较比较n数据分布是对称的,则 。如图(a)所示。n数据左偏(负偏)分布,说明数据中偏大的数较多,三者之间的关系表现为 ,如图(b)所示。n数据是右偏(正偏)分布,说明数据中偏小
26、的数较多,则 ,如图(c)所示。频率分布曲线提示:左偏、右偏经常会弄反,大家记住:尾巴在左就左偏;尾巴在右就右偏,另外,Y轴表示次数,X轴表示标志值,所以比较三个指标的大小,是看X轴,而不是Y轴。n如果次数分布不对称,呈偏态曲线时,无论是左偏还是右偏,中位数总是介于算术平均数和众数之间,三者之间的关系为:众数、中位数和算术平均数的特点与应用场合众数、中位数和算术平均数的特点与应用场合(1)众数是一组数据分布的峰值,是位置代表值。其优点是易于理解,不受极端值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比算术平均数要好。其特点是具有不唯一性,对于一组数据可能有一个众数
27、,也可能有两个或多个众数,也可能没有众数。(2)中位数是处于一组数据中间位置上的代表值,也是位置代表值,其特点是不受极端值的影响。对于具有偏态分布的数据,中位数代表性要比算术平均数好。(3)算术平均数由全部数据的计算所得,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,算术平均数的代表性较差。作为算术平均数变形的调和平均数和几何平均数是适用作为算术平均数变形的调和平均数和几何平均数是适用于特殊数据的代表值,调和平均数主要用于于特殊数据的代表值,调和平均数主要用于不能直接计算算术不能直接计算算术平均数的数据平均数的数据,几何平均数则
28、主要用于,几何平均数则主要用于计算比例数据的平均数计算比例数据的平均数,这两个测度值与算术平均数一样,易受极端值的影响。这两个测度值与算术平均数一样,易受极端值的影响。3.3.4 应用平均指标的原则应用平均指标的原则1必须是同质的量方可平均;2总平均数与组平均数结合分析;3根据具体条件选择平均方法;4平均数与典型值和分配数列结合分析;5集中趋势与离散趋势结合分析主要内容n3.1总量指标n3.2相对指标n3.3平均指标n3.4标志变异指标3.4标志变异指标n3.4.1标志变异指标的概念和作用标志变异指标的概念和作用n概念:标志变异指标又称离散程度指标或标志变动度。是反映同质总体各单位标志值的差异
29、程度的指标。n与平均指标从不同角度反映总体的数量特征。n作用:标志变异指标是衡量平均数代表性代表性的尺度,与平均数互为补充。标志变异指标是反映社会经济活动过程均衡性、节奏性和协调性的重要指标。例如各地城乡收入差距:社会财富增值在城乡分配是否协调。在进行抽样调查时,标志变异指标是计算抽样误差和确定推计算抽样误差和确定推断准确程度断准确程度的必不可少的依据。3.4.2标志变异指标的计算及其应用标志变异指标的计算及其应用n全距全距n平均差平均差n标准差标准差n离散系数离散系数说明:1.变异指标与平均值的代表性方向相反。2.标志变异指标可分作反映离散程度的绝对指标(前三者,有量纲)和相对指标(离散系数
30、,无量纲)。1.全距(Range)n也叫极差极差,是总体单位最大标志值与最小标志值之间的距离,它反映了总体标志值的变动范围。n其计算公式如下:RXmaxXminn组距式数列计算全距时,通常通过下列公式近似求得:R=UmaxLmin式中:Umax组距数列中最高组的上限;Lmin组距数列中最低组的下限。n举例:求以下组距数列的全距。分组标志分组标志10以下以下1015154040以上以上R=(40+25)-(10-5)=602.平均差(MeanAbsoluteDeviation)n也称平均离差(A.D),是各变量值与其平均数离差绝对值各变量值与其平均数离差绝对值的平均数的平均数,通常用或A.D.表
31、示。n简单式平均差。在资料未分组时,采用简单式计算平均差:n加权式平均差。如果资料已经分组,并形成分配数列,应采用加权的方法计算平均差:按零件数分组(个)职工人数f组中值x4050506060707080809020408050104555657585-19.5-9.50.510.520.539038040525205合计2001540例:根据分配数列求平均差解:先求平均值:再算平均差:3.标准差(Standarddeviation)n又称均方差均方差,它是总体各单位变量值与其平均数离差平方的平均数的方根,通常用表示。它是测度数据离散程度的最主要方法。标准差是具有量纲的,它与变量值的计量单位相
32、同。n根据掌握的数据资料不同,有简单式和加权式两种。1.简单式用于未经分组的数据资料,公式如下:2.加权式用于分组整理的数据计算标准差,公式如下:样本标准差n即样本各变量值与其算术平均数离差平方的算术平均值的平方根。1.简单式2.加权式/为什么样本标准差的分母上要减去1呢?/因为样本最终是要用来推断总体的,所以它质量的好坏直接推断的精确度,在第六章中我们会提到点估计的优良性,那时会说明一切。方差(Variance)n方差(Variance)是各变量值与其算术平均数离差平方和的平均数,即是标准差的平方,用表示总体的方差;用表示样本的方差。n1.简单式n2.加权式全距、平均差和标准差,用来反映数据
33、离散程度依次灵敏(或优良)4.离散系数(Coefficientofvariation)n极差、平均差和标准差都是反映数据分散程度的绝对值,其数据的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。n因此,对于平均数不等或计量单位不同的不同组别的变量值,不能直接用离散程度的绝对指标比较其离散程度。n为了消除变量平均数不等和计量单位不同对离散程度测度值的影响,需要计算离散程度的相对指标,即离散系数,其一般公式是:n离散系数也称为标志变异系数标志变异系数,包括全距系数、平均差系数
34、和标准差系数。离散系数一般用百分数来表示,也可用系数或倍数表示。全距系数()。是总体单位中最大标志值与最小标志值之比,通常以系数或倍数表示。平均差系数(VA.D.)。是平均差与其算术平均数之比。标准差系数(V)。是标准差与其算术平均数之比。Excel的描述统计分析功能的描述统计分析功能n统计描述语言包括表格、图形和描述统计量等等。Excel拥有强大图表制作功能为进行描述统计分析提供了技术支撑,它还提供了大量测算描述统计量的函数帮助我们完成描述统计分析的绝大多数计算,另外还有数据分析工具,可以让我们一次性取得常用的描述统计量。(一)反映集中趋势的描述统计量(一)反映集中趋势的描述统计量1.算术平
35、均数算术平均数是数据集中趋势的最主要的统计描述量。n计算算术平均数使用AVERAGE函数,格式为:格式为:AVERAGE(NUMBER1,NUMBER2,)AVERAGE(NUMBER1,NUMBER2,)NUMBER可以是具体的数值,也可以是单元地址或区域名称。2.调和平均数调和平均数(又称倒数平均数)n在实际工作中,由于所获数据不能直接代入算术平均数的公式中计算,在实际工作中,由于所获数据不能直接代入算术平均数的公式中计算,就需要有倒数平均数的形式。就需要有倒数平均数的形式。计算调和平均数使用计算调和平均数使用HARMEANHARMEAN函数,格式为:函数,格式为:HARMEAN(NUMB
36、ER1,NUMBER2,)HARMEAN(NUMBER1,NUMBER2,)3.几何平均数几何平均数是计算平均比率和平均发展速度最适宜的一种方法。计算几何平均数使用GEOMEAN函数,格式为:格式为:GEOMEAN(NUMBER1,NUMBER2,)GEOMEAN(NUMBER1,NUMBER2,)4.中位数中位数是将全部数值按大小顺序排列后居于中间位置的数值。换句话说,中位数把所有的数值一分为二,有一半数值比它小,另一半数值比它大。计算中位数使用MEDIAN函数,格式为:格式为:MEDIAN(NUMBER1,NUMBER2,)MEDIAN(NUMBER1,NUMBER2,)5.众数是在数列或
37、数据区域中出现频率最多的数值。众数是在数列或数据区域中出现频率最多的数值。计算众数使用计算众数使用MODEMODE函数,格式为:函数,格式为:MODE(NUMBER1,NUMBER2,)MODE(NUMBER1,NUMBER2,)1.全距全距(又称极差)是最大值与最小值之差,用“MAX(ARRAY)MINMAX(ARRAY)MIN(ARRAYARRAY)”求得。ARRAY是指原始资料的存放区域,并且前后应该一致。2.平均差平均差是各个数据与其算术平均数离差绝对值的算术平均数。计算平均差使用AVEDEV函数,格式为:格式为:AVEDEV(NUMBER1,NUMBER2,)AVEDEV(NUMBE
38、R1,NUMBER2,)3.标准差标准差用于反映相对于算术平均数的离散程度。计算标准差有两个函数:一是样本标准差STDEV函数,二是总体标准差STDEVP函数。格式为:格式为:STDEVSTDEV或或STDEVP(NUMBER1,NUMBER2,)STDEVP(NUMBER1,NUMBER2,)4.方差方差是标准差的平方,它也是衡量离散程度的重要指标。计算方差有两个函数:一是样本方差VAR函数,二是总体方差VARP函数。格式为:格式为:VARVAR或或VARP(NUMBER1,NUMBER2,)VARP(NUMBER1,NUMBER2,)(一)反映离中趋势的描述统计量(一)反映离中趋势的描述统
39、计量1.偏斜度偏斜度反映以平均值为中心的分布的不对称程度。计算偏斜度使用SKEW函数,格式为:格式为:SKEW(NUMBER1,NUMBER2,)2.峰度峰度反映与正态分布相比某一分布的尖锐度或平坦度。计算峰度使用KURT函数,格式为:格式为:KURT(NUMBER1,NUMBER2,)(一)(一)反映分布趋势的描述统计量反映分布趋势的描述统计量(四)数据分析工具(四)数据分析工具描述统计描述统计Excel解解决方案决方案打开文件或者键入数据,准备好需要计算的数据选择菜单“工具”“数据分析”,打开“数据分析”对话框,见图选择其中的“描述统计”,打开对话框,见图4.5正确填写完相关信息后,点击“
40、确定”,结果将放置在你定义的输出区域小测验一、填空题一、填空题1、统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的_,反映所有数据向其中心值靠拢或聚集的程度;二是分布的_,反映各数据远离其中心值的趋势;三是分布的_,反映数据分布的形状。2、算术平均数有两个重要数学性质:各变量值与其算术平均数的_等于零;各变量值与其算术平均数的_等于最小值。3、在一组数据分布中,当算术平均数大于中位数大于众数时属于_分布;当算术平均数小于中位数小于众数时属于_分布。4、_是各变量值与其均值离差平方的平均数,是测度数值型数据_最主要的方法。5、为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算_
41、;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算_。小测验二、判断题二、判断题1、根据组距式数列计算得到的算术平均数只能是一个近似值。()2、众数的大小只取决于众数组相邻组次数的多少。()3、若已知甲数列的标准差小于乙数列,则可断言:甲数列算术平均数的代表性好于乙数列。()4、如果数据的分布没有明显的集中趋势或最高峰点,众数可能不存在。()答案:答案:1T 2F 3F 4T1T 2F 3F 4T5、若A、B、C三个公司的利润计划完成程度分别为95、100和105,则这三个公司平均的利润计划完成程度应为100。()6、当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,应采用
42、倒数平均数来计算平均比率。()7、投资者连续三年股票投资收益率为4、2和5,则该投资者三年内平均收益率为3.67。()8、离散系数最适合于不同性质或不同水平数列算术平均数代表性的比较。()5T 6F 7F 8T5T 6F 7F 8T小测验三、单项选择题三、单项选择题1、由组距式数列确定众数时,如果众数组相邻两组的次数相等,则()。A众数为零B众数组的组中值就是众数C众数不能确定D众数组的组限就是众数2、受极端数值影响最小的集中趋势值是()。A算术平均数B众数和中位数C几何平均数D调和平均数3、加权算术平均数中的权数为()。A变量值B次数的总和C变量值的总和D次数比重4、标准差系数抽象了()。A
43、总体单位数多少的影响B算术平均数高低的影响C总体指标数值大小的影响D标志变异程度的影响5、某车间三个班生产同种产品,6月份劳动生产率分别为2、3、4(件人日),产量分别为400、500、600件,则该车间平均劳动生产率计算式应为()。ABCD答案:答案:1B 2B 3D 4B 5D1B 2B 3D 4B 5D小测验6、分配数列各组变量值都减少一半,每组次数加1倍,中位数()。A减少一半B增加1倍C增加2倍D不变7、离散程度的测度值愈大,则()A反映变量值愈分散,算术平均数代表性愈差B反映变量值愈集中,算术平均数代表性愈差C反映变量值愈分散,算术平均数代表性愈好D反映变量值愈集中,算术平均数代表
44、性愈好8、甲数列的算术平均数为100,标准差为12.8;乙数列的算术平均数为14.5,标准差为3.7,故()。A两数列算术平均数的代表性相同B乙数列算术平均数的代表性好于甲数列C甲数列算术平均数的代表性好于乙数列D两数列算术平均数的代表性无法比较答案:答案:6A 7A 8C6A 7A 8C小测验四、多项选择题四、多项选择题1、加权算术平均数的大小受下列因素的影响()()()()()。A各组变量值大小的影响B各组频数多少的影响C与各组变量值大小无关D与各组频数多少无关E各组频率多少的影响2、下列现象应采用调和平均数计算的有()()()()()。A已知各组工人月平均工资和相应的组工资总额,求平均工
45、资B已知某企业各车间废品率和废品量,求平均废品率C已知各车间计划完成百分比和计划产量,求平均计划完成百分比D已知各车间工人劳动生产率和产品产量,求平均工人劳动生产率E已知某企业各产品的产量和单位成本,求平均单位成本3、算术平均数是()()()()()。A总体数量特征的代表值B只能根据同质总体计算C总体分布集中趋势的度量D总体分布离中趋势的度量E代表现象发展的一般水平答案:答案:1ABE 2 ABD1ABE 2 ABD(CECE为加权算数平均数)为加权算数平均数)3 ABCE3 ABCE小测验4、比较两组工作成绩:算术平均数甲组小于乙组,标准差甲组大于乙组,则()。A乙组算术平均数代表性高于甲组B甲组算术平均数代表性高于乙组C乙组工作的均衡性好于甲组D甲组工作的均衡性好于乙组E甲组离散程度大于乙组5、将所有变量值都减去10,那么其()。A算术平均数不变B算术平均数减去10C方差不变D标准差不变E标准差系数不变6、将所有变量值都扩大10倍,那么其()。A算术平均数不变B算术平均数扩大10倍C方差不变D标准差不变E标准差系数不变答案:答案:4ACE 5 BCD 6 BE4ACE 5 BCD 6 BERXmaxXmin算数均值全距平均差标准差方差平均差系数标准差系数平均指标离散程度指标离散系数
限制150内