第四章-数据分布特征描述.ppt
《第四章-数据分布特征描述.ppt》由会员分享,可在线阅读,更多相关《第四章-数据分布特征描述.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章数据分布特征的描述描述数据分布特征的指标主要有三大类:一是描述数据分布集中趋势的指标;二是描述数据分布离散程度的指标;三是描述分布偏斜程度的指标。统计指标的分类总量指标(绝对数)数量指标相对指标(相对数)质量指标平均指标(平均数)质量指标l绝对数。现象的规模、水平一般以绝对数形式表现。l相对数。相对数由两个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。l平均数。平均数反映现象总体的一般水平或分布的集中趋势。第一节 总量指标和相对指标一、总量指标(一)总量指标的概念和作用总量指标是反映现象在具体时间、地点、条件下
2、的总规模或总水平的统计指标。总量指标也称为绝对指标或绝对数。总量指标在社会经济统计中的作用:可以反映社会经济和企业的基本情况,反映一个国家的基本国情和国力。它是计算相对指标、平均指标等描述指标的基础。是制定政策、编制计划、实行社会经济管理的基本依据。(二)总量指标的种类1、总量指标按其反映的时间状况不同,分为时期指标和时点指标。时期指标反映现象在某一时期发展过程的总数量;时点指标则反映现象在某一时刻上的状况总量。2、总量指标按计量单位不同,分为实物量指标、价值量指标和劳动量指标。实物量指标是以所反映现象的实物单位为计量单位的总量指标;价值量指标是以货币为计量单位的总量指标;劳动量指标是以劳动时
3、间为计量单位的总量指标。时期指标和时点指标的不同特点:时期指标的数值是连续计数的;时点指标的数值则是间断计数的。时期指标具有累加性;时点指标则不具有。时期指标数值的大小受时期长短的制约;时点指标数值的大小与时点的间隔长短无直接关系。二、相对指标(一)相对指标的概念和作用相对指标又称相对数,它是两个有联系的指标数值对比的结果。注:用来对比的两个数既可以是绝对数,也可以是平均数和相对数。相对指标的主要作用:能具体表明社会经济现象之间的比例关系。能使一些不能直接对比的事物找出共同比较的基础。相对指标便于记忆、易于保密。相对指标的表现形式:有名数、无名数。p有名数是将对比的分子指标和分母指标的计量单位
4、结合起来使用。p无名数是一种抽象化的数值,一般分为系数、倍数、成数、百分数、千分数等。(二)相对指标的种类和计算方法相对指标通常分为:结构相对指标、比例相对指标、比较相对指标、计划完成相对指标、强度相对指标和动态相对指标。1、结构相对指标 计算各组总量占总体或样本总量的比重,用以反映总体或样本结构状况的综合指标。1、结构相对指标可以反映总体内部结构的特征。通过不同时期相对数的变动,可以看出事物的变化过程及其发展趋势。结构相对数一般用百分数表示。各组结构相对数之和等于100%或1。例:我国规模以上工业增加值的轻重工业构成表轻重工业2006年2007年工业增加值/亿元比重%工业增加值/亿元比重%轻
5、工业2431430.492827729.90重工业5543869.516630470.10合计79752100.0094581100.002、比例相对指标比例相对数是总体或样本中不同部分加以对比,用以反映总体或样本内部的比例关系和协调关系的综合指标。例:我国规模以上工业增加值的轻重工业构成表(2007年)轻重工业工业增加值/亿元比重%以轻工业增加值为100%轻工业2827729.90100.00重工业6630470.10234.48合计94581100.003、比较相对指标反映某一现象在同一时期内或同一时点上不同空间下的不平衡程度的综合指标。比较相对数可以是两个总量指标对比,也可以是相对指标或
6、平均指标对比。4、计划完成相对数长期计划的检查:5、强度相对指标概念:是性质不同但又有内在联系的两个绝对指标的对比,是用以反映某现象的强度、密度或普遍程度的综合指标。强度相对数的两种表示方法:(1)一般用无名数表示。(2)少数用百分数或千分数表示。注:强度相对数不是平均数,不是同类指标数值之比。例:p表现社会服务能力的强度相对数是用服务单位数与人口比较。p表现现象普遍成都的强度相对数,如人口密度、公路网密度等。6、动态相对指标概念:是不同时期同一指标数值之比,用以反映现象在不同时期发展变化程度的综合指标。动态相对数的计算结果用百分数或倍数表示。例:我国2001-2007年若干统计指标资料指标2
7、001年2002年2003年2004年2005年2006年2007年国内生产总值(亿元)109655120333135823159878183218211924249530年末总人口数(万人)127627128453129227129988130756131448132129人均国内生产总值(元)862293981054212336140531616518934第三产业占国内生产总值比重%40.541.541.240.440.140.040.1相对指标的种类和计算方法相对指标计算方法结构相对指标总体中部分数值/全部数值比例相对指标总体中A部分数值/B部分数值比较相对指标甲地某指标数值/乙地同一
8、指标数值计划完成程度指标实际数/计划数强度相对指标某一指标数值/同期另一有联系的指标数值动态相对指标报告期水平/基期水平数据分布的特征描述数据分布的特征:一、集中趋势:反映数据向其中心靠拢或聚集程度;二、离散趋势:数据远离中心的趋势;三、偏态和峰态:偏态是对数据分布对称性的度量;峰度是指数据分布的平峰或尖峰程度(形状)。数据分布的特征集中趋势(平均指标)(位置)离散趋势(变异指标)(分散程度)偏态和峰度(形状)数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状集中趋势集中趋势离散程度离散程度众 数中位数均 数离散系数方差和标准差四分位差偏 态峰 度数据的特征和测度集中趋势离散程度第
9、二节 平均指标数据分布集中程度的描述指标1.概念也称平均指标或平均数。用来反映标志值的典型水平或标志值分布的中心位置或集中趋势2.作用l反映变量分布的集中趋势和一般水平。l可用来比较同一总体在不同空间的发展水平l可用来分析现象之间的依存关系l是统计推断中一个重要的统计量。第二节 平均指标集集 中中 趋趋 势势(central tendency)1.一组数据向其中心值靠拢的倾向和程度2.测量集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值集中趋势指标的分类数值平均数算术平均数调和平均数几何平均数位置平均数众数中位数及其他分位数一、算术平均数算术平均数的基本公式(最
10、基本指标):分为:简单算术平均数:加权算术平均数:(一)简单算术平均数把每项数据直接加总后除以它们的项数 通常用于对未分组的数据计算算术平均数计算公式:Xi代表变量,代表算数平均数,n变量值个数,求和分分组组表 3-2年龄 人数(人)xf2242510305501合计20表 3-1男性女性2222222225252525252525252525303030305030n例题:采用简单算术平均法计算,即全体队员的平均年龄为(单位:周岁):若采用简单平均:分组数据不能简单平均!因为各组变量值的次数不等!(二)加权算术平均数加权算术平均数的计算公式:n加权为了体现各变量值轻重不同的影响作用,对各个变
11、量值赋予不尽相同的权数(fi).(二)加权算术平均数n设分组后各组的变量值或组中值为:x1,x2,xnn相应的频数为:f1,f2,fnn正确的计算是:例表 某班级40名同学统计学原始成绩(单位:分)简单算术平均数算式:简单算术平均数算式:表 40名同学统计学成绩汇总表(单位:分)加权算术平均数算式:552+658+7516+8510+954=3060权数(fi,也称权重)权数指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。可以是绝对数形式,也可以是比重形式(如频率)表示。事实上比重权数更能够直接表明权数权衡轻重作用当权数完全相等(f1=f2=fn)时,加权算术平均数就成了
12、简单算术平均数。一种是以绝对数表示,称次数或频数f;另一种是以比重表示,称频率。用频率计算的公式和直接用次数计算的公式在内容上是相等的,即变量数列的权数有两种形式:(三)算术平均数的数学性质1、各个变量值与算术平均数的离差之和等于零。2、各个变量值与算术平均数的离差平方之和等于最小值。算术平均数有两点不足:1、算术平均数易受极端变量值的影响,使 的代表性变小,而且受极大值的影响大于受极小值的影响。2、当组距数列为开口组时,由于组中值不易确定,使 的代表性也不很可靠。二、调和平均数1.集中趋势的测度值之一;2.算术平均数的另一种表现形式;3.易受极端值的影响;4.有简单调和平均数和加权调和平均数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据 分布 特征 描述
限制150内