第3章-数据的描述性分析分解优秀PPT.ppt
《第3章-数据的描述性分析分解优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第3章-数据的描述性分析分解优秀PPT.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 数据的描述性分析数据的描述性分析 本章将探本章将探讨讨的是数据的的是数据的总总量和相量和相对对关系的关系的测测度,数据的度,数据的集中集中趋势趋势、离散、离散趋势趋势及其形及其形态态的的测测度。度。第一节第一节 确定数和相对数确定数和相对数其次节其次节 集中趋势的测定集中趋势的测定第三节第三节 离散趋势的测定离散趋势的测定第四节第四节 数据的形态测定数据的形态测定主主要要内内容容一、确定数一、确定数 确定数(亦称总量指标)是统计资料经过汇总整理后得到的反映总确定数(亦称总量指标)是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标。体规模和水平的总和指标。(二)作用(二)作
2、用(一)概念(一)概念例如,企业的销售收入、社会总产值、国内生产总值等。例如,企业的销售收入、社会总产值、国内生产总值等。(1 1)反映一个国家的国情和国力,一个地区或一个企业的人力、物)反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力力、财力 。(2 2)是进行经济核算和经济活动分析的基础。)是进行经济核算和经济活动分析的基础。(3 3)是计算相对指标和平均指标的基础。)是计算相对指标和平均指标的基础。第一节第一节 确定数和相对数确定数和相对数(三)分类(三)分类 1 1、按反映总体的内容分、按反映总体的内容分2 2、按反映的时间状态分、按反映的时间状态分 3 3、按计量单位分
3、:、按计量单位分:实物量;价值量;劳动量。实物量;价值量;劳动量。n变量总值变量总值 n单位总数单位总数n时期总量:说明现象在一段时间内累积的总量。(如诞生人数)时期总量:说明现象在一段时间内累积的总量。(如诞生人数)n 特点:指标数值随时间长短而变更;指标各期数值可加总。特点:指标数值随时间长短而变更;指标各期数值可加总。n时点总量:说明现象在某一时刻的数量状态。(如年末人口数)时点总量:说明现象在某一时刻的数量状态。(如年末人口数)n 特点:不同时点的指标数值加总后,没有意义。特点:不同时点的指标数值加总后,没有意义。相相对对数数是是用用两两个个有有联联系系的的指指标标进进行行对对比比的的
4、比比值值,可可以以反反映映现现象象的的数数量量特特征征和和数数量量关关系系,并并可可将将现现象象的的确确定定差差异异抽抽象象化化,使使原原来来不不能能干干脆脆相相比的确定数可以进行比较。比的确定数可以进行比较。二、相对数二、相对数(一)相对数的概念及(一)相对数的概念及表现形式:表现形式:n无名数:倍数、系数、成数、百分数等无名数:倍数、系数、成数、百分数等n出名数(如:人出名数(如:人/每平方公里)每平方公里)种类种类支配完成相对数支配完成相对数结构相对数结构相对数比较相对数比较相对数强度相对数强度相对数动态相对数动态相对数(二)相对指标的计算(二)相对指标的计算1 1、支配完成相对数、支配
5、完成相对数 是用来检查、监督支配执行状况的相对指标。通常用百分数表示,是用来检查、监督支配执行状况的相对指标。通常用百分数表示,又称支配完成百分比。又称支配完成百分比。1 1)支配数为确定数)支配数为确定数例:某工厂某年支配工业增加值为例:某工厂某年支配工业增加值为200万元,实际完成万元,实际完成220万元,则:万元,则:n指标数值越大,完成程度越高的指标为指标数值越大,完成程度越高的指标为正指标正指标n指标数值越大,完成程度越低的指标为指标数值越大,完成程度越低的指标为逆指标逆指标n分子与分母差值称为分子与分母差值称为百分点百分点2 2)支配数为相对数)支配数为相对数 例:某企业某种产品的
6、产值支配要求增长例:某企业某种产品的产值支配要求增长10%10%,该产品的单位成本支,该产品的单位成本支配要求下降配要求下降5%5%。实际产值增长了。实际产值增长了15%15%,单位成本下降了,单位成本下降了3%3%,则:,则:实际比支配多完成了实际比支配多完成了5个百分点个百分点实际比支配少完成了实际比支配少完成了2个百分点个百分点正指标正指标逆指标逆指标有正指标和逆指标有正指标和逆指标3 3)支配数为平均数)支配数为平均数 例:某企业支配要求劳动生产率达到例:某企业支配要求劳动生产率达到50005000元元/人,产品的支配单位成人,产品的支配单位成本为本为100100元,该企业的实际劳动生
7、产率达到元,该企业的实际劳动生产率达到60006000元元/人,产品的实际单位人,产品的实际单位成本为成本为8080元。则:元。则:(正指标)(正指标)(逆指标)(逆指标)2 2、结构相对数、结构相对数 总体内某一部分数值与总体全部数值对比的比值,反映总体内部的总体内某一部分数值与总体全部数值对比的比值,反映总体内部的构成和类型特征,一般用百分数或系数表示。构成和类型特征,一般用百分数或系数表示。计算公式计算公式特点:特点:各部分比重总和等于各部分比重总和等于100%100%。分子分母可以同是总体单位数,也可以是总体标记数量。分子分母可以同是总体单位数,也可以是总体标记数量。3 3、比较相对数
8、、比较相对数 将某一总体的指标与另一总体同类指标对比的比值,反映同类事物在将某一总体的指标与另一总体同类指标对比的比值,反映同类事物在不同国家、不同地区或不同单位之间的差异程度。一般用百分数或倍数表不同国家、不同地区或不同单位之间的差异程度。一般用百分数或倍数表示。示。n对比的指标可以是总量指标也可以是相对指标或平均指标。对比的指标可以是总量指标也可以是相对指标或平均指标。n依据探讨目的不同,分子分母可以互换。依据探讨目的不同,分子分母可以互换。计算公式计算公式特点:特点:4 4、强度相对数、强度相对数 将两个有联系但不同的指标对比而得到的比值,反映现象的强度、将两个有联系但不同的指标对比而得
9、到的比值,反映现象的强度、密度和普及程度。密度和普及程度。n部分强度相对数分子分母可互换,有正指标和逆指标;部分强度相对数分子分母可互换,有正指标和逆指标;n部分强度相对数以出名数表示;部分强度相对数以出名数表示;n有平均的含义,但与平均指标有本质区分。有平均的含义,但与平均指标有本质区分。计算公式计算公式特点:特点:5、动态相对数、动态相对数 将总体不同时期的同一类指标对比而计算的比值,说明事物发展将总体不同时期的同一类指标对比而计算的比值,说明事物发展变更的程度,一般用百分数表示。变更的程度,一般用百分数表示。计算公式计算公式作为比较基础的时期为作为比较基础的时期为基期基期与基期对比的时期
10、为报告期与基期对比的时期为报告期不同时期不同时期比比 较较动态动态相对数相对数注:注:又称发又称发展速度展速度 强度强度相对数相对数注:注:复名数复名数有正逆指有正逆指标标不同现象不同现象比较比较不同总体不同总体比较或者比较或者同一总体同一总体的两个不的两个不同部分同部分比较相对数比较相对数同一总体中同一总体中部分与总体部分与总体比较比较实际与支配实际与支配比较比较结构相对数结构相对数支配完成相对数支配完成相对数注:注:有正逆指标有正逆指标同一时期比较同一时期比较同类现象比较同类现象比较1 1、必需留意统计的可比性;、必需留意统计的可比性;2 2、正确选择对比的基数;、正确选择对比的基数;3
11、3、相对指标要与确定数指标相结合。、相对指标要与确定数指标相结合。(三)相对指标的应用原则(三)相对指标的应用原则其次节其次节 集中趋势测定集中趋势测定平均数平均数 平平均均指指标标是是反反映映同同类类现现象象在在确确定定时时间间、地地点点条条件件下下的的一一般般水水平平,是是总总体体内内各各单单位位参参差差不不齐齐的的标标记记值值的的代代表表值值,也也是是对对变变量量分分布布集集中中趋趋势势的的测定。测定。数据集中区数据集中区变量变量变量一般水平、代表性数值变量一般水平、代表性数值算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数中位数中位数众数众数数值平均数数值平均数位置平均数位
12、置平均数种类:种类:(一)基本形式:(一)基本形式:一、算术一、算术平均数(平均数()与强度相对数的区分:与强度相对数的区分:算术平均数中的变量值总和必需是总体内各单位变量值的总和,分子算术平均数中的变量值总和必需是总体内各单位变量值的总和,分子与分母存在一一对应关系。与分母存在一一对应关系。1、简洁算术平均数简洁算术平均数适用于总体资料未经分组整理、尚为原始资料的状况适用于总体资料未经分组整理、尚为原始资料的状况【例】【例】【例】【例】某售货小组某售货小组5个人,某天的销售额分别为个人,某天的销售额分别为520元、元、600元、元、480元、元、750元、元、440元,则元,则算术平均数算术
13、平均数总体单位总数总体单位总数第第i 个单位的标志值个单位的标志值平均每人日销售额为:平均每人日销售额为:(二)计算方法(二)计算方法(二)加权算术平均数(二)加权算术平均数两个影响因素:两个影响因素:标志值(组中值)标志值(组中值),决定平均数的变动范围;,决定平均数的变动范围;权数权数 或或 ,决定平均数的位置。,决定平均数的位置。适用于总体资料经过分组整理形成变量数列的状况适用于总体资料经过分组整理形成变量数列的状况频率分布变了,均值也变。因此,严格地说,权数应指频率。频率分布变了,均值也变。因此,严格地说,权数应指频率。(1)(1)(2)(2)(3)(3)X X4 45 56 6合计合
14、计频数频数频率频率(%)(%)1010202010102525505025254040100100X X4 45 56 6合计合计频数频数频率频率(%)(%)2020404020202525505025258080100.0100.0X X4 45 56 6合计合计频数频数频率频率(%)(%)2020101010105050252525258080100100变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差平方和为最小,即:变量值与其算术平均数的离差平方和为最小,即:优点:优点:简洁理便于计算;简洁理便于计算;灵敏度高;灵敏度高
15、;稳定性好。稳定性好。缺点:缺点:易受极值影响(受极大值影响大)。易受极值影响(受极大值影响大)。在偏斜分布和在偏斜分布和U形分布中,不具有代表性。形分布中,不具有代表性。(三)主要数学性质(三)主要数学性质(四)特点(四)特点算术平均数的变形算术平均数的变形数数学学上上称称其其为为调调和和平平均均数数,实实际际作作为为计计算算平平均均数数的的调和平均法调和平均法。用这种形式时,变量的取值不能为。用这种形式时,变量的取值不能为0 0。即在计算平均数时,以即在计算平均数时,以 为权数计算的调和平均数就是算术平均数。为权数计算的调和平均数就是算术平均数。实际应用时:以平均数的基本公式为依据,已知分
16、子资料用调和平均法,实际应用时:以平均数的基本公式为依据,已知分子资料用调和平均法,已知分母资料用算术平均法。已知分母资料用算术平均法。三、几何平均数三、几何平均数()(一)概念:(一)概念:是是N项变量值连乘积的开项变量值连乘积的开N次方根次方根。也称。也称。也称。也称对数平均数对数平均数(二)计算方法(二)计算方法1、简洁几何平均数简洁几何平均数适用于总体资料未经分组整理尚为原始资料的状况适用于总体资料未经分组整理尚为原始资料的状况几何平均数几何平均数变量值的个数变量值的个数第第 个变量值个变量值2、加权几何平均数加权几何平均数适用于总体资料经过分组整理形成变量数列的状况适用于总体资料经过
17、分组整理形成变量数列的状况(三三)应用:应用:u用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度u各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;u相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。1、未分组资料、未分组资料2、单项数列、单项数列3、组距数列、组距数列【例】【例】【例】【例】排序排序计算中位数位次计算中位数位次确定确定计算中位数位次计算中位数位次确定中位数组确定中位数组公式计算公式计算三、中位数三、中位数()(二二)中位数的确定中位数的确定 (一一)概念概念:将总体各变量值按大小顺序排列后,处于中间位置的变量
18、值,用将总体各变量值按大小顺序排列后,处于中间位置的变量值,用 表示。表示。确定确定是用插值法对中位是用插值法对中位数组分割的结果数组分割的结果累计频数累计频数上限公式:上限公式:下限公式:下限公式:【例】【例】(三三)中位数的特点中位数的特点中位数的取值只与中间位置的数值有关,利用信息不充分,中位数的取值只与中间位置的数值有关,利用信息不充分,忽视了其它数据的大小,灵敏度和计算功能差忽视了其它数据的大小,灵敏度和计算功能差优点:优点:简洁理解;简洁理解;不受极值影响;不受极值影响;可用于定序数据(不行用于定类数据);可用于定序数据(不行用于定类数据);在偏斜分布中代表性比算术平均数高。在偏斜
19、分布中代表性比算术平均数高。缺点:缺点:例例1、单项数列、单项数列干脆确定干脆确定四、众数(四、众数()(二)众数的确定(二)众数的确定(一)概念(一)概念指总体中出现次数最多的变量值,用指总体中出现次数最多的变量值,用 表示,用来说明总体表示,用来说明总体中大多数单位所达到的一般水平。中大多数单位所达到的一般水平。2、组距数列:、组距数列:确定众数组确定众数组公式计算公式计算【例】【例】上限公式:上限公式:下限公式:下限公式:d1 d2是以频数之差计算的比例是以频数之差计算的比例分割众数组组距的结果。分割众数组组距的结果。【例】【例】(三)众数的特点(三)众数的特点具有不唯一性具有不唯一性优
20、点:优点:简洁理解;简洁理解;不受极值影响;不受极值影响;可用于定类数据可用于定类数据在偏斜分布中代表性比算术平均数高。在偏斜分布中代表性比算术平均数高。缺点:缺点:灵敏度和计算功能差灵敏度和计算功能差稳定性差稳定性差位置平均数与算术平均数的关系位置平均数与算术平均数的关系对称分布对称分布正偏态分布正偏态分布(右)右)负偏态分布负偏态分布(左)左)在偏斜不大时在偏斜不大时1212第三节第三节 离散趋势的测定离散趋势的测定标记变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。标记变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。(1)反映变量分布的离散趋势;)反映变量分布的离散趋势;
21、(3)是对事物发展均衡性的量度。)是对事物发展均衡性的量度。(2)是对平均数的代表性程度的量度;)是对平均数的代表性程度的量度;作用:作用:一、异众比率一、异众比率二、极差、四分位差和平均差二、极差、四分位差和平均差三、标准差和方差三、标准差和方差四、离散系数四、离散系数主要内容:主要内容:一、异众比率一、异众比率概念:指非众数组所占比重概念:指非众数组所占比重 异众比率是反映异众比率是反映定名数据定名数据离散趋势的唯一指标,这个指标越小,说离散趋势的唯一指标,这个指标越小,说明数据的离散程度越小,集中程度越大明数据的离散程度越小,集中程度越大 特点:特点:二、极差、四分位差和平均差二、极差、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 描述 分析 分解 优秀 PPT
限制150内