统计数据的整理和显示(new).ppt
《统计数据的整理和显示(new).ppt》由会员分享,可在线阅读,更多相关《统计数据的整理和显示(new).ppt(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 统计数据的整理和显示统计数据的整理和显示第一节 统计数据整理概述第二节 统计数据分组第三节 频数分布第四节 数据的显示本章主要内容第一节第一节 统计数据整理概述统计数据整理概述一、统计整理及其类型一、统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。统计整理的意义:1、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。2、统计整理
2、还是积累历史资料的必要手段。二、统计整理的内容二、统计整理的内容审核分组汇总编制统计图表统计资料整理的步骤统计资料整理的步骤第一步,设计和制定统计整理方案。它是对资料整理工作第一步,设计和制定统计整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。的各个方面各步骤做出具体的安排与规定。第二步,对原始资料进行审核。审核被调查单位的资料是第二步,对原始资料进行审核。审核被调查单位的资料是否全部收齐,填报是否缺漏与差错,发现问题,及时解决,否全部收齐,填报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。以保证资料汇总计算能顺利进行。第三步,对经过审核的资料进行分组、并
3、结合汇总,计算第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。出总体总量指标。第四步,将汇总计算的结果,以统计表或统计图的形式表第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。现出来。第五步,对统计资料妥善保存,系统积累。第五步,对统计资料妥善保存,系统积累。三、统计整理的步骤四、数据的预处理四、数据的预处理(一)数据的审核1.审核资料的完整性和及时性 审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。2.审核资料的正确性
4、:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:(1)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。其次,是检查各项目之间有无相互矛盾的地方。(2)计算检查 即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋
5、势来检查它的正确性。(二)资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。第二节第二节 统计数据的分组统计数据的分组一、统计分组的概念一、统计分组的概念 统计分组就是根据统计研究的需要,将统计统计分组就是根据统计研究
6、的需要,将统计总体按照一定的标志分为若干个组成部分的总体按照一定的标志分为若干个组成部分的一种统计方法。一种统计方法。统计分组具有两个方面的含义:对总体而言,统计分组具有两个方面的含义:对总体而言,是是“分分”,即将同质总体区分为性质有别的,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是不同组成部分;对总体单位而言,它是“组组”,即将性质相同或相近的不同总体单位组,即将性质相同或相近的不同总体单位组合在一起,构成一个组。合在一起,构成一个组。二、统计分组的原则二、统计分组的原则(1 1)穷尽性原则)穷尽性原则(2 2)互斥性原则。)互斥性原则。三、统计分组的作用三、统计分组的作
7、用统计分组的主要作用具体表现在以下几个方面。统计分组的主要作用具体表现在以下几个方面。(一)区分现象的不同类型(一)区分现象的不同类型各种现象千差万别,多种多样,并在其发展中表各种现象千差万别,多种多样,并在其发展中表现出不同的性质和特征。通过统计分组,就可以现出不同的性质和特征。通过统计分组,就可以将不同类型现象的性质和特征区分开来,并且经将不同类型现象的性质和特征区分开来,并且经过比较和研究,揭示其发展变化的规律,达到深过比较和研究,揭示其发展变化的规律,达到深刻认识总体的目的。刻认识总体的目的。1997年社会固定资产投资分布情况年社会固定资产投资分布情况资料来源:资料来源:1997年国民
8、经济和社会发展统计公报年国民经济和社会发展统计公报,国,国家统计局家统计局按投资主体性质分组按投资主体性质分组 投资额(亿元)投资额(亿元)比重(比重(%)国有经济国有经济集体经济集体经济城乡居民个人城乡居民个人其他其他 13 41913 4193 8733 8733 4273 4274 581 4 581 53.053.015.315.313.613.618.1 18.1 合计合计 25 300 25 300 100.0 100.0(二)研究总体的内部结构(二)研究总体的内部结构 按照某种标志将总体划分为若干个不同的组,可按照某种标志将总体划分为若干个不同的组,可以计算出各组数值在总体中所占
9、的比重,或各组以计算出各组数值在总体中所占的比重,或各组之间的比例关系,从而反映出总体的结构状况,之间的比例关系,从而反映出总体的结构状况,加深对现象总体的认识。加深对现象总体的认识。例如:例如:按照按照地理位置不同将我国划分为东部、中部地理位置不同将我国划分为东部、中部和西部三个地区,可以观察东、中、西三个和西部三个地区,可以观察东、中、西三个不同地区经济发展水平和经济资源的差异,不同地区经济发展水平和经济资源的差异,以及它们在整个国民经济中所处的不同地位以及它们在整个国民经济中所处的不同地位;对对人口按照文化程度分组,计算大学及大学人口按照文化程度分组,计算大学及大学以上、大学肄业及在校、
10、高中、初中、小学、以上、大学肄业及在校、高中、初中、小学、不识字或识字很少各组人口所占的比重,就不识字或识字很少各组人口所占的比重,就能反映社会人口的文化素质构成情况能反映社会人口的文化素质构成情况。如果如果将不同时期的同一总体的结构相互比较,将不同时期的同一总体的结构相互比较,还可以揭示出总体现象的发展变化规律。还可以揭示出总体现象的发展变化规律。三次产业增加值结构变化三次产业增加值结构变化资料来源:资料来源:中国统计年鉴中国统计年鉴2003年中国发展报告年中国发展报告,国家统计局国家统计局2003年版,中国统计出版社。年版,中国统计出版社。从表中可以看出,我国从表中可以看出,我国19982
11、002年,年,GDP年均年均增长增长7.7%,其中第一产业增加之年均增加,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长第二产业、第三产业增加值分别增长8.9%和和8.0%。反映在结构中,第一产业比重下降,二、三产业反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从比重上升。其中第一产业比重从1997年的年的19.1%下降到下降到2002年的年的14.5%,下降了,下降了4.6个百分点;第个百分点;第二产业从二产业从50%提高到提高到51.8%,上升了,上升了1.8个百分点;个百分点;第三产业从第三产业从30.9%提高到提高到33.7%,上升了,上升了
12、2.8个百分个百分点。它反映着我国产业结构的变化发展过程。点。它反映着我国产业结构的变化发展过程。(三)分析现象间的依存关系(三)分析现象间的依存关系 一切事物都是普遍联系、相互依存的。一种现象的一切事物都是普遍联系、相互依存的。一种现象的表现,既是它与其他现象相互作用的结果,也会对表现,既是它与其他现象相互作用的结果,也会对其他现象的表现产生一定的影响。通过统计分组,其他现象的表现产生一定的影响。通过统计分组,可以反映出现象之间的这种依存关系。可以反映出现象之间的这种依存关系。例如例如 :将商品流通企业按照流转额分组,可以观将商品流通企业按照流转额分组,可以观察商品流通企业的规模与商品流转费
13、用率察商品流通企业的规模与商品流转费用率之间的关系;将农作物播种面积按施肥量之间的关系;将农作物播种面积按施肥量分组,用以观察农作物单产与施肥量之间分组,用以观察农作物单产与施肥量之间的关系;将人口按人均收入分组,以观察的关系;将人口按人均收入分组,以观察收入与储蓄之间的关系等等。收入与储蓄之间的关系等等。四、分组的种类按分组标志的多少简单分组复合分组简单分组:对研究现象按一个标志进行分组。复合分组:用两个或两个以上标志对研究现象进行分组。按分组标志性质按分组标志性质属性分组属性分组变量分组变量分组五、统计分组的方法五、统计分组的方法 统计分组的关键问题是正确地选择分组标志与划统计分组的关键问
14、题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。主要是指数量标志分组。(一)分组标志选择的原则(一)分组标志选择的原则要选择能够反映事物本质或主要特征的标志要选择能够反映事物本质或主要特征的标志 应根据研究的目的与任务选择分组标志应根据研究的目的与任务选择分组标志 根据现象所处的历史条件的变化选择分组标志根据现象所处的历史条件的变化选择分组标志(二)统计分组的方法(二)统计分组的方法按品质标志分组按品质标志分组按数量标志分组按数量标志分组 1、品质分组的方法、品质分组的方法例如,人口按性别分为男女两组;例如,人
15、口按性别分为男女两组;高校学生按学科分为文理科两类。高校学生按学科分为文理科两类。2、数量分组的方法、数量分组的方法分组需要注意的问题:分组需要注意的问题:(1)分组时各组数量界限的确定必须能反映)分组时各组数量界限的确定必须能反映事物质的差别;事物质的差别;(2)应根据被研究的现象总体的数量特征,)应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限采用适当的分组形式,确定相宜的组距、组限。单项式分组与组距式分组单项式分组与组距式分组单项式分组单项式分组就是用一个变量值作为一组,形成单项式变量数列。例如,育龄妇女按其生育子女存活数分组,可分为0个、1个、2个、3个、4个
16、、5个等6组。一般适用于离散型变量且变量变动范围不大的场合。组距式分组组距式分组就是将变量依次划分为几段区间,一段区间表现为”从 到 “距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。例如,反映居民居住水平情况按人均居住面积分组分为:4平方米以下,46平方米,68平方米,8平方米以上等4组。适用于连续型变量或者变动范围较大的离散型变量。间断组距式分组和连续组距式分组间断组距式分组和连续组距式分组凡是组限不相连的分组,称为间断组距式分组。例如,儿童按年龄分组分为:未满1岁,12岁,3 4岁,5 9岁,10 14岁。凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为
17、连续组距式分组。例如,工人按工时定额完成程度分组为90 100,100 110,110 120等组。介绍上限、下限、组距、组限。介绍上限、下限、组距、组限。组距式变量数列中,每组区间两端的极值称组限。每一组的两个组限中,较大者叫上限,较小者叫下限。如果各组的组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。A.A.“上限不在内上限不在内上限不在内上限不在内”原则原则原则原则B.B.变量值只是在整数之间变动的离散型变量,变量值只是在整数之间变动的离散型变量,可采用间断式组距分组,也可采用连续组距可采用间断式组距分组,也可采用连续组距式分组。式分组。C.C.如果变量值在
18、一定范围内的表现即可以是整如果变量值在一定范围内的表现即可以是整数,也可以是小数等连续型变量,只能采用数,也可以是小数等连续型变量,只能采用连续组距式分组。连续组距式分组。等距分组与异距分组等距分组与异距分组等距分组就是标志值在各组保持相等的组距,即各组的标志值变等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。动都限于相同的范围。凡是标志值变动比较均匀的情况下,都可采用等距分组。凡是标志值变动比较均匀的情况下,都可采用等距分组。例如,工人的年龄,工龄、工资的分组等。例如,工人的年龄,工龄、工资的分组等。凡是标志值在各组的组距不相等的,称为异距分组。凡是标志值在各组的
19、组距不相等的,称为异距分组。适用范围:适用范围:标志值分布很不均匀的场合;标志值分布很不均匀的场合;标志值相等的量具有不同意义的场合;标志值相等的量具有不同意义的场合;例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。年龄分组:年龄分组:1岁以下按月分组,岁以下按月分组,110岁按年分组,岁按年分组,1120岁按岁按5年分组,年分组,21岁以上按岁以上按10年或年或20年分组等。年分组等。标志值按一定比例发展变化的场合。标志值按一定比例发展变化的场合。例如,大城市的百货商店营业额差别:从例如,大城市的百货商店营业额差别:从5万到
20、万到5千万,可采取公千万,可采取公比为比为10的不等距分组:的不等距分组:5 50万,万,50 500万,万,500 5000万。万。六、统计分组体系六、统计分组体系 简单分组与平行分组体系简单分组与平行分组体系将社会经济总体只选择一个标志分组称为简单分组。将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。单分组,排列起来,即成为平行分组体系。按年龄分组按年龄分组按文化程度分组按文化程度分组2020及及2020岁以下岁以下大专及大专以上大专及大专以上21213535岁岁中专
21、、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多、文小学、识字不多、文盲盲复合分组与复合分组体系复合分组与复合分组体系复合分组是用两个或两个以上分组标志重叠起复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如来对总体进行的分组。例如 如果多个复合分组组成的体系就形成了复合分组体系。如果多个复合分组组成的体系就形成了复合分组体系。例如同时选择学科、本科或专科、性别三个标志进行复例如同时选择学科、本科或专科、性别三个标志进行复合分组合分组.理科学生理科学生 本科学生本科学生 男学生男学生 女学生女学生 专科学生专科学生 男学生
22、男学生 女学生女学生 文科学生文科学生 本科学生本科学生 男学生男学生 女学生女学生 专科学生专科学生 男学生男学生 女学生女学生 (一)组距 组距是各组上下限之间的距离,即各组最大组距是各组上下限之间的距离,即各组最大标志值与最小标志值之差。标志值与最小标志值之差。在连续组距分组中在连续组距分组中:组距上限下限组距上限下限在间断组距式分组中在间断组距式分组中:组距本组上限前组上限(或组距本组上限前组上限(或=本组下限前本组下限前组下限组下限 或本组上限本组下限或本组上限本组下限1 1)例如,商店规模按职工人数分组,分为:例如,商店规模按职工人数分组,分为:1 15人,人,6 10人,人,11
23、 15人,等等。人,等等。七、组距、组数与组中值的计算七、组距、组数与组中值的计算(二)组数 全距是总体中最大的标志值与最小的标志值之差。全距是总体中最大的标志值与最小的标志值之差。组数的多少直接取决于两个因素,一个是总体的全距,另组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。一个是组距。在等距分组的条件下,组数等于全距除以在等距分组的条件下,组数等于全距除以组距。组距。在组距既定的条件下,全距大则组数多,全距小在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定的条件下,组距大则组数少,组则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。距小则组数多。美
24、国学者斯特杰斯创造了斯特杰斯经验公式:美国学者斯特杰斯创造了斯特杰斯经验公式:(三)组中值组中值:各组中点位置所对应的变量值。其计算公式为:组中值=(适用所有闭口组)或=(适用上开口组)或=(适用下开口组)第三节第三节 分配分配数列数列一、分配数列的概念与种类一、分配数列的概念与种类 二、分配数列的编制方法二、分配数列的编制方法三、次数分布的类型三、次数分布的类型一、频数分布一、频数分布(一)频数分布 在统计分组的基础上,将总体所有的单位在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。单位数称为频数分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计数据 整理 显示 new
限制150内