统计学统计数据的整理和显示.pptx
《统计学统计数据的整理和显示.pptx》由会员分享,可在线阅读,更多相关《统计学统计数据的整理和显示.pptx(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 统计数据整理概述第二节 统计数据分组第三节 频数分布第四节 数据的显示本章主要内容第1页/共87页第一节 统计数据整理概述一、统计整理及其类型一、统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。第2页/共87页 统计整理的意义:1、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。2、统计整理还是积累历史资料的必要手段。第3页/共87
2、页二、统计整理的内容二、统计整理的内容审核分组汇总编制统计图表第4页/共87页统计资料整理的步骤统计资料整理的步骤第一步,设计和制定统计整理方案。它是对资料整理第一步,设计和制定统计整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。工作的各个方面各步骤做出具体的安排与规定。第二步,对原始资料进行审核。审核被调查单位的资第二步,对原始资料进行审核。审核被调查单位的资料是否全部收齐,填报是否缺漏与差错,发现问题,料是否全部收齐,填报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。及时解决,以保证资料汇总计算能顺利进行。第三步,对经过审核的资料进行分组、并结合汇总,
3、第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。计算出总体总量指标。第四步,将汇总计算的结果,以统计表或统计图的形第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。式表现出来。第五步,对统计资料妥善保存,系统积累。第五步,对统计资料妥善保存,系统积累。三、统计整理的步骤第5页/共87页四、数据的预处理四、数据的预处理(一)数据的审核1.审核资料的完整性和及时性 审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。第6页/共87
4、页2.审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:(1)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。其次,是检查各项目之间有无相互矛盾的地方。第7页/共87页(2)计算检查 即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。第8页/共87页3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资
5、料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。第9页/共87页(二)资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。第10页/共87页(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。第11页/共87页第二节 统计数据的分组一、统计分组的
6、概念 统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。第12页/共87页二、统计分组的原则二、统计分组的原则(1)穷尽性原则(2)互斥性原则。第13页/共87页三、统计分组的作用统计分组的主要作用具体表现在以下几个方面。(一)区分现象的不同类型各种现象千差万别,多种多样,并在其发展中表现出不同的性质和特征。通过统计分组,就可以将不同类型现象的性质和特征区分开来,并且经过比较和研究
7、,揭示其发展变化的规律,达到深刻认识总体的目的。第14页/共87页1997年社会固定资产投资分布情况资料来源:1997年国民经济和社会发展统计公报,国家统计局按投资主体性质分组按投资主体性质分组 投资额(亿元)投资额(亿元)比重(比重(%)国有经济国有经济集体经济集体经济城乡居民个人城乡居民个人其他其他 13 41913 4193 8733 8733 4273 4274 581 4 581 53.053.015.315.313.613.618.1 18.1 合计合计 25 300 25 300 100.0 100.0 第15页/共87页(二)研究总体的内部结构 按照某种标志将总体划分为若干个不
8、同的组,可以计算出各组数值在总体中所占的比重,或各组之间的比例关系,从而反映出总体的结构状况,加深对现象总体的认识。第16页/共87页例如 按照地理位置不同将我国划分为东部、中部和西部三个地区,可以观察东、中、西三个不同地区经济发展水平和经济资源的差异,以及它们在整个国民经济中所处的不同地位;对人口按照文化程度分组,计算大学及大学以上、大学肄业及在校、高中、初中、小学、不识字或识字很少各组人口所占的比重,就能反映社会人口的文化素质构成情况。如果将不同时期的同一总体的结构相互比较,还可以揭示出总体现象的发展变化规律。第17页/共87页表32 三次产业增加值结构变化资料来源:中国统计年鉴2003年
9、中国发展报告,国家统计局2003年版,中国统计出版社。第18页/共87页从表中可以看出,我国19982002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。第19页/共87页(三)分析现象间的依存关系 一切事物都是普遍联系、相互依存的。
10、一种现象的表现,既是它与其他现象相互作用的结果,也会对其他现象的表现产生一定的影响。通过统计分组,可以反映出现象之间的这种依存关系。第20页/共87页例如 将商品流通企业按照流转额分组,可以观察商品流通企业的规模与商品流转费用率之间的关系;将农作物播种面积按施肥量分组,用以观察农作物单产与施肥量之间的关系;将人口按人均收入分组,以观察收入与储蓄之间的关系等等。表33就反映了我国电力增长与国内生产总值(GDP)增长之间的依存关系。第21页/共87页表33 我国与部分发达国家高技术产业增加值率的比较单位:单位:%中国中国2001 2001 美国美国1999 1999 日本日本1997 1997 英
11、国英国1998 1998 法国法国1998 1998 加拿大加拿大1997 1997 韩国韩国1999 1999 全部制造业全部制造业 26264 436365 536366 637377 732323 331316 628285 5高技术产业高技术产业 25252 243430 036361 136364 430301 133338 827272 2航空航天制造航空航天制造业业 26264 437371 139398 833334 422221 144449 9计算机与办公计算机与办公设备制造业设备制造业 19196 656561 149490 042420 032328 830308 83
12、5359 9电子与通信设电子与通信设备制造业备制造业 23235 532328 824245 526260 029299 914142 221212 2医药制造业医药制造业 35354 449495 536366 637376 628285 534346 628282 2医疗设备及仪医疗设备及仪器仪表制造业器仪表制造业 29296 636367 744444 446466 639393 329299 9第22页/共87页四、分组的种类四、分组的种类按分组标志的多少简单分组复合分组第23页/共87页简单分组:对研究现象按一个标志进行分组。职工工资额分组月工资职工人数各组职工所占比重(%)1000
13、200026132000300046223000400084414000以上4924第24页/共87页复合分组:用两个或两个以上标志对研究现象进行分组。进行复合分组时,要先按照最重要的标志进行第一次分组,然后依次按照重要程度进行以下各级的分组。选择的标志越多,组数就成倍增加,而各组内的单位数则递减。复合分组时,选择标志的数目不宜过多。2009年中国6岁及以上按性别和受教育程度分组的人口数统计表复合分组人数性别比重(%)教育程度比重(%)6岁及以上人口男55151250.51100.00女54035649.49未上小学男女小学第25页/共87页按分组标志的性质划分品质分组:按照品质标志进行的分组
14、,反映总体内不同性质个体所组成的各部分的分组情况。各分组标志都用文字来表述,而不能数量化。如人口性别,居住区数量分组:按照数量标志进行的分组,反映各单位在某一数量特征上的不同等级,这些数量特征都是可以量化的,都能进行数量的比较或运算,这些特征要用数字来表示。如年龄,销售额。第26页/共87页按分组组距类型划分等距分组:变量值在各组保持相等的组距。异距分组:变量值在各组采用了不同的组距。前者常用于数值变化比较均匀的情况,后者常用于数量变化比较剧烈的情况。第27页/共87页五、统计分组的方法 统计分组的关键问题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。
15、(一)分组标志选择的原则要选择能够反映事物本质或主要特征的标志 应根据研究的目的与任务选择分组标志 根据现象所处的历史条件的变化选择分组标志(二)统计分组的方法按品质标志分组按数量标志分组 第28页/共87页1、品质分组的方法例如,人口按性别分为男女两组;高校学生按学科分为文理科两类。2、数量分组的方法分组需要注意的问题:(1)分组时各组数量界限的确定必须能反映事物质的差别;(2)应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。第29页/共87页单项式分组与组距式分组单项式分组就是用一个变量值作为一组,形成单项式变量数列。例如,育龄妇女按其生育子女存活数分组,可分为
16、0个、1个、2个、3个、4个、5个等6组。一般适用于离散型变量且变量变动范围不大的场合。组距式分组就是将变量依次划分为几段区间,一段区间表现为”从 到 “距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。例如,反映居民居住水平情况按人均居住面积分组分为:4平方米以下,46平方米,68平方米,8平方米以上等4组。适用于连续型变量或者变动范围较大的离散型变量。第30页/共87页间断组距式分组和连续组距式分组凡是组限不相连的分组,称为间断组距式分组。例如,儿童按年龄分组分为:未满1岁,12岁,3 4岁,5 9岁,10 14岁。凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限
17、,称为连续组距式分组。例如,工人按工时定额完成程度分组为90 100,100 110,110 120等组。介绍上限、下限、组距、组限。组距式变量数列中,每组区间两端的极值称组限。每一组的两个组限中,较大者叫上限,较小者叫下限。如果各组的组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。第31页/共87页“上限不在内”原则变量值只是在整数之间变动的离散型变量,可采用间断式组距分组,也可采用连续组距式分组。如果变量值在一定范围内的表现即可以是整数,也可以是小数等连续型变量,只能采用连续组距式分组。第32页/共87页等距分组与异距分组等距分组就是标志值在各组保持相等的组距
18、,即各组的标志值变动都限于相同的范围。凡是标志值变动比较均匀的情况下,都可采用等距分组。例如,工人的年龄,工龄、工资的分组等。凡是标志值在各组的组距不相等的,称为异距分组。适用范围:标志值分布很不均匀的场合;标志值相等的量具有不同意义的场合;例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。年龄分组:1岁以下按月分组,110岁按年分组,1120岁按5年分组,21岁以上按10年或20年分组等。标志值按一定比例发展变化的场合。例如,大城市的百货商店营业额差别:从5万到5千万,可采取公比为10的不等距分组:5 50万,50 500万,500 5000万。第33页/共87页六、统计分组体系 简
19、单分组与平行分组体系将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。按年龄分组按年龄分组按文化程度分组按文化程度分组2020及及2020岁以下岁以下大专及大专以上大专及大专以上21213535岁岁中专、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多、文盲小学、识字不多、文盲第34页/共87页复合分组与复合分组体系复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如 第35页/共87页如果多个复合分组组成的体系就形成了复合分组体系。例如同时选择学科
20、、本科或专科、性别三个标志进行复合分组.理科学生理科学生 本科学生本科学生 男学生男学生 女学生女学生 专科学生专科学生 男学生男学生 女学生女学生 文科学生文科学生 本科学生本科学生 男学生男学生 女学生女学生 专科学生专科学生 男学生男学生 女学生女学生 第36页/共87页(一)组距 组距是各组上下限之间的距离,即各组最大标志组距是各组上下限之间的距离,即各组最大标志值与最小标志值之差。值与最小标志值之差。在连续组距分组中:在连续组距分组中:组距上限下限组距上限下限在间断组距式分组中:在间断组距式分组中:组距本组上限前组上限(或组距本组上限前组上限(或=本组下限前组下本组下限前组下限限 或
21、本组上限本组下限或本组上限本组下限1 1)例如,商店规模按职工人数分组,分为:例如,商店规模按职工人数分组,分为:1 15人,6 10人,11 15人,等等。七、组距、组数与组中值的计算第37页/共87页(二)组数 全距是总体中最大的标志值与最小的标志值之差。组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。在等距分组的条件下,组数等于全距除以组距。在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。美国学者斯特杰斯创造了斯特杰斯经验公式:第38页/共87页(三)组中值组中值:各组中点位置所对应的变量值。其计算公式为:组中值=(适
22、用所有闭口组)或=(适用上开口组)或=(适用下开口组)第39页/共87页第三节 分配数列一、分配数列的概念与种类 二、分配数列的编制方法三、次数分布的类型第40页/共87页一、频数分布一、频数分布(一)频数分布 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。第41页/共87页(二)频数分布的两个要素1.组别:总体按某标志所分的组 2.频数(次数)和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质:(1)各组频率都是界于0和1之间的一个分数。即:第42页/共87页(2)各组频率之和等于1。即第43页/共
23、87页(三)频数分布的种类频数分布品质频数分布品质频数分布变量频数分布变量频数分布单项数列单项数列组距数列组距数列第44页/共87页1.品质频数分布:简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。2.变量频数分布:简称为变量数列,它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。单项数列:是以一个变量值为一组编制的变量频数分布。组距数列:是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。第45页/共87页二、变量数列的编制方法举例说明:某工厂生产车间人工人日产量原始数据如下:20 21 21 24 23 22 20 21 22 23
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 统计数据的整理和显示 统计数据 整理 显示
限制150内