《统计数据的搜集整理与显(1).ppt》由会员分享,可在线阅读,更多相关《统计数据的搜集整理与显(1).ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第二章第二章 统计数据的统计数据的收集、整理与显示收集、整理与显示 n第一节第一节 统计数据的收集统计数据的收集n第二节第二节 统计数据的整理统计数据的整理 n第三节第三节 统计数据的显示统计数据的显示 23第一节第一节 统计数据的收集统计数据的收集 一、一、统计数据的收集方法统计数据的收集方法1.1.统计数据收集的统计数据收集的概念概念 根据统计研究预定的目的和任务,运用科学的方法与手段,有计划、有组织地收集反映客观现实的统计资料的过程。注:注:从统计工作过程的阶段性看,统计数据的收集处于统计工作过程的基础阶段。2.2.统计数据收集的统计数据收集的方式方式 一、直接向调查对象收集反映调查单
2、位的统计数据(或称原始资料);二、收集已经加工、整理过的、说明总体现象的数据(一般称为二手资料)。43.3.统计数据的统计数据的分类分类按其性质不同分为调查数据调查数据和试验数据试验数据n调查数据调查数据 人们按既定调查方案,进行统计调查,所收集的数据。(重点重点)n实验数据实验数据 一般与自然科学、管理科学研究相关联,收集数据之前要进行试验设计,在既定控制的条件下进行试验,记录试验的过程和结果的数据。54.4.统计数据的统计数据的收集方法收集方法 对于调查数据的收集,通常称为统计调查。搜集的是调查对象的原始资料。(1)直接观察法直接观察法 由调查人员到现场直接对调查对象进行观察点数和计量。(
3、2)报告法(通讯法)报告法(通讯法)一般是由统计工作机构将调查表格分发或电传给被调查者,被调查者则根据填报的要求将填好的调查表格寄回。6(3)采访法采访法 根据被采访者的答复来收集统计资料。通常又可分为:口头询问法口头询问法和被被采访者自填法采访者自填法。(4)登记法登记法 由有关的组织机构发出通告,规定当事人在某事发生后到该机构进行登记,填写所需登记的材料。如:如:可形成网络调查。78二、二、统计调查方式统计调查方式常用的统计调查方式:常用的统计调查方式:1 1普查普查 2 2抽样调查抽样调查 3 3重点调查重点调查 4 4统计报表制度统计报表制度 91.1.普查普查n普普查查:是专门组织的
4、一种全全面面调调查查,它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。n普查的普查的特点特点:一是一种非经常性的调查;二是一种全面调查,比任何一种调查形式更能掌握大量、详细、全面的统计资料。普查的普查的组织形式组织形式:一经过组织的普查机构,配备一定数量的普查人员,对调查单位直接进行登记。如:如:全国人口普查。二利用调查单位的原始记录和核算资料,结合清库盘点,有调查单位自行填写调查报表。如:如:我国物资库存普查。10112抽样调查抽样调查 抽样调查抽样调查是一种非全面调查非全面调查,抽样调查可以分为概率抽样概率抽样和非概率抽样非概率抽样。n概率抽样概率抽样
5、 是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。(重点重点)n非概率抽样非概率抽样 是随便地或有意识地抽取单位进行调查,从而认识研究对象的变动情况或发展规律。一般不以样本数据推断总体数量特征,其调查误差也难以事先计算。n概率抽样的概率抽样的特点特点:一样本单位按随机原则抽取,排除了主观因素对选样的影响。二根据部分调查的实际资料对调查对象总体的数量特征作出估计。三抽样误差可以事先计算并加以控制。12n抽样调查的抽样调查的适用场合适用场合:一不可能或不必要进行全面调查的社会现象,采用抽样调查。如:如:显像管的耐用时数,轮胎里程数;居民收入、储蓄等
6、。二对普查资料进行必要的修正。13143重点调查重点调查 n重重点点调调查查:在调查对象中,只选择一部分重重点点单位单位进行的非全面调查非全面调查。n重重点点单单位位:它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。n特特点点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。n适适用用场场合合:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。15164统计报表制度统计报表制度 n统计报表制度统计报表制度:依照国家有关法规,自
7、上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。n统计报表的主要统计报表的主要特点特点:一报表资料的来源是建立在各个基各个基层单层单位位的原始的原始记录记录的基础上;二由于统计报表是逐级上报和汇总逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料;三是一种经常性的(连续性)调查经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。1718三、统计调查体系三、统计调查体系 n统计调查体系统计调查体系:一个国家开展统计调查方法和制度的总称。n我国的统计调查体系我国的统计
8、调查体系:建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。n统计推算统计推算:在不可能或不必直接通过调查取得资料的情况下,根据已掌握的资料,运用各种统计方法进行科学的估计推算,以间接方式取得所需的资料。n统计推算的统计推算的分类分类:静态推算静态推算:对同一时期内的未知项所作 的推算。动态推算动态推算:针对未来的时期所作的推算。19 统计推算的统计推算的内容内容:从一个现象推算到另一现象,从局部推算总体,从现在推算未来。统计推算的统计推算的方法方法:比例推算法、因素估算法、平衡估算法、线性插值法、拉格朗日插值法及各种
9、动态数列的预测方法等。2021四、统计调查方案的设计四、统计调查方案的设计 一一明确调查目的。明确调查目的。二二确定调查对象和调查单位。确定调查对象和调查单位。n调查对象调查对象,是指需要调查的现象总体。n调查单位调查单位,是指所要调查的具体单位。n报报告告单单位位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位。三三设计调查项目。设计调查项目。调查项目调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,由一系列品质标志和数量标志所构成。四四设计调查表格和问卷。设计调查表格和问卷。n调查表调查表:将各个调查项目按
10、照一定的顺序排列在一定的表格上。n调查表的调查表的形式形式:一览表一览表:把许多调查单位填写在一张表上。单一表单一表:每个调查单位填写一份,可容纳较多 标志,一般用于调查项目较多的场合。2223五五确定调查时间。确定调查时间。n调查时间调查时间是指调查资料所属的时间,在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期。如果所要调查的是时点现象,调查时间就是规定的统一标准时点。n调查期限调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。六六组织实施调查计划。组织实施调查计划。确定调查机构,组织和培训调查人员,落实调查经费的来源和开支办法,确定调查数据的
11、处理方法、报送方式和公布调查结果的时间。七七调查报告的撰写。调查报告的撰写。内容包括调查过程的描述、依调查数据所作的决策和调查结果的评价(对调查的精度、费用等)。2425五、二手资料的主要来源渠道五、二手资料的主要来源渠道1统计年鉴统计年鉴(1)中国统计年鉴 (2)国际统计年鉴 (3)地方统计年鉴 (4)中国统计摘要2有关期刊有关期刊(1)中国经济景气月报 (2)中国经济数据分析 (3)经济预测分析3有关网站有关网站(1)中国统计信息网 (2)国研网 (3)中国经济信息网 (4)中国经济时报网26第二节第二节 统计数据的整理统计数据的整理 一、数据整理概述一、数据整理概述 n数据整理的数据整理
12、的含义含义:n对统计调查所搜集到的各种数据进行分类和汇总,称为汇总性整理。(重点重点)n对现成的综合统计资料进行整理。n统计数据整理的统计数据整理的内容内容:n(1)如何对所要研究的总体进行统计分组;n(2)确定描述总体数量特征的统计指标体系。n数据整理的数据整理的程序程序:(1)统计资料的审核。(2)资料的分组和汇总。(3)编制统计表或绘制统计图。(4)统计数据资料的积累、保管和公布。2728二、统计分组二、统计分组(一)统计分组的概念与种类(一)统计分组的概念与种类1.1.统计分组的统计分组的概念概念n根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干
13、个不同性质的组,称为统计分组统计分组。n统计分组标志标志:品质标志品质标志或数量标志。数量标志。n分组的性性质质:兼有分和合双重含义,对于现象总体,是“分”,对于单位,是“合”。2.2.统计分组的统计分组的种类种类(1)按分组标志的多少,分为简简单单分分组组和复复合合分组分组。(2525页例页例)(2)按分组的标志的性质不同,分为品品质质分分组组(或称属性分组)和数数量量分分组组(或称变量分组)。n品质数列品质数列 品质分组所形成的数列。n变量数列变量数列 变量分组所形成的数列。2930(二)统计分组的原则和方法(二)统计分组的原则和方法 1 1统计分组的统计分组的原则原则:n穷穷尽尽原原则则
14、:使总体中的每一个单位都有组可归,或者说各分组的空间足以容纳总体所有的单位。n互互斥斥原原则则:就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。统计分组的统计分组的方法方法:品质分组品质分组和数量分组数量分组。2 2品质分组的品质分组的方法方法 按品质标志分组。如:男或女,经济部门划分为第一产业(农业、林业、畜牧业和渔业等)、第二产业、第三产业。3 3数量分组的数量分组的方法方法 按数量标志分组。注意注意:(1)各组数量界限的确定能反应事物质的差别。(2)根据被研究现象总体的数量特征,采用适当的分组形式,确定组距、组限。31 n单项单项式分式分组组
15、:按数量标志分组,即标志值,又称变量值。用一个变量值作为一组,形成单项式变量数列。如如:子女存活数0个、1个、2个、3个、4个、5个及其以上。适用于适用于:变动范围不大的离散型变量。n组组距式分距式分组组:将变量依次划分为几段区间,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组组距距。如如:人均收入400元以下,400800元,800 1500元,1500元2500元,2500元以上。适用于适用于:连续型变量或变动范围较大的离散型变量。32(1)单项式分组与组距式分组)单项式分组与组距式分组(2 2)间间断断组组距式分距式分组组和和连续组连续组距式分距式分组组 组距式分
16、组的每组所包含的变量值中,最小值为下限,最大值为上限。组组距距是上下限之上下限之间间的距离的距离,相相邻邻两两组组的界的界限限称为组组限限。n间间断型断型组组距式分距式分组组:组限不相连。n连续连续型型组组距式分距式分组组:组限相连(或相重叠),即以同一数值作为相邻两组的共同界限。“上限在不内上限在不内”原原则则:凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。(互斥原则)33(3 3)等距分)等距分组组与异距分与异距分组组n等距分组等距分组:标志值在各组保持相等的组距。适用于适用于:标志值变动比较均匀的情况。n异距分组异距分组:各组的组距不相等。适用于适用于
17、:标志值分布很不均匀 标志值相等的量具有不同意义 标志值按一定比例发展变化3435(4 4)组距式分组相关指标的计算)组距式分组相关指标的计算n组距组距:n连续组距分组的组距=本组上限本组下限 n间断式组距且等距分组的条件下:组距=本组上限前组上限 =后组下限本组下限 =本组上限本组下限+1n组数组数:斯特杰斯经验公式:组数组数=1+3.3 Log N 由此推出:组距组距=(最大变量值(最大变量值-最小变量值)最小变量值)/(1+3.3Log N)n组中值组中值:例例如如:17-19岁、20-22岁两组,组距3岁,组中值18.5岁和21.5岁,因其上限应为20岁和23岁。n开口组的组距与组中值
18、开口组的组距与组中值:在编制组距式变量数列时,使用“以上”或“以下”这样不确定组距的组,称为开开口口组组。其组组距距以相邻组的组距来确定。3637三、频数分布三、频数分布(一)频数分布的基本概念(一)频数分布的基本概念1、频数分布的、频数分布的定义定义 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算其相应出现的次数,这样得到的分布称为频数分布频数分布或次数分布次数分布。通过对零乱的、分散的原始资料进行有次序的整理,形成一系列反映总体各组之间单位分布状况的数列,即为分布数列分布数列。n品质分布数列品质分布数列 按品质标志分组所形成的数列,亦称品品质数列质数列。n变量分布数列变
19、量分布数列 按数量标志分组所形成的数列,亦称变变量数列量数列。2、分布数列的两个、分布数列的两个要素要素n总体按某标志所分的组组,若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用x 表示;n各组所出现的单位数,即频数频数,亦称次数次数,用f 表示。3839 3 3频率频率 fi:第i组频数n频率的性质性质 (1);(2)。4 4、频频数密度数密度与与频频率密度率密度(异距分组)(A)频数密度=频数/组距(2.7)(B)频率密度=频率/组距(2.8)(二)变量数列的编制方法(二)变量数列的编制方法例2-1:(课本29页)表表2-2 502-2 50个乡镇的年
20、财政总收入频数分布表个乡镇的年财政总收入频数分布表40按年财政总收入分组按年财政总收入分组(x)(万元)(万元)频数(频数(fi)(个)(个)频率(频率(%)800900510900100012100011008161100120011221200130011221300140071414001500481500以上以上36合计合计5010041四、累计频数与累计频率四、累计频数与累计频率1向上累计频数(或频率)分布:向上累计频数(或频率)分布:先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向上累计频数向上累计频数:某组上限以下的各组单位数之和是多少。向上累计频率向上累计频率:某
21、组上限以下的各组单位数之和占总体 单位数的比重。2向下累计频数(或频率)分布:向下累计频数(或频率)分布:先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。向下累计频数向下累计频数:某组下限以上的各组单位数之和是多少。向下累计频率向下累计频率:某组下限以上的各组单位数之和占总体 单位数的比重。例例2-2:表:表2-3 50个乡镇的年财政总收入累计表个乡镇的年财政总收入累计表财政总收入分组的上限财政总收入分组的下限4243 第三节第三节 统计数据的显示统计数据的显示一、统计表一、统计表(一)统计表的(一)统计表的定义定义和和结构结构 1.1.统计表的统计表的定义定义 对统计调查所获得的
22、原始资料进行整理,得到说明社会现象及其发展过程的数据,并把这些数据按一定的顺序排列在表格上,就形成了统计表统计表。特特点点:可以清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。2.2.统计表的统计表的结构结构 (1)从表式上看,表格包括总总标标题题、横横行行标标题题、纵纵栏栏标题标题和指标数值指标数值四个部分。指指标标数数值值:用来说明总体及其组成部分的数量特征,是统计表格的核心部分。(2)从内容上看,统计表由主主词词栏栏和宾宾词词栏栏两个部分组成。主词栏主词栏:说明的总体及其组成部分。宾词栏宾词栏:说明总体数量特征的统计指标。44表表2-4 2004年我国进出
23、口主要分类情况表年我国进出口主要分类情况表 总标题总标题 单位:亿美元指标指标绝对数绝对数比上年增长(比上年增长(%)进出口总额进出口总额出口额出口额 其中:一般贸易其中:一般贸易 加工贸易加工贸易进口额进口额 其中:一般贸易其中:一般贸易 加工贸易加工贸易1154859342346328056142482221735.735.433.935.736.032.336.1纵栏纵栏标题标题横横行行标标题题指指 标标 数数值值主词栏主词栏宾词栏宾词栏4546(二)统计表的(二)统计表的分类分类 1、按主词的结构分类,根据主词是否分组和分组的程度,分为简单表简单表、分组表分组表和复合表复合表。(1)简
24、简单单表表:主词未经任何分组的统计表,也称一览表。(表2-5)(2)简简单单分分组组表表:主词只按一个标志进行分组形成的统计表。(表2-6)(3)复复合合表表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。(表2-4)2、按宾词设计分类,可分为宾宾词词简简单单排排列列、分分组组平平行行排排列列和分组层叠排列分组层叠排列等三种。(1)宾宾词词简简单单排排列列:宾词不做任何分组,按一定顺序排列在统计表上。(表2-4)(2)宾宾词词分分组组平平行行排排列列:宾词栏中个分组标志彼此分开,平行排列。(表2-7)(3)宾宾词词分分组组层层叠叠排排列列:统计指标同时有层次地按两个或两个以上标志分
25、组,各种分组层叠在一起。(表2-8)注注:主词分组与宾词分组的区别区别。47(三)统计表的(三)统计表的设计设计 要求要求:简练、明确、实用、美观,便于比较。(1)线条的绘制线条的绘制:上下端粗线,左右端开口式(2)合计栏的设置合计栏的设置:最后一行,最前或最后一列。(3)标题设计标题设计:简明扼要。(4)指指标标数数值值:数字填写整齐,对准位数。数字小可忽略不计是,写上“0”;却某项数字资料时,用“”;不应有数字时,用“”。(5)计计量量单单位位:必须注明数字资料的计量单位。表头右上方或各横行标题后。(6)注释或资料来源注释或资料来源:必要时在统计表下加注解或说明。4849 二、统计图二、统
26、计图(一)(一)直方图直方图 用直方形的宽度和高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(左方)和比率(或频率右方)。直观地描述数据整理的结果。图2-1 学生考分分布直方图(二)(二)折线图折线图 以线段的起伏表示其数量分布的特征。绘图时可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连线而成。图2-2 学生考分分布折线图50(三)(三)曲线图曲线图 当变量数列的组数无限多时,折线便表现为一条平滑的曲线。绘制方法与折线图基本相同,只是在连接各组次数坐标点是应用平滑曲线。图2-3 学生考分分布曲线图51(四)(四)累计曲线图累计曲
27、线图1、累计曲线图的绘制、累计曲线图的绘制 累计频数(频率)分布图分为向向上上累累计计频频数数(频频率率)分分布布图图和向向下下累累计计频频数数(频频率率)图图。均以分组变量为横轴,以累计频数(频率)为纵轴。向向上上累累计计曲曲线线:在直角坐标系中将各组组距的上上限限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连。向向下下累累计计曲曲线线:在直角坐标系中将各组组距的下下限限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连。52例例2-2:表:表2-3 50个乡镇的年财政总收入累计表个乡镇的年财政总收入累计表财政总收入分组的上限财政总收入分组的下限53图2-
28、4 累计频数(频率)曲线图累计频数(乡镇数)注注:向上累计曲线呈上升状,向下累计曲线呈下降状。组的次数(或频率)越少,曲线越平缓;组的次数(或频率)越多,曲线越陡峭。542、洛伦茨曲线图、洛伦茨曲线图 美国洛伦茨博士(Dr.M.o.Lorenz)把累计频数(或频率)分布曲线运用于研究社会财富、土地和工资收入的分配是否公平。这种累计曲线又称洛伦茨曲线图洛伦茨曲线图。绘制方法绘制方法:(1)将分配对象和接受分配者的数量化成结构相对数并进行向上累计向上累计;(2)纵轴和横轴均为百百分分比比尺尺度度,纵轴自下而上,用以测定分配的对象(如一国财富、土地或收入等的分配状况),横轴由左向右用以测定接受分配者
29、(如一个地区人口);(3)根据计算所得的分配对象和接受分配者的累累计计百百分分数数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即洛伦茨曲线。55例例2-4 表2-10 某地区收入分配情况表56基基尼尼系系数数:用实际收入分配曲线与绝对平等线所包围的面积对比总面积。用以衡量收入分配的平等与否。注注:基尼系数值越小,收入分配越平等;基尼系数值越大,收入分配越不平等。图2-5 洛伦茨曲线示意图5758三、频(次)数分布图的类型三、频(次)数分布图的类型 1钟型分布钟型分布 特征特征:两头小,中间大。(I)以变量平均数为对称轴,左右对称,两侧变量值分布的次数随着与其平均值距离的增大而减少。统计学中称为正态分布。(II)非对称分布,正偏(右偏)分配。(III)非对称分布,负偏(左偏)分配。()()()592U型分布型分布特征特征:两头大,中间小。例如例如:人口按年龄死亡率的分布,幼儿老年人死亡率高,中青年死亡率低。10 20 30 40 50 60 70 805040302010 0死亡率()年龄603J型分布型分布次数随着变量的增大而增多。正J型图反J型图次数随着变量的增大而减少。
限制150内