计算机数据库(经济会计类)数据收集与整理随堂讲解.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机数据库(经济会计类)数据收集与整理随堂讲解.ppt》由会员分享,可在线阅读,更多相关《计算机数据库(经济会计类)数据收集与整理随堂讲解.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 统计数据的收集一、数据的来源一、数据的来源从统计数据的获得与使用角度来看,统计数据主要来源于两种渠道:一是直接的调查和科学实验,这是统计数据的直接来源,称为原始数据。二是他人调查或实验的数据,这是统计数据的间接来源,称之为次级数据,如统计年鉴、有关期刊和相关网站。二、调查方式二、调查方式(一一)统计报表)统计报表统计报表(statisticalstatements)是经常性的全面调查方式。它以一定的原始数据为基础,按照国家统一规定的表式、指标内容、报送时间和报送程序,自上而下地统一布置,自下而上地提供基本统计资料的一种统计调查形式。通常把这一整套提供基本统计资料的组织形式叫做统计报表制
2、度,把提供统计基本资料的表格叫做报表。统计报表按照其报送周期的长短,可分为日报、旬报、月报、季报、半年报、年报等。二、调查方式二、调查方式(二)(二)普查普查普查(generalinvestment)是一种专门组织的一次性全面调查。一般用于调查反映一定时点或时期社会经济现象的量。它主要用于搜集一些比较全面、细致而又不能或不宜用经常性调查来取得的统计资料。常见的普查有人口普查、工业普查、农业普查等。二、调查方式二、调查方式1普查的方式普查的方式一是建立专门的普查机构,配备一定数量的普查人员,对观测单位直接进行登记,如我国历次的人口普查等;二是利用观测单位的原始记录和核算资料,发放调查表,由观测单
3、位按要求填报,如工业普查。二、调查方式二、调查方式2普查普查的的基本原则基本原则必须统一规定数据所属的标准时点;普查范围内各调查点要统一行动,在方法、步调上保持一致,并力求在最短的期限内完成登记工作;普查项目要统一规定,一经确定就不能任意增减更改,同一种普查的各次普查项目要力求保持一致和稳定,以便对比分析;普查时期应选择在被调查对象变动最小的时期或者普查工作量方便的时期;实现普查的周期化,按固定的周期进行。二、调查方式二、调查方式(三)(三)抽样调查抽样调查抽样调查(samplinginvestigation)是非全面调查的一种主要形式。按照抽取样本原则的不同,抽样调查分为概率型抽样调查和非概
4、率型抽样调查。概率型抽样调查是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中。非概率抽样是凭人们的主观判断或根据便利性原则来抽取样本。二、调查方式二、调查方式(四四)重点调查)重点调查重点调查(investigationofkeyunits)是一种非全面调查,它是指在所研究对象中选择一部分重点单位来进行调查,尽管其数目不多,但对调查的指标数值来说,它们在总体中却占绝大比重。重点调查还可以和抽样调查结合起来应用,将调查对象分为重点单位和非重点单位两种,对重点单位实行全面调查,而对非重点单位实行抽样调查,以获得很好的效果。二、调查方式二、调查方式(五五)典型调查典型调
5、查典型调查(typicalinvestigation)也是一种非全面调查,它是指从研究对象中有意识地选择一个或几个有代表性的单位进行深入细致的调查,以了解其本质和规律性,用以概括同类现象发展变化的一般趋势。典型调查的特点就是调查单位少,节省各种费用。典型调查的关键是所选典型单位是否真正具有代表性。三、统计调查方案三、统计调查方案(一)确定调查目的(一)确定调查目的调查目的即为什么调查,调查要解决什么问题、具有什么意义等。调查目的的表述应具体明确、中心突出、针对性强。例如,我国2010年第六次人口普查的目的是“查清2000年第五次全国人口普查以来我国人口在数量、结构、分布和居住环境等方面的变化情
6、况,为实施可持续发展战略,构建社会主义和谐社会,提供科学准确的统计信息支持。”三、统计调查方案三、统计调查方案(二)确定调查对象和调查(二)确定调查对象和调查单位单位调查对象是指在调查中被研究对象的总体,它是由性质相同的若干个体单位构成的。构成调查对象的个体单位称为调查单位,它随着调查对象的变化而变化。例如,我国第六次人口普查规定,“人口普查的对象是普查标准时点在中华人民共和国境内的自然人以及在中华人民共和国境外但未定居的中国公民,不包括在中华人民共和国境内短期停留的港澳台居民和外籍人员。”人口普查的调查单位是每一个人。三、统计调查方案三、统计调查方案(三)确定调查项目(三)确定调查项目确定调
7、查项目即确定调查什么。调查项目是指需要调查登记的调查单位的特征,如一个人的性别、年龄、收入,一个企业所属行业类别、产品产量、产值等。三、统计调查方案三、统计调查方案(四)调查表格和问卷的(四)调查表格和问卷的设计设计调查项目通常以调查表和调查问卷的形式反映,因此它们是统计调查的主要工具,是调查方案的核心。1调查表调查表是将各个调查项目按照一定的顺序排列而形成的表格。调查表一般由表头、表体和表外附加三部分组成。表头是调查表的名称,用来说明调查的内容、被调查单位的名称和性质等;表体是调查表的主要内容,包括调查的具体项目;表外附加通常由填表人签名、填报日期和填表说明等内容组成。三、统计调查方案三、统
8、计调查方案调查表一般有两种形式:一览表和单一表。一览表是在一个调查表中登记多个调查单位的内容,如表2-1所示。表2-1身体基本情况调查表填表人填表日期检查检查序号序号姓名姓名性别性别出生出生年月年月年龄年龄体重体重身高身高胸围胸围肺活肺活量量三、统计调查方案三、统计调查方案单一表是在一个调查表中只登记一个调查单位的内容,如表2-2所示。表2-2劳动情况年报表指标名称指标名称指标代码指标代码计量单位计量单位本年实际本年实际甲甲乙丙1一、从业人员年末人数一、从业人员年末人数01人年末职工人数年末职工人数02人工人与学徒工人与学徒03人工程技术人员工程技术人员04人管理人员数管理人员数05人大专及大
9、专以上学历人员数大专及大专以上学历人员数06人高级职称高级职称07人中级职称中级职称08人二、从业人员劳动报酬总额二、从业人员劳动报酬总额09万元职工工资总额职工工资总额10万元三、下岗职工人数三、下岗职工人数11人下岗职工生活费下岗职工生活费12万元四、离退休人员数四、离退休人员数13人离退休职工保险、福利费用总额离退休职工保险、福利费用总额14万元离退休金离退休金15万元医疗费医疗费16万元三、统计调查方案三、统计调查方案2调查问卷调查问卷是一种特殊的调查形式,把所有要调查的项目以问题及其可能的答案按照一定的结构和顺序排列所形成的问答卷。根据调查目的,在调查对象中随机选择或有意识地确定调查
10、单位,以书面文字或表格形式了解被调查者的意见,调查者自愿地回答问卷中所提出的问题。调查表格和问卷的设计要简明扼要,问题通俗易懂,以保证所收集资料的准确性。三、统计调查方案三、统计调查方案(五)(五)确定调查时间和地点确定调查时间和地点统计调查时间包括调查时间调查时间和调查期限调查期限两种含义。调查时间指调查资料所属的时间,在统计调查中,如果调查的是时期对象,必须明确规定调查资料所反映的起止日期。如调查2004年全国国内生产总值,则调查时间是从2004年1月1日起至12月31日止。如果所要调查的是时点对象,调查时间就是规定的统一的标准时点。例如,第六次人口普查的标准时点是2010年11月1日零时
11、。调查期限则是进行调查工作的时限,包括收集资料和报送资料工作所需的时间,应尽可能缩短。如2010年人口普查规定,2010年11月1日-10日人口登记完毕,则调查期限为11月1日-10日共10天。所谓调查地点就是调查单位所在地。调查地点根据调查目的来决定,例如研究棉花生产成本问题时,调查地点就要在棉花生产区。三、统计调查方案三、统计调查方案(六)确定调查的组织实施计划(六)确定调查的组织实施计划调查的组织与实施工作包括:调查人员的选择、组织和培训,调查表格、调查问卷和调查员手册的印刷,调查经费的来源和开支预算等。第二节 统计数据的整理一、统计数据的预处理一、统计数据的预处理(一)数据的审核对于通
12、过直接调查取得的原始数据,要从完整性和准确性两方面去审核。准确性是审核的重点,主要通过逻辑检查饿计算检查进行,逻辑点差是审核统计数据的内容是否合理、有无相互矛盾或不符合实际的地方,计算检查是通过计算复核各项资料的数据有无差错,各项指标的计算方法是否恰当,计算单位是否正确,有关指标间的平衡关系是否保持等。完整性是检查调查单位是否有遗漏,调查项目是否填写齐全等。对于通过其他渠道取得的第二手数据,除了审核其完整性和准确性之外,还应审核期适用性和实效性。主要是检查数据的来源、计算口径和调查时间等。一、统计数据的预处理一、统计数据的预处理(二)数据的筛选一是将某些不符合要求的数据或有明显错误的数据予以剔
13、除。如果审核中发现的错误无法更正或者有些数据不符合调查的要求而无法弥补时,就要对这些数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。一、统计数据的预处理一、统计数据的预处理(三)数据的排序数据排序就是按照一定规则将数据进行排列,目的是便于研究者通过浏览数据发现一些明显的趋势或特征,找到解决问题的方法和线索。排序还有助于对数据进行纠错,为重新分组会归类提供依据。例如,美国的财富杂志每年都要排出世界企业500排行榜,通过这一信息,经营者不仅能知道本企业所处的地位和差距,还可以了解竞争对手的状况,从而有效地制定本企业的发展规划和战略目标。二、二、统计数据的分组统计数
14、据的分组(一)统计分组的概念统计分组就是根据统计研究的任务和社会经济现象的最本质特征,把统计总体按照一定的标志划分为若干个不同类型或不同性质的组成部分的一种统计方法。统计分组的对象是总体。通过统计分组,使同一组内的各单位性质相同,不同组的单位性质相异。能够对统计总体进行分组,是由于统计总体所具有的差异性决定的。统计分组的各个单位,一方面,在某一个或某些标志上具有相同的性质,可以结合在同一性质的总体中;另一方面,在其他一些标志上具有彼此相异的性质,从而又可以被区分为性质不同的若干个组成部分。二、二、二、二、统计数据的分组统计数据的分组统计数据的分组统计数据的分组(二)统计分组的原则统计分组必须遵
15、循两个原则:穷尽原则和互斥原则。穷尽原则是使总体中的每一个单位都有组可归;互斥原则是使总体中的每一个单位都只有一个组可归。即总体中的每一个单位有且仅有一个组可归。例如,如果将企业职工按文化程度,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么文盲或大学以上的职工则无组可归。再例如,某商场把服装分为女装、男装和童装三类,就不符合互斥原则,因为童装也有男、女之分。二、二、统计数据的分组统计数据的分组(三)统计分组的种类1.统计分组按所选择的标志数目,分为简单分组、复合分组和体系分组。简单分组是只采用一种分组标志对总体单位进行分组的方式。例如,将职工按性别、年龄和文化类别等标志进行分组。复合分组
16、是对总体选择两个或两个以上标志的多层次分组方式。复合分组的特点是用第二标志对第一标志所分的各组进行再分组,用第三标志对第二标志所分的各组进行再分组,依次类推。例如,将职工先按年龄进行分组,在此基础上,再按文化程度分组。体系分组是用两个或两个以上有联系的标志并列起来对总体进行逐个简单分组而组成的分组体系。二、二、统计数据的分组统计数据的分组表2-3就是复合分组和体系分组的结合表2-3农村居民家庭平均每人纯收入项目项目年份年份19851990199520002001纯收入纯收入397.60686.311577.742253.422366.40按收入来源分按收入来源分1基本收入基本收入368.136
17、57.351479.492129.572231.53(1)劳动者收入)劳动者收入72.15138.80353.70702.30771.90(2)家庭经营纯收入)家庭经营纯收入295.98518.551125.791427.271459.63农业收入农业收入202.10344.59799.44833.93963.62林业收入林业收入6.167.5313.5222.4422.10牧业收入牧业收入51.9696.81127.81207.35211.96渔业收入渔业收入3.597.1115.6926.9528.87其他收入其他收入32.1962.51169.33336.60333.082转移性和财产性
18、收入转移性和财产性收入29.4728.9698.25123.85134.87按收入性质分按收入性质分1生产性纯收入生产性纯收入367.69657.351479.492129.582231.58第一产业收入第一产业收入298.28510.86996.511125.341165.17第二产业收入第二产业收入29.4770.68287.24488.89532.61第三产业收入第三产业收入39.9575.81195.74515.35533.802非生产性纯收入非生产性纯收入29.9128.9698.25123.84134.82二、二、统计数据的分组统计数据的分组2.统计分组按分组标志的性质不同,分为品
19、质分组和数量分组。品质分组也叫属性分组,是指总体按某一个或某几个品质标志进行分组,并在品质标志变异的范围内,划定各组的性质界限,根据每个个体的标志标线把他们分别归入不同的组中。一般地,对于以定类尺度或定序尺度计量的,采用品质分组。例如,职工按性别分组,企业按经济类型分组等。数量分组也叫变量分组,是指总体按某一个或几个数量标志进行分组,并在数量标志变异的范围内,划定各组的数量界限,根据每个个体的标志表现(标志值或变量值)把它们分别归入不同的组中。例如,企业按固定资产、盈利能力分组。品质分组所形成的数列称为品质数列,数量分组所形成的数列称为变量数列。二、二、统计数据的分组统计数据的分组3.统计分组
20、按分组作用和任务不同,分为类型分组、结构分组和分析分组。类型分组是把复杂的现象总体划分为若干个不同性质的部分。例如,我国将企业登记注册类型分为内资企业,港、澳、台商投资企业三大类。结构分组是在对总体分组的基础上计算出各组对总体的比重,借此研究总体各部分的结构。分析分组是为研究现象之间的依存关系而进行的统计分组。分析分组的分组标志称为原因标志。如影响某种商品消费需求的因素有:该商品的价格、消费者收入、相关商品的价格、消费者偏好以及消费者对该商品预期等。二、二、统计数据的分组统计数据的分组(四)数据的分组整理1.频数与频数分布频数也称次数,是落在每一个组中的数据个数。相对频数(频率)是各组中的数据
21、个数或次数占全部数据总数的比例。反映总体的结构和构成。假定总体数量为N,每一组的数量分别为,则各部分的比例之和为1,即二、二、统计数据的分组统计数据的分组累积频数是将各有序类别或组的频数逐级累加起来。有两种方法:其一是从类别顺序的开始一方,向最后一方累加频数,数值型数据则是从变量值小的一方,向变量值大的一方累加频数,称为向上累积;其二是从类别顺序的最后一方,向开始一方累加频数,数值型数据则是由变量值大的一方,向变量值小的一方累加频数,称为向下累积。通过累积频数,可以很容易地看出某一类别(或数值)以下或某一类别(或数据)以上的频数之和。累积频率是将各有序类别或组的频率逐级累加起来,也有向上累积和
22、向下累积两种方法。频数分布表也称次数分布表,是各组及其相应的频数(还可包括频率、累积频数和累积频率)依一定的次序排列而成的表格。二、二、统计数据的分组统计数据的分组2.品质数列的分组整理按品质标志分组时,其组数的确定主要取决于两个因素统计研究的任务与事物的特点。对事物进行品质分组,其组数的确定主要取决于事物本身的特点。事物本身具有的既定属性使我们确定组数的基本依据。例如人口按性别分组,就只能分为男女两组。对于有些事物构成比较复杂,组数可多可少,需要考虑统计研究的具体要求来确定组数。例如人口按职业分组,就可以按照统计研究的任务来确定分几组。二、二、统计数据的分组统计数据的分组表2-4是一项关于工
23、资情况的研究,调查人员在某城市抽取300户,其中调查的一个问题是:“您对家庭目前的收入是否满意?”a.非常不满意;b.不满意;c.一般;d.满意;e.非常满意。经过分组整理后,可形成一个顺序数据频数分布表。表2-4某城市家庭对住房状况满意程度的频数分布满意程度满意程度频数(户)频数(户)频率频率(%)向上累积向上累积向下累积向下累积频数(户)频率(%)频数(户)频率(%)非常不满非常不满意意217.0217.0300100.0不满意不满意9933.012040.027993.0一般一般7826.019866.018060.0满意满意6421.326287.310234.0非常满意非常满意381
24、2.7300100.03812.7合计合计300100.0二、二、统计数据的分组统计数据的分组3.变量数列的分组整理变量数列按照分组标志的性质不同可以分为离散型变量数列和连续型变量数列。离散型变量数列按数量标志分组时,根据每组数量标志值的具体表现,分为单项式分组和组距式分组两种。连续型变量数列只能进行组距式分组。二、二、统计数据的分组统计数据的分组(1)单项式分组单项式分组就是把每一个具体的数量标志值作为一组,按照标志值的大小顺序排列,形成单项式变量数列。这种分组方法通常只适合离散变量且变量值较少的情况,否则应采用分组距式分组。表2-5在一项有关电脑使用问题的研究中,调查人员在某大学随机抽取了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 数据库 经济 会计 数据 收集 整理 讲解
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内