数据搜集整理与SPSS基础.pptx
《数据搜集整理与SPSS基础.pptx》由会员分享,可在线阅读,更多相关《数据搜集整理与SPSS基础.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学时:8授课内容:数据搜集整理与SPSS基础目的要求:掌握统计数据收集、调查设计、统计数据整理、SPSS基础及其在统计数据整理中的应用。旧知复习:概率论基础1.事件独立是如何定义的?2.贝叶斯公式的形式如何?3.什么是概率分布函数?1第1页/共81页2.1 统计数据的搜集统计数据搜集的概念根据统计研究的目的,采用科学的方法,有计划有组织地搜集统计资料的过程。统计数据搜集的原则准确性:统计调查资料要客观、真实地反映所研究的现象。及时性:统计调查资料应按照统一规定的时间 搜集完成并上报。全面性:统计调查应按调查方案和调查表的要求,无遗漏地全面搜集统计资料。2第2页/共81页2.1.1 统计数据的概
2、念与来源(1)统计数据概念统计工作过程中所取得的各项数字资料以及与之相关的其他实际资料的总称。(2)统计数据的来源数据的直接来源:在统计研究中,调查人员通过直接的调查或科学实验获得的统计数据。数据的间接来源:对于某些研究问题,如果与研究内容相关的数据资料已经存在,调查者所要做的只是将这些数据资料搜集起来,经过再加工处理使之变成可以使用的数据资料。3第3页/共81页2.1.2 统计调查与统计调查体系(1)统计调查:是根据统计研究的目的、要求和任务,采用科学的调查方法,有计划、有组织地收集统计资料的工作过程。(2)统计调查的方法观察法:由调查人员到现场对调查对象直接计数和计量以获得统计资料的方法。
3、通过观察法搜集的数据受调查人员主观意识影响小,相对比较可观;但需要花费大量的人力、物力、财力、时间;具有一定局限性。报告法:以原始记录或核算资料为基础,由调查单位按规定填写调查表,并按统一规定的时间上报的方法。获得资料相对准确、全面。询问法:调查人员通过询问的方式,从调查对象的回答中获得统计资料的方法。根据询问方式的不同,询问法又分为访问调查法、电话调查法、被调查者自填法等。4第4页/共81页询问法的子类型特征:询问调查法:即采访法,真实性较强,但费用高,被调查者受调查人员主管意识影响大。电话调查法:范围广、速度快、费用低,但问题不宜过多。被调查者自填法:被调查者受调查人员影响小,但由于调查人
4、员不在场,容易产生理解上的误差。实验调查法:在控制条件下操控某种变量来考察它对其他变量影响的研究方法。如霍桑实验(照明实验、福利实验、访谈实验、群体实验)。(3)统计调查的种类按搜集资料的组织方式不同,分为统计报表制度和专门调查 统计报表制度是由政府主管部门根据统计法规,以统计表格形式和行政手段自上而下布置,而后由企、事业单位自下而上层层汇总、逐级上报,提供基本统计数据的调查方式。专门调查是指为了研究某些特定的社会经济现象而专门组织的调查。如普查、抽样调查、重点调查、典型调查等。5第5页/共81页按调查对象所包括的范围不同,分为全面调查和非全面调查全面调查是对构成调查对象总体的全部单位无一例外
5、地进行调查。资料全面、准确,但调查工作量大,成本高。非全面调查是对构成调查对象的部分单位的调查。工作量小、成本低,但搜集到的资料存在统计误差。按调查登记时间是否连续,分为经常性调查和一次性调查经常性调查是随着调查对象的变化,经常地、连续不断地进行调查登记,以了解事物在一定时期内发展变化的全过程。如工业企业对产品质量和原材料消耗量的调查。一次性调查是指间隔一段时间,对调查对象进行不连续地调查登记,以了解事物在一定时点上的状态。如人口普查。(4)统计调查体系1994年国家统计局“全国统计工作会议”提出了“以必要的周期性普查为基础,以经常性的抽样检查为主体,同时辅之以重点调查、科学推算和全面报表等多
6、种方法综合运用”的统计调查体系。常用统计调查组织形式主要包括统计报表制度、普查、抽样调查、重点调查、典型调查等五种。6第6页/共81页统计报表制度概念由政府主管部门根据统计法规,以统计表格形式和行政手段自上而下布置,而后由企、事业单位自下而上层层汇总、逐级上报,提供基本统计数据的一种调查方式。统计报表的分类根据报表内容和实施范围,分为国家统计报表、业务部门统计报表和地方统计报表。根据报送周期长短,分为日报、旬报、季报和年报。报表报送的周期越短,报送的指标项目越简,反之指标项目越详,日报、旬报由于时效性强,也称为进度报表。根据报送单位,分为基层统计报表和综合统计报表。基层统计报表指由基层企事业单
7、位填报的报表;综合统计报表指由主管部门根据基层报表逐级汇总填报的报表。根据调查范围,分为全面统计报表和非全面统计报表。全面统计报表指要求调查对象的每一个单位都要填报的报表;非全面统计报表指要求调查对象的一部分单位填报的报表。我国的统计报表大多属于全面报表。根据报送方式的不同,可分为邮寄报表和电讯报表。月报、季报、年报等一般采用邮寄报表;时效性强的日报、旬报常采用电信方式。7第7页/共81页普查概念为了某一特定目的而专门组织的一次性全面调查,常被用来说明现象在一定时点上的全面情况组织形式 建立专门机构,配备大量人员,对调查单位进行直接的登记 利用调查单位的原始记录和核算资料,颁发调查表,由登记单
8、位填报 原则统一时点:调查资料必须反映调查对象在这一时点上的状况,以避免发生登记重复和遗漏的问题。短期同步:各调查单位或调查点尽可能同时登记,并在尽量短的期限完成,在方法上、步调上保持一致,保证统计资料的准确性和及时性。如我国人口普查的调查期限一般是10天。统一口径:调查项目应统一规定,且项目一旦确定不得任意改变或删减,以免影响汇总综合,降低资料质量。固定周期:普查尽可能按照一定周期进行,以便进行历史资料动态对比,研究调查对象的发展变化规律。改革开放以来,我国对有关国情的重大信息采取每隔10年或5年进行一次的周期调查。8第8页/共81页抽样调查概念从总体中抽取一部分单位作为样本进行调查,并根据
9、样本的数量特征去推断总体的数量特征 抽取样本原则概率抽样:抽取调查样本时遵循随机原则(如无特殊说明,下文提到的抽样调查都是指概率抽样调查)非概率抽样:调查者根据自己的方便或主观判断抽取样本的方法抽样调查的特点按照随机原则从总体中抽取样本单位,力求样本结构和总体结构的最大程度相似。根据所调查样本的实际情况对调查总体的数量特征作出估计 用样本数据推算总体的特征,不可避免地存在误差,但这个误差可以事先计算并加以控制。优势工作量小、经济性强、时效性高,通常用于一些不可能或没有必要进行全面调查的情况,如导弹射程、产品寿命。另外抽样调查还常用于对全面调查资料的检验补充和修正。9第9页/共81页重点调查概念
10、在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法。例如,要了解全国钢铁行业生产的基本情况,只需要对鞍钢、武钢、首钢、宝钢、包钢等几个钢铁企业进行调查 关键问题确定重点单位。重点单位可以是重点地区(产区、市场、出口基地等),也可以是重点企业、主要产品或商品,在具体问题中应视情况而定 特点允许较多的项目或指标以了解详细情况以较低成本把握整体状况适用于存在重点单位的情形,可以反映总体发展趋势,但不能用以推断总体10第10页/共81页典型调查概念根据调查目的和要求,在对调查对象进行初步分析的基础上,有意识地选取少数具有代表性的典型单位进行深入细致的调查研究,借以认识事物发
11、展变化规律及本质的一种非全面调查 特点典型调查单位的确定更多地取决于调查者主观的判断与决策,要求研究者有较丰富的经验,在划分类别、选择典型上有较大的把握侧重于定性分析可用于补充和验证全面统计数字,但不具备由部分单位推算总体数量特征的作用。11第11页/共81页2.1.3 抽样调查(1)基本概念总体与样本总体/全及总体:所要认识的对象的全体,由具有共同性质的许多单位组成,总体单位数量一般用N表示 抽样框:指包含全部抽样单位的名单框架样本/子样:从总体中随机抽取出来的部分单位所构成的集合样本容量:样本的单位数,其数量一般用n表示抽样比:样本容量n与总体单位数N的比值n/N总体指标和样本指标总体指标
12、/全及指标:根据总体各单位的标志值和标志特征计算的、反映总体数量特征的综合指标对于变量总体,设总体单位数为N,变量为X,变量值分别为X1,X2,XN,则总体平均数和总体方差如 和 所示。对于属性总体,设总体N个单位中,有N1个单位具有某种属性,则总体成数如P所示。12第12页/共81页样本指标:根据样本各单位的标志值或标志特征计算的、反映样本总体特征的综合指标。一般用小写字母表示样本指标 对于从变量总体中抽取出来的样本,设样本m各单位各单位变量值分别为x1,x2,xn,则样本平均数和样本方差为 对于从属性总体中抽取出来的样本,设样本n个单位中有n1个单位具有某种属性,则样本成数p为(2)抽样调
13、查的方法重复抽样从总体中抽取样本时,每次抽取的样本单位,在记录其有关标志表现后都要放回总体中去参加下一次抽取不重复抽样/不放回式抽样从总体中抽取样本时,每次抽取的样本单位,在记录其有关标志表现后不再放回总体13第13页/共81页(3)抽样调查的组织形式简单随机抽样/纯随机抽样按照随机原则从总体中逐个地抽取样本单位,因此每个单位的入样概率是相等的 需要进行编号、列表,然后抽取,不适用于总体单位数巨大的调查类型抽样/分层抽样将总体中的各单位按照某种特征或某种规则划分成若干个不同的类型组,然后从各类型组中独立地、随机地抽取样本,再将各类型组的样本结合起来,对总体的目标量进行估计 可以保证样本中包含各
14、种特征的抽样单位,使样本结构更接近总体结构。如分年龄段抽取样本等距抽样/系统抽样将总体中各单位按照某一标志顺序排列,在规定的范围内随机确定起点,然后按照一定的间隔抽取其他样本单位样本单位均匀分布在总体中,等距抽样精度一般较简单抽样优实施时,先编号 ,然后计算抽样距离 ,其中N为总体单位数,n为样本容量,然后随机取数字k,抽取如下编号的样本14第14页/共81页整群抽样将总体各单位划分为若干群,然后以群为单位从中随机抽取一些群,对抽中群的所有单位都进行调查实施方便,但误差较大。宜多抽取一些群,群应均匀分布于样本总体中。如抽取某几个班对全校学生视力情况进行统计研究多阶段抽样/多级抽样/阶段抽样将对
15、总体单位的整个抽样过程分为两个或更多个阶段进行,先从总体中抽选若干个大的样本群,称为第一阶段单位,然后从被抽中的若干个大的单位群中,抽选较小的样本单位,以此类推。如手机售后服务满意度研究,先抽取省,继而抽取市、县、区。多阶段抽样保留了整群抽样的优点,成本低。我国许多全国性的大规模抽样就是多阶段抽样。15第15页/共81页2.2 调查设计统计调查需要投入大量的人力、物力和财力,为了保证统计调查资料的准确、及时、全面,在组织调查之前,必须制定科学、严密的工作计划和实施措施,以保证调查工作顺利、有序地进行 调查设计包括:统计调查方案的设计和调查问卷的设计16第16页/共81页2.2.1 统计调查方案
16、的设计(1)明确调查目的即明确统计调查要研究和解决什么问题,这是最基本的问题第六次全国人口普查的目的是“查清2000年以来我国人口数量、结构、分布和居住环境等方面的变化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提供真实准确、完整及时的人口统计信息支持”。(2)明确调查对象、调查单位 调查对象/调查总体:需要调查的总体范围,避免遗漏和重复调查单位/总体单位:具体调查项目和内容的承担者报告单位:负责报告调查资料的单位。调查单位和报告单位有时一致,有时不一致。如如商场调查中,商场既是调查单位,也是报告单位;人口普查中,调查单位是人
17、,报告单位是户。17第17页/共81页(3)确定调查项目 调查项目:所要调查登记的具体内容(4)确定调查时间和调查期限 调查时间:调查资料所属的时点或时期 调查期限:包括搜集资料和报送资料的整个工作所需时间(5)确定调查的组织实施计划 调查工作的领导队伍调查人员队伍的组织调查资料的管理方法调查前的准备工作等,如培训调查人员、经费筹措、组织试点等。18第18页/共81页2.2.2 调查问卷的设计调查问卷:根据调查目的,将所要调查的内容、问题和可能的答案按照一定的形式排列所形成搜集调查数据的书面形式,是一种特殊的调查表(1)调查问卷的结构和内容标题。即问卷的主题,应能够概括性地描述问卷的研究主题,
18、并且应醒目、准确,使被调查者大致明确调查的内容和性质。前言。主要包括引言和注释,用来向被调查者说明调查的目的、意义和主要内容、调查者的身份及填写说明等。示例见P41。主体。包括问题与答案,是问卷的核心内容,研究者欲通过调查问卷了解的数据资料大部分在这里以问题和回答项目的形式提出。结束语和实验记录。结束语是为了表示对调查对象真诚合作的谢意,在问卷的末端的简短明了的感谢语。实验记录用于记录调查的完成情况和需要复查、校订的问题,由调查员和审核员签写姓名和日期,以明确调查人员责任。19第19页/共81页(2)问题与答案的设计问题的主要形式:开放式问题和封闭式问题 开放式问题/无结构的问答题:只需提出问
19、题,而不必在问卷上拟定答案封闭式问题/有结构的回答题:对问题预先设计备选答案,由被调查者根据自己的判断或实际情况进行选择 问题的措辞与顺序表述问题时应遵守的原则 措辞应简单、易懂。考虑被调查者的语言能力,尽量使用符合人们交谈习惯的通俗易懂的语言,尽量避免相对生僻的专业术语。避免诱导性问题。诱导性问题带有一定的倾向性,会影响到被调查者的正常思考,误导其回答,影响调查结果的准确性。避免使用双重否定语和语义双关的句子。对敏感性问题的设计应讲究技巧,特别注意问题的提出方式。问题的排序应遵循的原则 按照由易到难的顺序,最前面的是容易回答的问题,然后是较难回答的问题,最后是敏感性问题 封闭式问题放在前面,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 搜集 整理 SPSS 基础
限制150内