统计学原理复习重点概述.doc
《统计学原理复习重点概述.doc》由会员分享,可在线阅读,更多相关《统计学原理复习重点概述.doc(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学原理复习重点概述本课程主要包括三部分知识。第一部分统计基础知识第一章与第二章数据收集部分。第二部分描述统计第二章统计数据整理部分(表格与图形法)、第三章数据分布特征的描述(静态数据描述法)与动态数据描述法,即第六章时间数列分析与第八章统计指数。第三部分推断统计第四章抽样估计与第五章假设检验与方差分析。第一章 绪论。本章介绍统计学及相关概念,勾勒了本课程的框架结构描述统计学与推断统计学。是统计的三层含义,总体、样本及指标等概念。统计的三层含义及相互关系统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释与推断的科学。(一)统计工作(统计的基本含义)即统计实践活动,是人们对客观
2、事物的数据资料进行搜集、整理、分析的工作活动的总称。(二)统计资料是统计工作的成果,包括各种统计报表、统计图形及文字资料等。(三)统计学是一门收集、整理、描述、显示与分析统计数据的方法论的科学,其目的是探索事物的内在数量规律性,以达到对客观事物的科学认识。(四)三者关系统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践 。统计工作与统计数据是工作与工作成果关系。统计实践活动的产生与发展三个主要的统计学派1、政治算术学派代表人物:英国的威廉配第(1623-1687)、约翰格朗特(1620-1674)等。 威廉配第的代表著政治算术对当时的英、荷、法等国的“
3、 国富与力量”进行了数量的计算与比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。 可以说,威廉配第是统计学的创始人。2、记述学派(国势学派 代表人物:德国的康令(16061681) 阿亨瓦尔(17191772; 1764年首创统计学一词)他们在大学中开设“ 国势学”课程,采用记述性材料,讲述国家“ 显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。3、数理统计学派代表人物:比利时的凯特勒(1796-1874)他把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。凯特勒把德国的国势学派、英国的政治算术学派与意大利、法
4、国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人。代表著作:社会物理学有的教材分类古典统计学时期(17世纪中后期18世纪中后期) 1.政治算术学派:代表人物威廉配第(政治经济学之父),首次运用数量对比分析法,又称“有名无实”的统计学。 2.记述学派/国势学派:“统计学是研究一国或多国的显著事项之学”,以文字描述为主,又称“有实无名”的统计学。 3.图表学派:用统计图与统计表表现与保存统计资料。近代统计学时期(18世纪末19世纪末) 1.数理统计学派:创始人阿道夫凯特勒,第一次将概率论引入社会经济现象的研究中,被誉为“近代统计学之父”。 2.社会统计学派:代表人物恩格尔,采
5、用大量观察法研究社会经济现象总体。现代统计学时期(20世纪初至今) 1.主要成果:在随机抽样基础上建立了推断统计学。 2.数理统计学的发展特点与趋势 (1)数学方法的广泛应用。 (2)边缘统计学的形成。 (3)借助计算机手段,统计学的应用日益广泛与深入。 统计学的分类从统计方法的构成角度分:1、描述统计学(descriptive statistics) 研究如何取得、整理与表现数据资料,进而通过综合、概括与分析反映客观现象的数量特征。包括数据的收集与整理、数据的显示方法、数据分布特征的描述与分析方法等。 2、推断统计学(inferential statistics) 研究如何根据样本数据去推断
6、总体数量特征的方法。包括抽样估计、假设检验、方差分析及相关与回归分析等。 描述统计学与推断统计学的关系描述统计学是统计学的基础与统计研究工作的前提,推断统计学则是现代统计学的核心与统计工作的关键。从统计方法的研究与应用角度分:1、理论统计学(theoretical statistics) 利用数学原理研究统计学的一般理论与方法的统计学,如概率论与数理统计2、应用统计学(applied statistics)*研究如何应用统计方法解决实际问题,大多是以数理统计为基础形成的边缘学科。如自然科学领域的生物统计学、社会科学领域的社会经济统计学等。统计学与其他学科的关系(一)统计学与数学的关系1、区别
7、(1)研究对象不同:数学研究抽象的量, 统计研究具体的量。 (2)研究方法不同:数学是演绎,统计是归纳与演绎的结合。2.、联系 数学为统计研究提供数学公式、模型与分析方法。(二、)统计学与其他学科的关系统计几乎与所有学科都有联系。统计方法可以帮助其他学科探索学科内的数量规律性,但对这种数量规律性的解释与进一步的研究,只能由各学科自已的研究完成。统计的研究对象、特点、作用统计的研究对象 、特点:社会经济统计,也可称为经济统计,其研究对象是社会经济现象总体的数量规律,即通过对(社会)经济现象的规模、水平、结构、比例与速度等数量关系的调查研究,说明国民经济与社会发展在一定时间、地点、条件下的数量表现
8、及变化规律,其中涉及到数量的多少、现象间的数量关系以及质量互变的数量界限等。社会经济统计学研究的就是在一定的质的规定下具体的不是抽象的数量表现与变化规律。社会经济统计的特点:1、数量性: 统计研究对象是客观事物的数量方面。2、总体性: 社会经济统计认识社会经济现象时,主要是研究社会经济现象的总体数量规律,即通过大量的观察,获得足够多的统计资料,说明、认知总表达象的变化情况及规律。 3、具体性: 社会经济统计的研究对象是具体事物的数量,不是抽象的量。它与数学研究的数量是不尽相同的。4、社会性:社会经济统计认识的对象是社会经济现象,它包括人类经济社会活动的各种条件(自然条件、社会条件)、人类各种活
9、动的过程与结果(生产活动、交换活动、分配活动、消费活动等)。统计的职能:信息职能、咨询职能、监督职能。统计学中几个基本概念统计总体与总体单位总体 即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体。 例如:要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体。特点: 同质性 是确定总体的前提与基础。它是根据统计的研究目的而定的。 研究目的不同,则所确定的总体也不同,其同质性的意义也随之变化。例如,研究城镇居民贫困户的生活状况,那么,贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇居民户是同质的,而贫困线上的城镇居民户是非同质的。 大量性 统计总体应该由足够数量的
10、同质性单位构成。实现统计研究目的的必要条件 差异性 构成总体的各个同质性单位的特征存在着差异。它是统计研究的前提与内容。总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。总体与单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。同一研究对象,在一种情况下为总体,但在另一情况下又可能变成单位。根据总体所包含的单位数量,总体可以分为有限总体与无限总体两类。有限总体是由有限量的单位构成的总体。当总体单位数难以确定,其数量可能是无限时,便构成无限总体。样本 由总体的部分单位组成的集合称为样本(又称子样)。当总体单
11、位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。这时,需要采用一定的方式,从由作为研究对象的事物全体构成的总体(又称全及总体、母体)中,抽取一部分单位,作为总体的代表加以研究。样本也由一定数量的单位构成的,符合总体的概念;由样本单位组成的总体称为抽样总体,样本所包含的总体单位数称为样本容量。标志与变量总体各单位普遍具有的属性或特征称为标志。标志分类: 品质标志:品质属性方面的特征,只能用文字、符号或数字代码来表现 。 数量标志:数量方面的特征,用数值来表现。 不变标志: 一个总体中各单位某标志的具体表现都相同,称之为不变标志。不变标志是总体同质性的基础。 一个总体至少要有一
12、个不变标志,才能够使各单 位结合成一个总体。 变异标志:亦称可变标志,在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为可变标志。作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。统计指标统计指标是反映统计总体数量特征的概念与数值。如2002年我国国内生产总值104790.6亿元。 统计指标由两项基本要素构成,即指标的概念(名称)与指标的取值。 指标的概念(名称)是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。确定统计指标必须有一定的理论依据,使之与社会经济或科学技术的范畴相吻合。同时,又必须对理论范畴与计算口径加以
13、具体化。 指标的数值反映所研究现象在具体时间、地点、条件下的规模与水平。在观察指标数值时,必须了解其具体的时间状态、空间范围、计量单位、计量方法等限定,同时注意由于上述条件的变化而引起数值的可比性问题。特性:数量性、具体性、综合性指标与标志的关系 标志反映总体单位的属性与特征,而指标则反映总体的数量特征。标志与指标的关系是个别与整体的关系。需要通过对各单位标志的具体表现进行汇总与计算才能得到相应的指标。 总体与单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。例如,所要研究的是全国工业企业的情况,则各企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志,
14、如果研究目的变成研究某一企业的职工状况,则该企业变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别等就成为标志。统计数据(一)变量与变量值说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值,统计数据就是统计变量的具体表现。例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。为了区别,在本书中,凡是变量均用大写的英文字母表示,而变量值则用小写英文字母表示。连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,零件的尺寸等。离散型变量是指变量的其取值是整数值,可以一一列举。例如,企业数,职工
15、人数等。确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释与可控制的。随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量。变量的取值无法事先确定。社会经济现象既有确定性变量也有随机变量。统计学所研究的主要是随机变量。(二)数据的计量尺度统计数据是总体单位标志或统计指标的具体数量表现。根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度与定比尺度。(三)数据的类型横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一
16、总体的数量表现进行观察而获得的数据。例如,2005年全国各省市自治区的国内生产总值就属于横截面数据。而“十五”期间我国历年的国内生产总值就属于时间序列数据。(四)数据的表现形式绝对数。现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般为实物单位或价值单位,有时也采用复合单位。实物单位可以是自然计量单位,也可以是物理计量单位,如人口数用人计量,机器数用台计量,对于一些化工产品与燃料,常常还折合成标准实物单位计量。复合计量单位是由两种或两种以上计量单位复合而成的,如以“吨公里”为货物周转量的计量单位,以“千瓦时”为用电量的计量单位。相对数。相对数由2个互相联系的数值对比求得。常用的相对数包
17、括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。平均数。平均数反映现象总体的一般水平或分布的集中趋势。关于这部分的内容,将在第三章作详细介绍。第二章统计数据的收集与整理。本章介绍统计数据的搜集及整理。重点在于统计调查方式与统计数据整理(分组)。统计调查方式:1、普查: 为某一特定目的而专门组织的一次性全面调查 如:人口普查、工业普查等特点: (1)通常是周期性的或一次性的,涉及面广、耗时、费力,一般需间隔较长时间;(2)一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏; (3)准确性一般较高,较规范; (4)适用的对象较窄,只能调查一些最基本、最
18、一般的现象。2、抽样调查:从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果推断总体数量特征。 特点: (1)经济性强:工作量小、可节省人、财、物力 (2)时效性高:可迅速、及时地获得所需要的信息 (3)适应面广:可获得更广泛的信息,适用于各个领域、各种问题的调查; (4)准确性高:用工量小,从而工作可做得更细,误差往往很小。3、统计报表按国家有关法规规定,自上而下地统一布置,自下而上地逐级提供基本统计数据。 特点: 统一的表式、统一的指标、统一的报送时间、统一的报送程序。 类型: (1)按报送调查范围分: 全面报表:调查对象中的每一个单位都填报 非全面报表:只要求调查对
19、象中的一部分单位填报 (2)按报送时间间隔分 日报、月报、季报、年报 (3)按报送地域(机构)范围分: 国家报表、地方报表、部门报表4、重点调查从调查对象的全部单位中选择少数重点单位进行调查(适用于“同类”中的“大户”)。5、典型调查 从调查对象的全部单位中选择一个或几个有代表性的单位进行调查。(不一定针对“大户”) 注意: 重点调查、典型调查与抽样调查的不同处在于: 1、抽样调查是随机抽取调查单位,不存在对调查对象选择的主观性,因此可以根据抽样结果推断总体的数量特征; 2、重点调查与典型调查不是随机取样,具有一定的主观性,因此调查结果不能推断总体。数据的搜集方法1、访问调查(派员调查):调查
20、者与被调查者通过面对面的交谈获取调查资料; 2、邮寄调查:通过邮寄或其他方式将问卷送至被调查者,由被调查者填写问卷并寄回或投放到指定收集点; 3、 调查:调查者利用 同受访者进行语言交流以获取信息; 4、座谈会(集体访谈):将受访者集中在调查现场,使其对调查主题发表意见以获取调查资料; 5、个别深度访问:一次只有一名受访者参加的特殊的定性研究。 统计数据的整理(summarizing data)是指对所搜集的数据进行加工整理、使之系统化、条理化,以符合分析的需要。统计数据的整理通常包括: 数据的预处理 分类或分组 汇总数据分组与频数分布 统计分组是将预处理过的数据按照某种特征或标准分成不同的组
21、别。 统计分组标志:分组时所依据的特征或标准,有品质标志与数量标志。 频数分布表:对分组后的数据,计算各组中数据出现的次数或频数所形成的汇总表。 概念:频数/次数分布;相对频数;百分数频数 频数分布或次数分布(Frequency distribution):全部数据按其分组标志在各组内的分布状况。 分布在各组内的数据个数称为频数或次数。 A frequency distribution is a tabular summary of a set of data showing the frequency (or number) of items in each of several nonov
22、erlapping classes. 相对频数(Relative frequency)/频率/比重:各组频数与全部频数之与的比重。 The relative frequency of a class is the proportion of the total number of data items belonging to the class.(=Frequency of the class/n) 百分数频数(Percentage frequency):is the relative frequency multiplied by 100.数值数据的分组与频数分布分组计频基本步骤: 确定组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 复习 重点 概述
限制150内