2023年中级经济师经济基础四统计.docx
《2023年中级经济师经济基础四统计.docx》由会员分享,可在线阅读,更多相关《2023年中级经济师经济基础四统计.docx(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二十三章 记录与记录数据1、记录学是关于收集、整理、分析数据和从数据中得出结论的科学。 记录学有两个分支:描述记录和推断记录。 描述记录是研究数据收集、整理和描述的记录学方法。内容涉及如何取得所需要的数据,如何用图表或数学方法对数据进行整理和展示,如何描述数据的一般性特性。 推断记录是研究如何运用样本数据来推断总体的记录学方法,内容涉及参数估计和假设检查两大类。参数估计是运用样本信息推断总体特性;假设检查是运用样本信息判断对总体的假设是否成立。 记录学是帮助我们结识周边世界的工具,描述记录和推断记录可以一起发挥作用,具体使用哪种方法取决于要解决的问题。2、变量:是研究对象的属性或特性,它是相
2、对于常数而言的。 常数只有一个固定取值,而变量可以有两个或更多个也许的取值。 当变量的取值是数量是,该变量被称为定量变量或数量变量。例如公司销售额、注册员工数量等。 当变量的取值表现为类别时则被称为分类变量,比如公司所属行业。(定性变量) 当变量的取值表现为类别且具有一定顺序时被称为顺序变量,比如员工受教育水平。(定性变量)3、数据是对变量进行测量、观测的结果。数据根据需要可以是数值、文字或者图像等形式。分类变量的观测结果称为分类数据,表现为类别,一般用文字来表述,也可以用数值代码表达;数值型数据是对定量变量的观测结果,其取值表现为具体的表达大小或多少数值。4、记录数据,按其收集方法,可以分为
3、观测数据(通过直接调查或测量而收集到的数据,是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的记录数据,如GDP、CPI、房价等)和实验数据(通过在实验中控制实验对象以及其所处的实验环境收集到的数据)。5、记录数据的来源(2种):直接的调查和科学实验,称为直接数据或一手数据;一手数据的来源调查或观测、实验,在社会经济领域,记录调查是获得数据的重要方法,也是获得一手数据的重要方式。别人的调查或实验的数据,称为间接数据或二手数据。6、记录调查是按照预定的目的和任务,运用科学的记录调查方法,有计划有组织地搜集数据信息资料的过程。特性(2个):调查是一种有计划、有方法、有程
4、序的活动;调查的结果表现为搜集到的数据。记录调查的分类(2个):按调核对象的范围不同,分为全面调查和非全面调查。全面调查是对构成调核对象的所有单位进行逐个的、无一漏掉的调查,涉及全面记录报表和普查。非全面调查是对调核对象中的一部分单位进行调查,涉及非全面记录报表、抽样调查、重点调查和典型调查等。按调查登记的时间是否连续,分为连续调查和不连续调查。连续调查是为了观测总体现象在一定期期内(通常是一年内)的数量变化,它规定随着调核对象的发展变化,连续地进行调查登记。不连续调查是间隔一个相称长的时间(通常是一年以上)所做的调查,一般是为了对总体现象在一定期点上的状态进行研究。7、记录调查的方式(5个)
5、:记录报表:是我国目前搜集记录数据的一种重要方式。是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本记录数据的一种调查方式。记录报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。种类(2种):全面记录报表规定调核对象中的每一个单位都填报;非全面记录报表只规定调核对象中的一部分单位填报。普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查、农业普查等。特点(4个):普查通常是一次性的或周期性的,经济普查每20232次,在尾数3、8的年份实行;人口普查逢“0”的年份进行;农业普查逢“6”的年份进行。普查一般需要规定统一的
6、标准调查时间,以避免调查数据的反复或漏掉,保证普查结果的准确性。第五和第六次人口普查的标准时间为11月1日0时,农业普查的标准时间为1月1日0时。普查的数据一般比较准确,规范化限度也较高,因此他可认为抽样调查或其他调查提供基本依据;普查的使用范围比较窄,职能调查一些最基本及特定的现象。抽样调查:是从调核对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特性的一种非全面调查。特点(4个):经济性;时效性强,适应面广;准确性高。重点调查:是一种非全面调查,它是在所要调查的总体中选择一部分重点单位进行的调查。典型调查:是一种非全面调查,它是根据调查的目的与规定,在对被调核对
7、象进行全面分析的基础上,故意识地选择若干具有典型意义的或有代表性的单位进行的调查。作用(2个):填补全面调查的局限性;在一定条件下可以验证全面调查数据的真实性。优点:灵活机动、通过少数典型单位即可进一步翔实的记录资料。缺陷:受主观结识的影响。第二十四章 描述记录1、对于数据分布特性的测度重要分(3个方面):分布的集中趋势,反映各数据向其中心值靠拢或聚集的限度;分布的离散限度,反映各数据之间的差异限度,也能反映中心值对数据的代表限度;分布的偏态,反映数据分布的不对称性。 对于两个定量变量之间的相关分析,经常采用的描述方法是散点图和相关系数记录数量。2、集中趋势:是指一组数据向某一中心值靠拢的限度
8、,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据水平的代表值或中心值。均值:也叫作平均数,就是数据组中所有数值的总和除以该组数字的个数。均值是集中趋势最重要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平。它重要合用于数据型诗句,但不合用分类和顺序数据。中位数:是把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值,假如为偶数的话,是居中两位数值的平均值。中位数是一个位置代表值,重要用于顺序数据和数值型数据,但不合用于分类数据。众数:是指一组数据中出现次数(频数)最多的变量值。众数合用于描述分类数据和顺序数据的集中趋势。而在定量数据中,也许出现多众数和无众数的
9、情况,因此众数不适于描述定量数据的集中位置。均值、中位数和众数的比较及合用范围。均值适于定量变量。优点:可以充足运用数据的所有信息,均值大小受到每个观测值的营销,比较稳定;缺陷:易受极端值的影响,假如观测值种有明显的极端值,则均值的代表性比较差。中位数不适于分类变量,适于顺序变量和定量变量,特别是分布不对称的数据。优点:不受极端值的影响;缺陷:没有充足运用数据的所有信息,稳定性差于均值,优于众数。众数不合用于定量变量,重要合用于分类和顺序变量。优点:不受极端值影响,特别是分布明显呈偏态时,众数的代表性更好。缺陷:没有充足运用数据的所有信息,拟定稳定性,并且也许不唯一。3、离散限度:反映的是数据
10、之间的差异限度。集中趋势的测度值是对数据水平的一个概括性的度量,它对一组数据的代表限度,取决于该组数据的离散水平。 数据的离散限度越大,集中趋势的测度值对该组数据的代表性就越差,离散限度越小,其代表性越好。 方差:是数据组中各数值与其均值离差平方的平均数,它能较好的反映出数据的离散限度,是实际中应用最广泛的离散限度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。标准差,用来测度数据的离散限度,标准差即方差的平方根,对于样本数据。标准差不仅能度量数值与均值的平均距离,还与原始数据具有相同的计量单位。标准差与方差计算比较简朴,又具有比较好的数学性质,是应用最广泛的记录离散限度的
11、测度方法。方差与标准差只合用于数值型数据。离散系数:也称为变异系数或标准差系数,即标准差与均值的比值,重要用于不同类别数据离散限度的比较,记为CV。CVsX 标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散限度。离散系数消除了测度单位和观测值水平不同的影响,由于可以直接用来比较变量的离散限度。4、偏度:是指数据分布的偏斜方向和限度,描述的是数据分布对称限度。偏态系数:是测度数据分布偏度的记录量。SKnn-1(n-2)i=1n(Xi-Xs)3 偏态系数取决于离差三次方的平均数与标准差三次方的比值。假如偏态系数0,则说明数据的分布是对称的;假如偏态
12、系数为正值,说明分布为右偏,取值0-0.5之间轻度右偏,取值0.5-1之间中度右偏,1严重右偏;假如偏态系数为负值,说明分布左偏,(-0.5)-0之间轻度左偏,(-0.5)-(-1)之间中中度左偏,(-1)严重左偏。偏态系数的绝对值越大,说明数据分布的偏斜限度越大。5、标准分数:在记录上,均值和标准差不同时,不同变量的数值是不能比较的。标准分数可以给出数值距离均值的相对位置,计算方法是用数值减去均值所得的差除以标准差,计算公式:ZiXi-Xs 标准分数也称为Z分数,是记录上常用的一种标准化方法。6、变量间的相关关系(3种):按相关的限度可分为完全相关、不完全相关和不相关。完全相关:当一个变量的
13、取值变化完全由另一个变量的取值变化所拟定期;不相关:当两个变量的取值变化彼此互不影响;不完全相关:当两个变量之间的关系介于完全相关和不相关之间。按相关的方向可分为正相关和负相关。正相关:当一个变量的取值由小变大,另一个变量的取值也相应由小变大;负相关:当一个变量的取值由小变大,而另一个变量的取值相反的由大变小。按相关的形式可分为线性相关和非线性相关。线性相关:是指两个相关变量之间的关系大体呈现为线性关系;非线性相关:是指两个相关变量之间,并不表现为直线的关系,而是近似于某种曲线方程的关系。7、散点图:两个变量间的关系可以用散点图来展示。在散点图种,每个点代表一个观测值,横纵坐标值分别代表两个变
14、量相应的观测值。8、相关系数:是度量两个变量间相关关系的记录量。Pearson相关系数(最常用):度量的是两个变量间的线性相关关系。Pearson相关系数的取值范围在+1和-1之间,即-1r1。若0r1,正线性相关关系;若-1r0,则负线性相关关系;若r1,完全正线性相关;若r-1,完全负线性相关;若r0,不存在线性相关关系,并不是没有任何关系。若r1,变量Y的取值完全依赖于X。第二十五章 抽样调查1、抽样调查(使用频率最高):是指按照某种原则和程序,从总体中抽取一部分单位,通过对这一部分单位进行调查得到的信息,以达成对总体情况的了解,或者对总体的有关参数进行估计。 (3个概念):总体与样本:
15、总体即调核对象的主体,样本是总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成;总体参数与样本记录量:总体参数是我们所关心变量的数字特性,它是根据总体中所有的单位的数值计算的,也可以说是总体指标值,它是未知的常数,常用的有总体总量、总体均值、总体比例、总体方差等;样本记录量是根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量,是一个随机变量,它取决于样本设计和正好被选入样本的单元特定组合,常用的有样本均值、样本比例、样本方差等。抽样框:是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现,常用的有名录框(公司名录、电话簿、人员名册)、一张地图或其他适当形式。2、抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 年中 经济师 经济基础 统计
限制150内