第三章统计数据的整理课件.ppt
《第三章统计数据的整理课件.ppt》由会员分享,可在线阅读,更多相关《第三章统计数据的整理课件.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章统计数据的整理第三章统计数据的整理第一节统计数据整理概述第一节统计数据整理概述第二节统计分组第二节统计分组第三节次数分布第三节次数分布第四节数据整理的计算机实现第四节数据整理的计算机实现第五节洛伦兹曲线和基尼系数第五节洛伦兹曲线和基尼系数第六节统计表第六节统计表第一节统计数据整理概述第一节统计数据整理概述一、一、 统计数据整理的概念统计数据整理的概念统计数据整理也称统计整理统计数据整理也称统计整理,是根据统计是根据统计研究的目的研究的目的,将统计调查所得的数据进行科学将统计调查所得的数据进行科学的加工的加工,使之系统化、条理化使之系统化、条理化,并成为能反映总并成为能反映总体数量特征的综
2、合资料的工作过程。体数量特征的综合资料的工作过程。二、统计数据整理的步骤二、统计数据整理的步骤统计数据整理的步骤如下统计数据整理的步骤如下:(1) 设计和编制统计数据资料的汇总方案。设计和编制统计数据资料的汇总方案。 (2) 对搜集到的原始资料进行审核。对搜集到的原始资料进行审核。 (3) 根据研究目的的要求和统计分析的需要根据研究目的的要求和统计分析的需要,对对原始资料进行分组。原始资料进行分组。(4) 进行汇总计算进行汇总计算,编制次数分布表。编制次数分布表。(5) 编制统计表。编制统计表。(6) 进行统计数据资料的汇编进行统计数据资料的汇编,系统地积累历史系统地积累历史统计数据。统计数据
3、。第二节统计分组第二节统计分组一、一、 统计分组的概念与作用统计分组的概念与作用统计分组是根据社会经济现象的内在特点和统计研究的统计分组是根据社会经济现象的内在特点和统计研究的目的目的,将总体中所有总体单位按一定的标志划分为性质不同的将总体中所有总体单位按一定的标志划分为性质不同的若干个组成部分的一种统计方法。若干个组成部分的一种统计方法。基本要求是基本要求是:使各组内部保持同质性、各组之间呈现出质使各组内部保持同质性、各组之间呈现出质的差异性。因此的差异性。因此,统计分组的实质是在现象总体内进行的一种统计分组的实质是在现象总体内进行的一种定性分类。定性分类。统计分组的作用表现在以下几个方面统
4、计分组的作用表现在以下几个方面:(一一)划分社会经济现象的类型划分社会经济现象的类型(二二)反映社会经济现象总体的内部结构反映社会经济现象总体的内部结构(三三)研究现象之间在数量上的依存关系研究现象之间在数量上的依存关系二、分组标志的选择和分组的形式二、分组标志的选择和分组的形式统计分组的关键在于正确选择分组标志和划分各组界限。统计分组的关键在于正确选择分组标志和划分各组界限。分组标志是将统计总体划分为若干个性质不同的组成部分的分组标志是将统计总体划分为若干个性质不同的组成部分的标准或依据。标准或依据。(一一)分组标志的选择分组标志的选择选择分组标志必须遵循以下原则选择分组标志必须遵循以下原则
5、:1.根据统计研究目的选择分组标志根据统计研究目的选择分组标志2.选择能反映现象本质特征的主要标志选择能反映现象本质特征的主要标志3.结合具体社会历史条件和经济条件选择分组标志结合具体社会历史条件和经济条件选择分组标志(二二)分组的形式分组的形式分组的形式有简单分组和平行分组体系分组的形式有简单分组和平行分组体系,复合分组和复合复合分组和复合分组体系分组体系1.简单分组与平行分组体系简单分组与平行分组体系对总体只按一个标志进行分组对总体只按一个标志进行分组,叫简单分组。叫简单分组。选择两个或两个以上的标志分别进行简单分组选择两个或两个以上的标志分别进行简单分组,就形成了就形成了平行分组体系。例
6、如平行分组体系。例如,对工业企业可以分别按经济类型和规模对工业企业可以分别按经济类型和规模两个标志进行简单分组两个标志进行简单分组,得到如下平行分组体系得到如下平行分组体系:2.复合分组与复合分组体系复合分组与复合分组体系对同一个总体选择两个或两个以上的标志层叠分组对同一个总体选择两个或两个以上的标志层叠分组,叫复叫复合分组;所分各组是在分组标志的基础上层叠排列的合分组;所分各组是在分组标志的基础上层叠排列的,从而形从而形成复合分组体系。成复合分组体系。 三、统计分组的方法三、统计分组的方法根据分组标志的特征不同根据分组标志的特征不同,统计总体可以按品质标志分组统计总体可以按品质标志分组,也可
7、以按数量标志也可以按数量标志分组。分组。(一一)按品质标志分组的方法按品质标志分组的方法按品质标志分组按品质标志分组,就是选择反映事物属性差异的品质标志作为分组的依据就是选择反映事物属性差异的品质标志作为分组的依据,并并在品质标志的变异范围内划定各组界限在品质标志的变异范围内划定各组界限,将总体区分为若干性质不同的组成部分。将总体区分为若干性质不同的组成部分。(二二)按数量标志分组的方法按数量标志分组的方法按数量标志分组按数量标志分组,就是选择反映事物数量差异的数量标志作为分组的依据就是选择反映事物数量差异的数量标志作为分组的依据,并并在数量标志的变异范围内划定各组的界限在数量标志的变异范围内
8、划定各组的界限,将总体划分为性质不同的若干组成部将总体划分为性质不同的若干组成部分。分。就具体的分组而言就具体的分组而言,如果分组标志的变量的变异较小如果分组标志的变量的变异较小,可以将各个变量值单列可以将各个变量值单列一组一组,这种分组称为单项式分组这种分组称为单项式分组;如果变量的变异较大如果变量的变异较大,则应该把变量的整个取值范围依次划分为若干区间则应该把变量的整个取值范围依次划分为若干区间,一一个区间内的所有变量值归为一组。区间的最大值称为上限个区间内的所有变量值归为一组。区间的最大值称为上限,最小值称为下限最小值称为下限,上限上限与下限之差为组距。组距与下限之差为组距。组距=上限上
9、限-下限。这样的分组称为组距式分组。下限。这样的分组称为组距式分组。第三节次数分布第三节次数分布一、一、 次数分布的概念次数分布的概念在统计分组的基础上在统计分组的基础上,将总体中的所有总将总体中的所有总体单位按组归类整理体单位按组归类整理,形成总体单位数在各组形成总体单位数在各组间的分布间的分布,就叫次数分布。就叫次数分布。 分布在各组的总体单位数叫次数分布在各组的总体单位数叫次数,又称频又称频数。各组次数与总次数之比叫比重数。各组次数与总次数之比叫比重,又称频率。又称频率。 二、次数分布的种类:二、次数分布的种类:根据分组标志特征的不同根据分组标志特征的不同,分布数列可以分布数列可以分为属
10、性分布数列和变量分布数列两种。分为属性分布数列和变量分布数列两种。1、按品质标志分组形成的分布数列叫属、按品质标志分组形成的分布数列叫属性分布数列或品质数列。性分布数列或品质数列。2、按数量标志分组形成的分布数列叫变、按数量标志分组形成的分布数列叫变量数列。量数列。三、次数分布的编制三、次数分布的编制属性分布数列一般比较稳定属性分布数列一般比较稳定,通常均能准通常均能准确地反映总体的实际分布特征。确地反映总体的实际分布特征。在变量数列中在变量数列中,由于决定事物性质的数量由于决定事物性质的数量界限的确定界限的确定,往往因人的主观认识不同。编制往往因人的主观认识不同。编制时应考虑以下几个方面的问
11、题:时应考虑以下几个方面的问题: 举例说明次数分布的编制举例说明次数分布的编制 假定某班学生统计学考试成绩资料如下假定某班学生统计学考试成绩资料如下(见表见表36)。1.组距与组数组距与组数当变量值较多时当变量值较多时,就有必要编制组距数列。分组时就有必要编制组距数列。分组时,一般应一般应根据对总体内部情况的定性分析根据对总体内部情况的定性分析,先确定组数先确定组数,然后用变量的变然后用变量的变动范围动范围(即全距即全距)除以组数来确定组距除以组数来确定组距,并据以划分各组界限。并据以划分各组界限。即即组距组距=全距全距组数组数=(最大值(最大值-最小值)最小值)组数组数等距数列中等距数列中,
12、 各组的组距相等各组的组距相等 异距数列中异距数列中, 各组的组距不完全相等各组的组距不完全相等 根据经验根据经验,当资料数为当资料数为30时时,组数可取组数可取57组。为计算方便组。为计算方便,一般地组距可取一般地组距可取5或或10的整倍数。的整倍数。2.组限与组中值组限与组中值组限是指在组距数列中组限是指在组距数列中,区分各组性质差异的数区分各组性质差异的数量界限量界限,用各组变量值中的最小值表示下限用各组变量值中的最小值表示下限,最大值最大值表示上限。表示上限。 组中值是表明组内各变量值一般水平的一个代组中值是表明组内各变量值一般水平的一个代表值表值,通常按下式计算通常按下式计算:组中值
13、组中值=(上限(上限+下限)下限)2开口组开口组 :为了避免出现空白组为了避免出现空白组,同时又能使个同时又能使个别变量值离差较大的单位不致于无组可归别变量值离差较大的单位不致于无组可归,往往在首往往在首组使用组使用“以下以下”,在末组使用在末组使用“以上以上”的不的不确定组限的形式确定组限的形式 。“开口组开口组”组中值的公式组中值的公式首组组中值首组组中值=首组上限首组上限-相邻组距相邻组距2末组组中值末组组中值=末组上限末组上限+相邻组距相邻组距2以表以表36为例,具体分析编制次数分布:为例,具体分析编制次数分布:(1)计算全距。全距是总体内最大变量值与最小变量值之计算全距。全距是总体内
14、最大变量值与最小变量值之差。则全距差。则全距=99-54=45, (2)确定组数和组距。根据研究的具体要求、对实际情况确定组数和组距。根据研究的具体要求、对实际情况的了解以及经验判断的了解以及经验判断,组数取组数取5,则组距则组距=全距全距/组数组数=45/5=9,即即组距可取组距可取10较为适合。较为适合。(3)确定组限和组限表示法。考试成绩为连续变量确定组限和组限表示法。考试成绩为连续变量,故采故采用上下限重叠式的组限表示法用上下限重叠式的组限表示法,组限值取整组限值取整10的数值。的数值。(4)计算各组单位数及比重。由于本例采用的是重叠式的计算各组单位数及比重。由于本例采用的是重叠式的组
15、限表示法组限表示法,故需运用故需运用“上限不在本组内上限不在本组内”的原则计算各组的原则计算各组单位数单位数,根据研究的需要再计算各组比重。根据研究的需要再计算各组比重。 三、次数分布的特征三、次数分布的特征不同性质的社会经济现象总体的次数分布是不不同性质的社会经济现象总体的次数分布是不同的同的,从而显示出不同类型的分布特征。从而显示出不同类型的分布特征。 次数多或比率大的组次数多或比率大的组,其变量值在决定总体数量其变量值在决定总体数量表现中的作用就大表现中的作用就大,反之就小。反之就小。研究各种类型的次数分布特征研究各种类型的次数分布特征,对于准确认识不对于准确认识不同社会经济性质的变量在
16、形成总体数量表现中的作同社会经济性质的变量在形成总体数量表现中的作用有着重要意义。用有着重要意义。(一一)次数分布的显示方法次数分布的显示方法1.表示法:用统计表的形式显示次数分布表示法:用统计表的形式显示次数分布 。2.图示法图示法(1) 直方图。直方图是用直方形的宽度和高度来直方图。直方图是用直方形的宽度和高度来表示次数分布的一种统计图。表示次数分布的一种统计图。 (2) 折线图。折线图可以在直方图的基础上折线图。折线图可以在直方图的基础上,用用线段将根据各组组中值与次数高度求出的坐标点顺线段将根据各组组中值与次数高度求出的坐标点顺次连结而成次连结而成, (3) 曲线图。当变量值非常多曲线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 统计数据 整理 课件
限制150内