统计学数据的整理和展.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计学数据的整理和展.ppt》由会员分享,可在线阅读,更多相关《统计学数据的整理和展.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 数据的整理和展示数据的整理和展示统计调查统计调查统计整理统计整理统计分析统计分析统计工作的三个中心阶段统计工作的三个中心阶段统计工作的三个中心阶段统计工作的三个中心阶段 第一节第一节 统计数据的整理统计数据的整理一、数据整理的概念和作用一、数据整理的概念和作用统计整理是指根据统计研究的目的,将统计整理是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)统计调查所得的原始资料(也称初级资料)进行科学的分类和汇总;或对已经加工的综进行科学的分类和汇总;或对已经加工的综合资料(也称次级资料)进行再加工,为统合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的综
2、合资料的计分析准备系统化的、条理化的综合资料的工作过程。工作过程。统计整理是统计调查的继续、统计分析统计整理是统计调查的继续、统计分析的前提。的前提。二、统计整理的步骤二、统计整理的步骤 (一)设计和编制统计资料的整理方案。(一)设计和编制统计资料的整理方案。(一)设计和编制统计资料的整理方案。(一)设计和编制统计资料的整理方案。(二)对原始资料进行审核。(二)对原始资料进行审核。(二)对原始资料进行审核。(二)对原始资料进行审核。(三)用一定的组织形式和方法,对原始资料进(三)用一定的组织形式和方法,对原始资料进(三)用一定的组织形式和方法,对原始资料进(三)用一定的组织形式和方法,对原始资
3、料进行排序、分组、汇总和计算。行排序、分组、汇总和计算。行排序、分组、汇总和计算。行排序、分组、汇总和计算。(四(四(四(四 )对整理好的资料再一次进行审核,改正在)对整理好的资料再一次进行审核,改正在)对整理好的资料再一次进行审核,改正在)对整理好的资料再一次进行审核,改正在汇总过程中发生的各种差错。汇总过程中发生的各种差错。汇总过程中发生的各种差错。汇总过程中发生的各种差错。(五)编制统计图表。(五)编制统计图表。(五)编制统计图表。(五)编制统计图表。(六)统计数据的积累和保管。(六)统计数据的积累和保管。(六)统计数据的积累和保管。(六)统计数据的积累和保管。三、统计整理的组织方式三、
4、统计整理的组织方式 1 1、逐级整理、逐级整理、逐级整理、逐级整理 2 2、集中整理、集中整理、集中整理、集中整理 3 3、逐级整理与集中整理相结合、逐级整理与集中整理相结合、逐级整理与集中整理相结合、逐级整理与集中整理相结合主要方法主要方法分组分组汇总汇总统计表统计表统计图统计图汇总1.手工汇总手工汇总2.计算机汇总计算机汇总四、统计整理的方法第二节、统计分组第二节、统计分组 一、统计分组的概念一、统计分组的概念 统统统统计计计计分分分分组组组组是是是是根根根根据据据据统统统统计计计计研研研研究究究究的的的的目目目目的的的的和和和和研研研研究究究究对对对对象象象象的的的的特特特特点点点点,将
5、将将将统统统统计计计计总总总总体体体体各各各各个个个个单单单单位位位位按按按按照照照照一一一一定定定定的的的的标标标标志志志志划划划划分分分分为为为为若若若若干干干干性性性性质质质质不不不不同同同同的的的的部部部部分或组。分或组。分或组。分或组。统计分组的两方面涵义:统计分组的两方面涵义:对对总总体体而而言言,是是“分分”,即即将将总总体体中中的的各各个个个个体体按按照照它它们的差异性区分为若干部分;们的差异性区分为若干部分;对对个个体体(总总体体单单位位)而而言言,是是“合合”,即即将将性性质质相相同同的的个体组合起来。个体组合起来。即即即即对对对对总总总总体体体体实实实实行行行行异异异异质
6、质质质分分分分解解解解,对对对对总总总总体体体体单单单单位位位位实实实实行行行行同同同同质质质质组组组组合。即组内同质性,组间差异性合。即组内同质性,组间差异性合。即组内同质性,组间差异性合。即组内同质性,组间差异性分组分组分组前分组前分组前分组前分组后分组后分组后分组后253342(1 1)划分社会经济现象的类型)划分社会经济现象的类型)划分社会经济现象的类型)划分社会经济现象的类型二、作用:二、作用:例:按所有制性质划分,我国现有例:按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济联营国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商
7、投资经济;港澳台投资经济;股份制经济;外商投资经济;港澳台投资经济经济(2)揭示社会经济现象的内部结构和比例关系)揭示社会经济现象的内部结构和比例关系例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产业第三产业21.1 31.943.0 45.5(3)研究现象之间的依存关系)研究现象之间的依存关系例:某地农民家庭按收入分组的恩格尔系数例:某地农民家庭按收入分组的恩格尔系数按收
8、入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6(1)科学性原则科学性原则(2)完整性原则(完整性原则(穷尽原则)穷尽原则)即应使总即应使总体中的每一单位都应有组可归,或者说各分组体中的每一单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。的空间足以容纳总体所有的单位。(3)互斥原则(不相容性)互斥原则(不相容性)即总体中任即总体中任一单位只能归入某一组。一单位只能归入某一组。三、统计分组的原则和方法三、统计分组的原则和方法1、统计分组的原则、统计分组的
9、原则 2 2、统计分组的方法、统计分组的方法统计分组的关键在于正确选择分组标志。统计分组的关键在于正确选择分组标志。(1)分组标志的选择)分组标志的选择原则是:原则是:1)从研究目的出发选择分组标志;)从研究目的出发选择分组标志;2)选择最能反映现象本质特征的分组标志;)选择最能反映现象本质特征的分组标志;3)根据事物所处的具体历史条件和经济条件)根据事物所处的具体历史条件和经济条件选择分组标志。选择分组标志。(2)分组方法(统计分组的种类)分组方法(统计分组的种类)1 1)、按分组标志的性质不同,分为品质分组(或称)、按分组标志的性质不同,分为品质分组(或称)、按分组标志的性质不同,分为品质
10、分组(或称)、按分组标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。属性分组)和数量分组(或称变量分组)。属性分组)和数量分组(或称变量分组)。属性分组)和数量分组(或称变量分组)。品质分组品质分组品质分组品质分组按品质标志进行的分组。按品质标志进行的分组。按品质标志进行的分组。按品质标志进行的分组。数量分组数量分组数量分组数量分组按数量标志进行的分组。按数量标志进行的分组。按数量标志进行的分组。按数量标志进行的分组。、按分组的作用和任务不同,分为类型分组、结构分、按分组的作用和任务不同,分为类型分组、结构分、按分组的作用和任务不同,分为类型分组、结构分、按分组的作用和
11、任务不同,分为类型分组、结构分组和分析分组。组和分析分组。组和分析分组。组和分析分组。类型分组类型分组类型分组类型分组将复杂现象分为若干性质不同部分将复杂现象分为若干性质不同部分将复杂现象分为若干性质不同部分将复杂现象分为若干性质不同部分的分组。的分组。的分组。的分组。结构分组结构分组结构分组结构分组表明总体结构的分组。表明总体结构的分组。表明总体结构的分组。表明总体结构的分组。分析分组分析分组分析分组分析分组分析现象间依存关系的分组。分析现象间依存关系的分组。分析现象间依存关系的分组。分析现象间依存关系的分组。2 2)、按采用分组标志多少不同的分组方法)、按采用分组标志多少不同的分组方法)、
12、按采用分组标志多少不同的分组方法)、按采用分组标志多少不同的分组方法 简单分组简单分组对总体各单位只采用一个标志进对总体各单位只采用一个标志进行分组。行分组。平行分组体系平行分组体系对总体各单位同时采用两个对总体各单位同时采用两个或两个以上的标志进行或两个以上的标志进行并列并列并列并列分组。分组。(表表3-43-4)复合分组复合分组对总体各单位同时采用两个或两对总体各单位同时采用两个或两个以上的标志进行个以上的标志进行层叠层叠层叠层叠分组。分组。(表表3-53-5)四、统计分类标准化和国民经济中常用的统计分组四、统计分类标准化和国民经济中常用的统计分组四、统计分类标准化和国民经济中常用的统计分
13、组四、统计分类标准化和国民经济中常用的统计分组 第三节第三节 次数分布次数分布一、次数分布数列的概念和种类一、次数分布数列的概念和种类1、次数分布数列的概念、次数分布数列的概念 在统计分组的基础上,将总体中的所有单在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各位按组归类整理,形成总体中各个单位数在各组间的分布,叫做组间的分布,叫做频(次)数分布频(次)数分布,将各组组,将各组组别与次数依次编排而形成的数列叫做次数分布别与次数依次编排而形成的数列叫做次数分布数列,简称为数列,简称为分布数列分布数列。次数分布(分布数列)次数分布(分布数列)是一种重要的分组资料,反映总
14、体单位在各组的是一种重要的分组资料,反映总体单位在各组的分布状态。分布状态。基本形式:基本形式:分组分组单位数(频数)单位数(频数)频率频率合计合计100次数分布次数分布频率分布频率分布一、次数分布数列的概念和种类一、次数分布数列的概念和种类2、次数分布数列的种类、次数分布数列的种类 按分组标志特征的不同,分布数列可以分为两种:按分组标志特征的不同,分布数列可以分为两种:品质分布数列与变量分布数列。品质分布数列与变量分布数列。(1)品质分布数列)品质分布数列 ()按数量标志分组()按数量标志分组()按数量标志分组()按数量标志分组则应按照研究目的及研究对象的特点确定相应的组则应按照研究目的及研
15、究对象的特点确定相应的组则应按照研究目的及研究对象的特点确定相应的组则应按照研究目的及研究对象的特点确定相应的组数,划分相应的组限。数,划分相应的组限。数,划分相应的组限。数,划分相应的组限。按数量标志分组即变量分组,有两种:按数量标志分组即变量分组,有两种:按数量标志分组即变量分组,有两种:按数量标志分组即变量分组,有两种:单项式分组单项式分组单项式分组单项式分组 单项式分组即将单项式分组即将单项式分组即将单项式分组即将某一变量的某一变量的某一变量的某一变量的每一个变量值作为一组每一个变量值作为一组每一个变量值作为一组每一个变量值作为一组。组数及组限是明确的。组数及组限是明确的。组数及组限是
16、明确的。组数及组限是明确的。*单项式分组单项式分组组距式分组组距式分组变量分布数列的分类见变量分布数列的分类见P56图示图示*组距式分组组距式分组在连续变量或变量值较多的情况下,可采用组距分组。它将全部变量值依次分为若干个区间,并将这个区间的变量值作为一组。连续型变量连续型变量相邻两组的上、下限采用相邻两组的上、下限采用同限,且遵循同限,且遵循“下闭上开下闭上开”(即上限不在内)(即上限不在内)的原则。的原则。“上限在不内上限在不内”原则:原则:在连续组距式分组中,以同在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个数值作为相邻两组共同的界限,统计上规定,凡是
17、总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。下限值的那一组内。离散型变量离散型变量相邻两组的上、下限间断,相邻两组的上、下限间断,且采用差数为且采用差数为“”的形式。的形式。相邻两组的上、下限重叠。相邻两组的上、下限重叠。下限,上限:下限,上限:组距式分组的每一组变量值中,其组距式分组的每一组变量值中,其最小值为下限,最大值为上限。最小值为下限,最大值为上限。组限:组限:相邻两组的界限。相邻两组的界限。间断组距式分组:间断组距式分组:组限不相连的组距式分组。组限不相连的组距式分组。连续组距式分组:连续组距式
18、分组:组限相连(或称相重叠的),组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式即以同一数值作为相邻两组的共同界限的组距式分组。分组。离散型变量,可间断组距式分组,也可连续组距离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。式分组。连续型变量,只能采用连续组距式分组。开口式分组开口式分组第一组缺下限、最末组缺上限第一组缺下限、最末组缺上限闭口组闭口组各组上下限齐全各组上下限齐全组距:组距:上下限之间的距离。上下限之间的距离。连续式分组的组距计算公式:连续式分组的组距计算公式:组距组距=本组上限本组上限本组下限本组下限间断式分组的组距计算
19、公式:间断式分组的组距计算公式:组距组距=本组上限本组上限本组下限本组下限+1等距分组:等距分组:标志值在各组保持相等的组距,即各组的标标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。较均匀的场合。异距分组:异距分组:各组的组距不相等。各组的组距不相等。开口组的组距:以相邻组的组距为本组的组距。开口组的组距:以相邻组的组距为本组的组距。组中值:组中值:上下限之间的中点数值称为组中值,组中值的上下限之间的中点数值称为组中值,组中值的计算公式:计算公式:计算平均指标或进行其它统计分析时,常以组中值来计算
20、平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。代表各组标志值的平均水平。组数组数 组数组数=全距全距/组距组距 组数组数依经验确定,一般分为组。依经验确定,一般分为组。缺下限开口组组中值缺下限开口组组中值=该组上限该组上限-1/2-1/2邻组组距,邻组组距,缺上限开口组组中值缺上限开口组组中值=该组下限该组下限+1/2+1/2邻组组距。邻组组距。闭口组组中值闭口组组中值=(上限(上限+下限)下限)22 二、变量数列的编制二、变量数列的编制1、单项变量数列的编制、单项变量数列的编制适用于变量值个数不多的离散型变量适用于变量值个数不多的离散型变量第一步:将调查获得的原始资料按
21、数值大小依次排列第一步:将调查获得的原始资料按数值大小依次排列第一步:将调查获得的原始资料按数值大小依次排列第一步:将调查获得的原始资料按数值大小依次排列第二步:确定各组的标志值和组数。第二步:确定各组的标志值和组数。第二步:确定各组的标志值和组数。第二步:确定各组的标志值和组数。第三步:计算各组的次数和频率。第三步:计算各组的次数和频率。第三步:计算各组的次数和频率。第三步:计算各组的次数和频率。第四步:按变量值大小顺序编制单项变量数列。第四步:按变量值大小顺序编制单项变量数列。第四步:按变量值大小顺序编制单项变量数列。第四步:按变量值大小顺序编制单项变量数列。二、变量数列的编制二、变量数列
22、的编制2、组距变量数列的编制、组距变量数列的编制适用于标志值比较多的离散型变量和连续性变量适用于标志值比较多的离散型变量和连续性变量 第一步:将调查获得的原始资料按数值大小依次排列第一步:将调查获得的原始资料按数值大小依次排列起来,并确定最大值、最小值和全距。起来,并确定最大值、最小值和全距。(全距)最大值最小值。(全距)最大值最小值。第二步:确定组数和组距。第二步:确定组数和组距。第三步:确定组限和组限的表示方法。第三步:确定组限和组限的表示方法。第四步:计算各组次数和频率,编制成组距数列。第四步:计算各组次数和频率,编制成组距数列。【例例】某某生生产产车车间间5050名名工工人人日日加加工
23、工零零件件数数如下(单位:个):如下(单位:个):117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122
24、122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139采用单变量值分组形成的频数分布表采用单变量值分组形成的频数分布表某车间某车间50名工人日加工零件数分组名工人日加工零件数分组采用组距式分组形成的频数分布表采用组距式分组形成的频数分布表三、次数分布的特征三、次数分布的特征对称分布对称分布对称分布对称分布对称分布对称分布右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布左偏分布左偏分布左偏分
25、布正正正正正正J J J J J J型分布型分布型分布型分布型分布型分布反反反反反反J J J J J J型分布型分布型分布型分布型分布型分布U U U U U U型分布型分布型分布型分布型分布型分布图图图图3-1.2.3 3-1.2.3 3-1.2.3 3-1.2.3 几种常见的次数分布几种常见的次数分布几种常见的次数分布几种常见的次数分布*某地企业规模分组表某地企业规模分组表按职工人数分组按职工人数分组 企业个数企业个数 频率频率(%)200人以下人以下 1 1.7 200299 3 5.0 300399 5 8.3 400499 16 26.7 500599 20 33.3 600699
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 整理
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内