《统计学第二章统计整理幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第二章统计整理幻灯片.ppt(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学学课件第二章件第二章统计整理整理第1页,共34页,编辑于2022年,星期二第一节第一节 统计整理概述统计整理概述一、统计整理的概念一、统计整理的概念二、统计整理的内容二、统计整理的内容第2页,共34页,编辑于2022年,星期二统计整理概念 将统计调查得到的数据进行加工将统计调查得到的数据进行加工整理,使其系统化、条理化,符合整理,使其系统化、条理化,符合分析的需要。分析的需要。是统计调查的继续,统计分析的前是统计调查的继续,统计分析的前提和基础提和基础必要性必要性第3页,共34页,编辑于2022年,星期二统计整理的内容(一)对原始数据资料进行审核检查和整理(一)对原始数据资料进行审核检查
2、和整理1 1、完整性审核、完整性审核、完整性审核、完整性审核 2 2、准确性审核、准确性审核、准确性审核、准确性审核(二)对次级资料的检查与整理(二)对次级资料的检查与整理1 1、对现有资料的甄别、对现有资料的甄别、对现有资料的甄别、对现有资料的甄别2 2、对甄别后的资料作出评价、对甄别后的资料作出评价、对甄别后的资料作出评价、对甄别后的资料作出评价3 3、选用适当的再加工方法、选用适当的再加工方法、选用适当的再加工方法、选用适当的再加工方法 第4页,共34页,编辑于2022年,星期二将总体中所有单位按一定的标志划分为将总体中所有单位按一定的标志划分为若干个不同性质的组。若干个不同性质的组。一
3、、统计分组一、统计分组统计分组的作用统计分组的作用:q q可发现总体的特点与规律,分析总体中各个组可发现总体的特点与规律,分析总体中各个组成部分的结构情况成部分的结构情况q q分析现象之间的依存关系分析现象之间的依存关系 p33-34 表表2-7 2-8第二节第二节 统计分组统计分组第5页,共34页,编辑于2022年,星期二二、统计分组的方法二、统计分组的方法v关键问题关键问题选择分组标志和划分各组得界限选择分组标志和划分各组得界限(一)分组标志确定的原则(一)分组标志确定的原则1、根据研究的目的与任务选择分组标志、根据研究的目的与任务选择分组标志2、要选择能够反映事物本质或主要特征的标、要选
4、择能够反映事物本质或主要特征的标志志3、要根据现象的历史条件及经济条件来选择分、要根据现象的历史条件及经济条件来选择分组标志组标志第6页,共34页,编辑于2022年,星期二二、统计分组的方法二、统计分组的方法(二)统计分组方法的分类(二)统计分组方法的分类1、根据分组标志反映事物特征不同、根据分组标志反映事物特征不同 分为分为 按品质标志分组(事物属性差异)和按数量按品质标志分组(事物属性差异)和按数量标志分组(事物数量差异)标志分组(事物数量差异)例例 性别性别 学历学历 工资工资 年龄年龄2、根据标志的多少不同、根据标志的多少不同分为分为 简单分组(一个分组标志)简单分组(一个分组标志)和
5、和 复合分组复合分组(两个或两个以上)(两个或两个以上)第7页,共34页,编辑于2022年,星期二三、编制次数分布数列三、编制次数分布数列v在确定分组标志和分组方法后编制次数分布数列在确定分组标志和分组方法后编制次数分布数列相关概念:相关概念:v次数分布数列:将总体按某一标志分组,按一定次数分布数列:将总体按某一标志分组,按一定顺序排列并列出每个组的总体单位数,这种数列顺序排列并列出每个组的总体单位数,这种数列称为次数分布数列,又称分配数列称为次数分布数列,又称分配数列v次数(频数):分布在每一组的总体单位数次数(频数):分布在每一组的总体单位数分布数列的种类:分布数列的种类:v品质数列品质数
6、列v变量数列变量数列第8页,共34页,编辑于2022年,星期二按品质标志分组的数列按品质标志分组的数列。如不同品牌饮料市场占有率如不同品牌饮料市场占有率(一)品质数列(一)品质数列饮料品牌饮料品牌人数人数百分比百分比(%)(%)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐汇源果汁汇源果汁露露露露15151111 9 9 6 6 9 930302222181812121818合计合计5050100100第9页,共34页,编辑于2022年,星期二按数量标志分组的数列按数量标志分组的数列。含义含义:以一个变量值作为一组。:以一个变量值作为一组。根据每一组变量值的多少,可以进行单项式数列、组距
7、根据每一组变量值的多少,可以进行单项式数列、组距式数列。式数列。适用范围适用范围:离散性变量且变量值数目不多的情:离散性变量且变量值数目不多的情况。况。单项式数列单项式数列(二)变量数列(二)变量数列第10页,共34页,编辑于2022年,星期二单项式数列单项式数列 某社区家庭户拥有孩子数情况表某社区家庭户拥有孩子数情况表 孩子数(个)孩子数(个)户数户数百分比(百分比(%)0 01 12 23 315015020020010010050503030404020201010合计合计500500100100第11页,共34页,编辑于2022年,星期二组距式数列组距式数列 含义含义:以变量值的一定变
8、动范围为一组:以变量值的一定变动范围为一组适用适用范围范围:连续变量和离散变量变量值很多的情:连续变量和离散变量变量值很多的情况。况。等距数列等距数列异距数列异距数列变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等第12页,共34页,编辑于2022年,星期二等距数列等距数列 某工厂工人完成生产定额情况表某工厂工人完成生产定额情况表 工人完成生产定额工人完成生产定额(%)工人数(个)工人数(个)百分比(百分比(%)9090以下以下
9、9090100100100100110110110110120120120120以上以上3030404060603030202016.716.722.222.233.333.316.716.711.111.1合计合计180180100100第13页,共34页,编辑于2022年,星期二异距数列异距数列 某地区人口年龄分布情况某地区人口年龄分布情况 人口年龄分组人口年龄分组 人口数(万人)人口数(万人)百分比(百分比(%)2 2岁以下(婴儿组)岁以下(婴儿组)2 27 7岁(幼儿组)岁(幼儿组)7 71818岁(学龄儿童组)岁(学龄儿童组)18186060岁(劳动力人口组)岁(劳动力人口组)606
10、0岁以上(老年组)岁以上(老年组)1 1 6 6 12 12 24.6 24.6 8.1 8.1 1.91.9 11.6 11.6 23.2 23.2 47.6 47.6 15.7 15.7 合计合计51.751.7100100第14页,共34页,编辑于2022年,星期二相关概念相关概念指每组两端的变量值,各组的最小值指每组两端的变量值,各组的最小值为下限,最大值为上限。为下限,最大值为上限。组限组限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差下限之差组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组中值组中值第15页,共34页,编辑于2022年,星期二开
11、口式组距数列组中值的计算:开口式组距数列组中值的计算:组中值上限相邻组组距组中值上限相邻组组距/2/2 组中值下限组中值下限+相邻组组距相邻组组距/2/2 缺下限:缺下限:缺上限:缺上限:第16页,共34页,编辑于2022年,星期二某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d
12、=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)第17页,共34页,编辑于2022年,星期二编制等距数列实例编制等距数列实例己知己知己知己知5050个同学的英语考试成绩如下:个同学的英语考试成绩如下:要求编制组距数列。要求编制组距数列。78788989929266668080525277779696636382828080757548487474636371718888909067677171888856566060727255557575848477776666909073737878848466665959
13、636380809090747466668181707066667474828275758080818166667878第18页,共34页,编辑于2022年,星期二编制步骤:编制步骤:求全距求全距确定组距及组数确定组距及组数组距组距=全距全距组数组数组距和组数成反比的关系,组数的确定一般原则组距和组数成反比的关系,组数的确定一般原则 (1)正确的反映总体各部分质的差异)正确的反映总体各部分质的差异 (2)能够准确清晰的反映总体单位的分布特征)能够准确清晰的反映总体单位的分布特征编制等距数列编制等距数列全距全距=最大值最大值-最小值最小值第19页,共34页,编辑于2022年,星期二确定组限确定组
14、限q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠;重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不在内上组限不在内”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法编制等距数列编制等距数列第20页,共34页,编辑于2022年,星期二 按照习惯,成绩一般分为不及格、及格、中按照习惯,成绩一般分为不及格、及格、中等、良好、优秀等、良好、优秀即即 组限组限 组中值组中值 60分以下分以下 6070 65 7080 75 8090 85 90分以上分以
15、上上组限不在内上组限不在内第21页,共34页,编辑于2022年,星期二频数频数=每组单位数每组单位数 频率频率=每组频数每组频数/总单位数总单位数组限组限频数频数比重比重%60以下以下51060701122708016328090132690分以上分以上510确定频数和频率确定频数和频率第22页,共34页,编辑于2022年,星期二四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)(一)(一)统计分类标准化统计分类标准化v是统计标准化的一种(指标体系是统计标准化的一种(指标体系 分类标准分类标准 基本基本术语术语 编码)编码)按其适用的范围不同分为按其适用的范围不同分为:v
16、国家标准国家标准v行业标准行业标准v地方标准地方标准v企业标准企业标准第23页,共34页,编辑于2022年,星期二四、统计分类标准化与常用的分组(类)四、统计分类标准化与常用的分组(类)(二)国民经济中常用的几种分组标准(二)国民经济中常用的几种分组标准1、经济类型分类(所有制结构)、经济类型分类(所有制结构)公有经济公有经济 国有经济国有经济 集体经济集体经济 非公有经济(私有经济非公有经济(私有经济 港澳台经济港澳台经济 外商经济)外商经济)2、三次产业分类(国民经济各部门分为三大类型)、三次产业分类(国民经济各部门分为三大类型)第一产业第一产业 第二产业第二产业 第三产业第三产业3、行业
17、分类(三大产业的分类)、行业分类(三大产业的分类)第24页,共34页,编辑于2022年,星期二(二)国民经济中常用的几种分组标准(二)国民经济中常用的几种分组标准4、基本单位分类、基本单位分类 机构单位(住户机构单位(住户 法人单位)法人单位)产业活动单位(产业活动单位(基基层单位是指位于一个地点、主要从事一种经济活层单位是指位于一个地点、主要从事一种经济活动的单位。它与机构单位具有隶属关系,一个机动的单位。它与机构单位具有隶属关系,一个机构单位可能包含一个或多个基层单位,而一个基构单位可能包含一个或多个基层单位,而一个基层单位仅属于一个机构单位层单位仅属于一个机构单位)5、机构部门分类(四类
18、)、机构部门分类(四类)具有相同特征的具有相同特征的机构单位机构单位合并在一起构成合并在一起构成部门部门第25页,共34页,编辑于2022年,星期二第三节第三节 统计表统计表一、统计表的结构一、统计表的结构二、统计表的设计二、统计表的设计第26页,共34页,编辑于2022年,星期二统计表的常用结构:统计表的常用结构:统计表的结构统计表的结构按照一定结构和顺序设计的表格按照一定结构和顺序设计的表格总总 标标 题题列标题(宾词)列标题(宾词)行标题(主词)行标题(主词)数据资料数据资料第27页,共34页,编辑于2022年,星期二列标题列标题行标题行标题数字资料数字资料总标题总标题2008年浙江省各
19、地市年浙江省各地市GDP 单位:亿元单位:亿元地市地市GDP第一产业第一产业第二产业第二产业第三产业第三产业杭州杭州4781.164781.16178.64178.642389.382389.382213.142213.14宁波宁波3964.053964.05167.36167.362196.682196.681600.011600.01温州温州2424.292424.2976.6876.681286.761286.761060.851060.85嘉兴嘉兴1815.31815.3105.52105.521085.291085.29624.49624.49湖州湖州1034.891034.8982
20、.6382.63593.56593.56358.7358.7绍兴绍兴2222.952222.95116.65116.651329.121329.12777.18777.18金华金华1681.851681.8589.6189.61903.07903.07689.17689.17义乌义乌493.33493.3315.2815.28223.46223.46254.59254.59衢州衢州580.05580.0561.7161.71317.85317.85200.49200.49舟山舟山490.25490.2549.1849.18226.44226.44214.63214.63台州台州1965.271
21、965.27133.54133.541037.471037.47794.26794.26丽水丽水505.68505.6855.2655.26245.85245.85204.57204.57全省合计全省合计21486.9221486.921095.431095.4311580.3311580.338811.168811.16第28页,共34页,编辑于2022年,星期二二、统计表的设计二、统计表的设计q根据任务设计的统计表要主次分明,简明醒目,根据任务设计的统计表要主次分明,简明醒目,科学合理科学合理q统计表的形式应长宽比例适中,一般长方形统计表的形式应长宽比例适中,一般长方形q表的上、下端用粗线
22、或双线封口,左右两端一般表的上、下端用粗线或双线封口,左右两端一般不封口不封口q表的纵栏较多时,可以按栏的顺序编号表的纵栏较多时,可以按栏的顺序编号q统计表的总标题要简明扼要,在标题内或标统计表的总标题要简明扼要,在标题内或标题下说明资料所属时间和空间题下说明资料所属时间和空间第29页,共34页,编辑于2022年,星期二二、统计表的设计二、统计表的设计v计量单位一致时应放在表右上角;计量单位一致时应放在表右上角;v如果同栏单位相同各栏之间不同可在各栏标如果同栏单位相同各栏之间不同可在各栏标题中注明单位,题中注明单位,v如果同行的单位相同各行之间不同可在各栏的如果同行的单位相同各行之间不同可在各
23、栏的前面增加一栏单位前面增加一栏单位v各栏数字的位数要一致各栏数字的位数要一致第30页,共34页,编辑于2022年,星期二二、统计表的设计二、统计表的设计v数据栏不能有空白,不应有数字用数据栏不能有空白,不应有数字用_表示表示;数数字太小达不到要求用字太小达不到要求用如果规定不报用如果规定不报用v主次或宾词的排序应遵循时间的先后、数量的大主次或宾词的排序应遵循时间的先后、数量的大小、空间位置等自然顺序排列。一般从小到大,小、空间位置等自然顺序排列。一般从小到大,从过去到现在从过去到现在 从低到高从低到高v可在标下进行注释可在标下进行注释第31页,共34页,编辑于2022年,星期二练习题n5.统
24、计分配数列()n都是变量数列 都是品质数列 是变量数列或品质数列 是统计分组。n7.将25个企业按产值分组而编制的变量数列中,变量值是()n产值 企业数 各组的产值数 各组的企业数。n11.划分连续变量的组限和划分离散变量的组限时,相邻组的组限()n必须重叠 前者必须重叠,后者可以间断n必须间断 前者必须间断,后者必须重叠。一、单项选择一、单项选择第32页,共34页,编辑于2022年,星期二n12.在分组时,凡是遇到某单位的标志值刚好等于相邻两组下上限数值时,一般是()n将此数值归入上限所在组 将此值归入下限所在的组n将此值归入上限所在组或下限所在组均可 另立一组。第33页,共34页,编辑于2
25、022年,星期二二、多项选择二、多项选择5.分布数列的两个组成要素为分布数列的两个组成要素为()品质标志品质标志 数量标志数量标志 分组分组 次数次数 分组标志。分组标志。在组距数列中,组中值在组距数列中,组中值()是上限和下限的中点数是上限和下限的中点数 是用来代表各组标志值的平均水平是用来代表各组标志值的平均水平在开口式分组中无法确定在开口式分组中无法确定在开口式分组中,可以参照邻组的组距来确定在开口式分组中,可以参照邻组的组距来确定就是组平均数。就是组平均数。现将某班级现将某班级40名学生按成绩分别列入不及格(名学生按成绩分别列入不及格(59分以下),及格(分以下),及格(6069分)分),中等(,中等(7079分),良好(分),良好(8089分),优秀(分),优秀(90分以上)分以上)5个组中去,这种个组中去,这种分组分组()形成变量数列形成变量数列 形成组距数列形成组距数列形成品质分布数列形成品质分布数列 形成开口式分组形成开口式分组是按品质标志分组。是按品质标志分组。第34页,共34页,编辑于2022年,星期二
限制150内