(精品)第三章统计整理.ppt
《(精品)第三章统计整理.ppt》由会员分享,可在线阅读,更多相关《(精品)第三章统计整理.ppt(119页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 统计整理【案例导入】上一章的调查案例共发放调查表格上一章的调查案例共发放调查表格300份,回收份,回收292份,其中有效表格份,其中有效表格265份,现份,现将各年级男女回收有效表格具体情况整理如下:将各年级男女回收有效表格具体情况整理如下:年级年级男生男生女生女生大一大一4744大二大二4248大三大三3846合计合计127138这就是统计整理,他将统计调查得到的零星分散的个体资料变为了一目了这就是统计整理,他将统计调查得到的零星分散的个体资料变为了一目了然的说明总体资料。然的说明总体资料。案例一家评估机构为调查不同品牌饮料的市场一家评估机构为调查不同品牌饮料的市场占有率,对随机抽取
2、的一家超市进行了调查。占有率,对随机抽取的一家超市进行了调查。调查员在某天对照调查员在某天对照5050名顾客购买饮料的品牌名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。饮料,就将这一饮料的品牌名字记录一次。下面的表下面的表4141是记录的原始数据是记录的原始数据。顾客购买饮料的品牌名称 统一统一露露露露统一统一可口可乐可口可乐百事可乐百事可乐可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐露露露露可口可乐可口可乐 可口可乐可口可乐统一统一可口可乐可口可乐百事可乐百事可乐露露露露统一统一统一统一百事可乐百事可
3、乐可口可乐可口可乐统一统一 统一统一可口可乐可口可乐可口可乐可口可乐统一统一露露露露统一统一可口可乐可口可乐露露露露百事可乐百事可乐百事可乐百事可乐 汇源果汁汇源果汁露露露露百事可乐百事可乐可口可乐可口可乐百事可乐百事可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁 露露露露可口可乐可口可乐统一统一百事可乐百事可乐露露露露汇源果汁汇源果汁可口可乐可口可乐百事可乐百事可乐露露露露统一统一 表42购买饮料的频数分布饮料名称饮料名称频数频数可口可乐可口可乐统一统一百事可乐百事可乐露露 露露汇源果汁汇源果汁其其 他他合合 计计1511996050购买饮料的频数分布图
4、第三章 统计整理 第一节第一节 统计整理的概念和内容统计整理的概念和内容 第二节第二节 统计分组统计分组 第三节第三节 分配数列分配数列 第四节第四节 统计表统计表学习目的和要求学习目的和要求通过本章的学习,要求学生了解统计整理的基本程序,掌握统计分组的原则和方法以及会会掌握分配数列的编掌握分配数列的编制制和和统计表、图的基本知识。第一节第一节 统计整理的概念和内容统计整理的概念和内容一、统计整理的概念二、统计资料整理的主要内容和步骤一、统计整理的概念 统计整理的定义:是根据统计研究的任务,对统计调查所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资
5、料的工作过程。统计整理的意义统计整理的意义统计整理是统计工作的统计整理是统计工作的中间环节中间环节,它是在统,它是在统计调查的基础上进行的,计调查的基础上进行的,是统计调查的继是统计调查的继续续,同时,同时又是统计分析的前提又是统计分析的前提,在统计工,在统计工作中起着作中起着承前启后承前启后的重要作用。的重要作用。二、统计整理的步骤二、统计整理的步骤1设计和编制统计整理方案设计和编制统计整理方案2对原始资料进行审核对原始资料进行审核前提前提基础基础中心环节中心环节结果结果3对原始资料进行分组对原始资料进行分组 汇总汇总4编制统计表或绘制统计图编制统计表或绘制统计图13 原始资料的检查及时性准
6、确性检查就是对调查误差调查误差的检查登记性误差代表性误差由于错误判断事实或错误登记事实而发生的误差。这种误差可以避免。根据样本单位的数量特征推断总体数量特征时产生的误差。这种误差不可避免。逻辑检查:内容是否合理,有无矛盾,是否符合实际;检查方法计算检查:数字有无差错,指标计算方法是否恰当,计算单位是否正确,指标之间平衡关系是否保持。准确性准确性完整性第二节 统计分组一、统计分组的概念二、统计分组的作用三、分组标志的选择四、统计分组的方法五、统计分组体系就是根据统计研究的需要,将统计总就是根据统计研究的需要,将统计总体按照一定的标志区分成若干组成部体按照一定的标志区分成若干组成部分的一种统计方法
7、分的一种统计方法。qq对总体而言,是对总体而言,是“分分”,即将总体区分为性质,即将总体区分为性质相异的若干部分。相异的若干部分。qq对总体单位而言,是对总体单位而言,是“合合”,即将性质相同的,即将性质相同的个体组合起来,在同一组内则保持着相同的性个体组合起来,在同一组内则保持着相同的性质。质。1.统计分组统计分组一、统计分组的概念分组分组分组前分组前分组前分组前分组后分组后分组后分组后253342(一一)区分社会经济现象的性质区分社会经济现象的性质运用统计分组的方法将所要研究的现象总体划分为不同类型的组来进行研究。例例1:按所有制性质划分,我国现有:按所有制性质划分,我国现有8种经济类型:
8、国有经种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济经济;外商投资经济;港澳台投资经济例:某校新生按民族分组表按民族分组学生人数比率(%)汉族90081.82少数民族20018.18合计1100100.00(二二)反映总体的内部结构(三)三)分析现象之间的依存关系分析现象之间的依存关系例如例如例如例如:某地区某地区某地区某地区6565个百货商店流通费用率资料个百货商店流通费用率资料个百货商店流通费用率资料个百货商店流通费用率资料按商品按商品按商品按商品销销销销售售售售额额额额分分分分组组组组/
9、万元万元万元万元商店数商店数商店数商店数/个个个个流通流通流通流通费费费费用率用率用率用率/%/%/%/%50505050以下以下以下以下50100501005010050100100150100150100150100150150200150200150200150200200250200250200250200250250250250250以上以上以上以上5 5 5 5101010102525252512121212101010103 3 3 312.112.112.112.111.411.411.411.410.910.910.910.99.89.89.89.89.09.09.09.08
10、.28.28.28.2分组的关键是分组的关键是分组标志的选择和组限的划分分组标志的选择和组限的划分。正确正确选择分组标志选择分组标志是是做好统计分组的前提。做好统计分组的前提。三、分组标志的选择(一一)正确地选择分组标志是进行统计分组的关键正确地选择分组标志是进行统计分组的关键如何选择分组标志的问题是统计分组的核心问题。.根据研究目的选择分组标志。如研究某企业职工的素质情况,应选择文化程度为分组标志。.选择反映现象本质特征的分组标志。如研究居民家庭生活水平,可按每户月收入和每户人均月收入分组,但后者剔除了家庭人口多少的影响因素,反映了每个家庭的真正收入水平和生活状况。3根据经济发展变化及历史条
11、件选择分组标志。如在生产力水平较低的情况下,研究企业规模,一般以职工人数作为分组标志;而在生产力水平较高的情况下,一般使用企业生产能力和固定资产价值作为分组标志。按按品质标志分组品质标志分组按按数量标志分组数量标志分组品质分组就是按品质(或属性)品质分组就是按品质(或属性)标志的分组。标志的分组。例如工业企业按经济类型、部门、人口按性别、职业地区等标志分组。数量分组就是按数量标志的分组,数量标志的变异数量分组就是按数量标志的分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量性体现在它不断变动自身的数量上,故也称为变量分组。分组。例如工业企业按职工人数、资产总额分组;人口按年龄、收
12、入等标志分组。四、统计分组的方法品质标志:统计分类;数量标志:量的界限品质标志:统计分类;数量标志:量的界限按按数量标志分组的形式数量标志分组的形式(补充补充)单项式分组单项式分组指用单一的数值作为分组标志的分指用单一的数值作为分组标志的分组。每个数值作为一个组。组。每个数值作为一个组。适用条件:适用条件:离散型变量,且变动幅度较小。离散型变量,且变动幅度较小。如某班如某班学生按年龄分组:学生按年龄分组:17岁,岁,18岁,岁,19岁,岁,20岁,岁,21岁,岁,22岁。岁。组距式分组组距式分组将作为分组依据的数量标志的整个取值将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和
13、范围依次划分为若干个满足互斥性和包包容性的区间,用这些数值区间作为组的容性的区间,用这些数值区间作为组的名称。名称。适用条件:连续变量;离散变量,若适用条件:连续变量;离散变量,若变动幅度大,也适宜采用组距分组。变动幅度大,也适宜采用组距分组。某班某班学生统计学生统计学成绩分组学成绩分组60分以下分以下6070分分7080分分8090分分90分以上分以上简单分组简单分组 复合分组复合分组 即总体按一个即总体按一个标志进行分组。标志进行分组。它只能从某一方它只能从某一方面说明总体的分面说明总体的分布状况和内部结布状况和内部结构。构。复合分组是指对复合分组是指对所研究的总体按两个所研究的总体按两个
14、或两个以上的标志层或两个以上的标志层叠或交叉起来分组。叠或交叉起来分组。可用于对事物多方面、可用于对事物多方面、多层次的分析研究。多层次的分析研究。(三)按分组标志的多少分为简单分组和复(三)按分组标志的多少分为简单分组和复合分组合分组性别男女人数文化程度人数大学及以上专科高中及以下男女男女男女简单分组复合分组举例为了治国治水的需要,进行了初步的国势调查,将全国分为九州,并按土质的优劣将九州的田、赋分成上中下三等,每等又分为上中下三级,形成了“三等九级”的复复合分组合分组。这被欧洲统计学者称为国势统计学最早的萌芽。统计分组的原则穷尽原则与互斥原则比如将顾客按男、女、老、少分为四组,分析其需求,
15、这种分组方法是否合适?请说明理由。答:这种分组方法不合适。(1分)分组应遵循“互斥原则”,即总体任何一个单位只能归属于某一组,而不能同时归属于几个组。(2分)这种分组方法违背“互斥原则”,例如,某一顾客是少女,她可以分在“女”组,又可以分在“少”组。(2分)五、统计分组体系统计分组体系有两种:1、平行分组体系 平行分组体系,是对同一总体选择两个或两个以上的标志分别进行简单分组。例如对高校教师按年龄、职称、性别等标志分别进行简单分组,可得到一个平行的分组体系,如图所示。中年按年龄分组 老年 男教师按性别分组 女教师 副教授按职称分组 教授 讲师 是对同一总体同时选择两个或两个以上标志层叠起来进行
16、分组。例如,为了了解我国高等学校在校学生的基本状况,可同时选择学科、学历、性别等三个标志进行复合分组,得到的复合分组体系如图3-3所示。2、复合分组体系 男生 研究生 女生 男生 本科生 女生 男生 理科 专科生 女生高校在校学生 男生 研究生 女生 男生 文科 本科生 女生 男生 专科生 女生 图 3-3某校教师按性别、职称复合分组表 组别人数(人)比重()男性教授副教授讲师助教女性教授副教授讲师助教 92 4 18 40 30126 3 22 56 4542.2 1.8 8.318.313.857.8 1.410.125.720.6合计218100.0第三节 分配数列一、分配数列的概念与种
17、类二、累计次数分布三、次数分布的主要类型四、统计图一、分配数列的概念与种类(一)分配数列的概念 在资料整理中,对原始资料按某一标志进行分组,并按一定顺序排列,同时,列出各组的总体单位数的称为分配数列(次数分布数列)。分布在各组的总体单位数叫做次数或频数。分布在各组的总体单位数叫做次数或频数。分布数列由两个要素构成,即:分布数列由两个要素构成,即:总体按某标志的分总体按某标志的分组;各组次数或频率组;各组次数或频率。某车间工人按日产量分组表日产量(件)工人数(人)人数比重(%)2021222324251020305040305.5611.1116.6727.7722.2216.67合计18010
18、0.00 组别 次数(频数)比率(频率)变量数列变量数列品质数列品质数列分分类类异距数列异距数列等距数列等距数列组距数列组距数列单项数列单项数列二、变量数列的二、变量数列的种类种类品质品质分布数列分布数列单项变量数列单项变量数列 单项变量数列是按数量标志分组后单项变量数列是按数量标志分组后,用一个变量值代表一个组形成的数列用一个变量值代表一个组形成的数列(见表见表3-53-5)。下一个查看Excel表3-5组距组距变量数列变量数列日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223232424252526263 35 5
19、6 64 43 32 21 1合计合计合计合计2424某车间工人按日产量分组如下:某车间工人按日产量分组如下:单项数列组距数列某班按考试成绩按分组如下某班按考试成绩按分组如下 按考试成绩分组(分)按考试成绩分组(分)学生人数(人)学生人数(人)60以下以下60707080809090以上以上38897合计合计35组距式分组中的一些概念组距式分组中的一些概念组限组限上限上限下限下限区间数值的最大值区间数值的最大值区间数值的最小值区间数值的最小值组距组距每一组的每一组的区间长度区间长度组距组距=上限上限-下限下限 组组中值中值每每一组一组中点位置的数值中点位置的数值组组中值中值=(上限(上限+下限
20、)下限)2开口组开口组缺少上限数值或下限数值的组缺少上限数值或下限数值的组注意注意开口组以相邻组的组距作为该组的组距,开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。确定其下限或上限,再计算组中值。销售额销售额(万元)(万元)商店数商店数(个)(个)每百元每百元商品销商品销售额中支付的售额中支付的流通费(元)流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元万元)如:组中值如:组中值x=(U+L)/2 =(100+20
21、0)/2=150(万元)(万元)组距式分组中的一些概念组距式分组中的一些概念间断式分组间断式分组凡是组限不相连,以整数位断开凡是组限不相连,以整数位断开的分组,称为间断组距式分组的分组,称为间断组距式分组。连续式分组连续式分组凡是组限相连,即相邻组上、下凡是组限相连,即相邻组上、下限重叠,称为连续式分组限重叠,称为连续式分组。60分以下分以下6070分分7080分分8090分分90分以上分以上300以下以下301400人人401500人人501600人人601人以上人以上间断式分组间断式分组连续式分组连续式分组组距式分组中的一些概念组距式分组中的一些概念等距分组等距分组异距分组异距分组各组组距
22、相等的分组称为等距分组各组组距相等的分组称为等距分组。各组组距不全相等的分组称为异距各组组距不全相等的分组称为异距分组分组。例如例如60分以下分以下6070分分7080分分8090分分90分以上分以上组组中值为中值为(60+50)2=55组组中值为中值为(90+100)2=95上限不在内原则上限不在内原则单项数列单项数列指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备变量是离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编制条件:【例例例例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他
23、们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。二、变量数列的编制(补充)二、变量数列的编制(补充)1.单项式变量数列的编制单项式变量数列的编制单项式变量数列单项式变量数列编制步聚:编制步聚:第一,将变量值的原始资料按第一,将变量值的原始资料按顺序排列顺序排列,一般是由小到大排列。一般是由小到大排列。第二,确定各组的第二,确定各组的变量值和组数变量值和组数。一个变。一个变量值为一组,重复出现的变量值只取一个。
24、量值为一组,重复出现的变量值只取一个。第三,整理出变量值出现的第三,整理出变量值出现的次数次数,编制单,编制单项式变量数列。项式变量数列。日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下:编制结果如下:组距数列组距数列指每个组的变量值用指每个组的变量值用一个区一个区间间来表现的变量数列来表现的变量数列变量是变量是连续变量连续变量;总体单位数较多、变量取值个数也较总体单位数较多、变量取值个数也较多的多的离散变量离散
25、变量。编制条件编制条件:2.组距式变量数列的编制组距式变量数列的编制变量值变动区间的长度相等。变量值变动区间的长度相等。变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异距数列异距数列原始数据原始数据排序排序确定组限确定组限计算变异全距计算变异全距确定组数、组距确定组数、组距汇总各组单位数汇总各组单位数制作组距数列统计表制作组距数列统计表 编制步骤或内容编制步骤或内容某生产车间某生产车间50名工人日加工零件数如下名工人日加工零件数如下(单位单位:个个)117 122 124 129 139 107 117 130 122 125 108 131 125 117 12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 第三 统计 整理
限制150内