统计数据的整编与显示.ppt





《统计数据的整编与显示.ppt》由会员分享,可在线阅读,更多相关《统计数据的整编与显示.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第3章 统计数据的整理与显示,PowerPoint,主要内容,一、统计数据的整理 二、统计数据的显示 三、EXCEL在数据整理与显示中的应用,学习目标,1了解统计数据整理的概念及步骤; 2 掌握统计分组的方法; 3. 熟悉频数分布的概念、构成与类型; 4. 运用EXCEL整理与显示数据。,通过统计调查可以搜集到大量的统计资料,但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。,统计整理,将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体特征的过程。,是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。,地位,
2、一、统计数据的整理,数据的预处理,数据的分组,数据的汇总,分布数列(频数分布),统计数据整理的一般程序,(一)数据的预处理,数据的审核 检查数据中的错误 数据的排序 升序和降序 寻找数据的基本特征 数据的筛选 找出符合条件的数据,完整性与及时性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 检查填报单位是否按时报送了有关数据 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等,数据的审核,审核数据准确性的常用方法 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象 主要用于对分类
3、和顺序数据的审核 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错误 主要用于对数值型数据的审核,按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成,数据的排序,分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序 递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(n),数据的筛选,将某些不符合要求的
4、数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来 Excel的筛选功能有两种,即自动筛选和高级筛选。,用Excel进行数据筛选,8名学生的考试成绩数据,(二)统计分组,指根据事物的内在特点和统计研究的目的,按一定的标志将统计总体区分为若干性质不同的组成部分的统计研究方法,对总体而言,是“分”,即将总体区分为性质相异的若干部分。,对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。,1.概念,分组前,分组后,25,33,42,(1)划分现象的类型,例:如:国民经济按产业分组农业分成农、林、牧、渔业各组;企业按所有制分组等。,2.作用,(2)揭示现象
5、的内部结构,(3)分析现象之间的依存关系,我国五次人口普查的人口年龄构成表 单位:%,中国农民家庭按收入分组的恩格尔系数,3.原则,互斥性,穷尽性,指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。,指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。,4.种类,按分组标志不同,按每组变量值的取值范围,按分组标志多少及排列方式,品质分组,数量分组,单项分组,组距分组,平行分组,复合分组,简单分组,选择反映事物属性差异的标志进行的分组。亦即对非数值型数据进行分组,包括对分类数据的分组与对顺序数据的分组。,选择反映事物数量的差异的标志进行的分组。亦即对
6、数值型数据进行分组。,品质分组,数量分组,产品按等级可分为一等品、二等品、三等品等组,如饮料按品牌可分为百事可乐、可口可乐、芬达、雪碧、七喜等组,如人口按年龄分组:0-14岁,15-64岁,65岁以上。,单项分组,用一个变量值(数据)作为一组,适用于分类数据、顺序数据以及对变动范围不大、不同变量值个数不多的离散型数据进行分组。,如家庭按子女人数分组:0,1,2,3, 4,。,组距分组,将变量值的一个区间作为一组,只适用于数值型数据。一般用来对连续型数据或变动范围较大、不同变量值个数较多的离散型数据进行分组。,如某班学生某学科成绩分组:60分以下,6070分,7080分,8090分,90分以上。
7、,组限,上限,下限,每个组的最大值,每个组的最小值,组距,每一组的区间长度,组距=上限-下限,组中值,每一组中点位置的数值,组中值=(上限+下限)2,开口组,缺少上限数值或下限数值的组,注意,开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。,组距分组中的一些概念,等距分组,异距分组,各组组距相等的分组称为等距分组。,各组组距不全相等的分组称为异距分组。,如某班学生某学科成绩分组:60分以下,6070分,7080分,8090分,90分以上。,如人口按年龄分组:0-15岁,15-60岁,60岁以上。,进行组距分组需要注意的问题,要处理好组数与组距问题,组数的确定主要凭经验;也可
8、按不同的组数进行试验,比较其次数分布,看哪一个能够更好地显示出分组数据的特征;还可以根据美国学者斯特杰斯(Sturges)创立的经验公式k=1+3.3lgN(N为总体单位数)来确定。,组数一旦确定,组距就可以根据全距来确定。组距=全距/组数,宜采用5或10的倍数,对某组数值型数据是进行等距分组还是异距分组,这取决于变量值的分布状况。,对于离散变量,相邻组组限可以间断,也可重叠; 对于连续变量,相邻组组限必须重叠; 遵循“上限不在内”原则; 首末两组可使用“以下”及“以上”的开口组。,第二、组限的表示,要处理好组限的问题,第一,最小组的下限应低于最小变量值,而最大组的上限应高于最大变量值;,某班
9、学生数学成绩的分布情况,上组限U,下组限L,组距d=U-L =90-80=10(分),组中值x=(U+L)/2 =(80+90)/2 =85(分),组中值 x=L+d/2 =60-(70-60)/2 =55(分),上限不在内原则,简单分组,复合分组,只按一个分组标志对所研究的总体进行分组。,按两个或两个以上的标志层叠排列对同一总体进行分组。,平行分组,按两个或两个以上的标志平行排列对同一总体进行分组。,对教师的分组,按性别分组,男性,女性,按职称分组,高级,中级,初级,共计5组 2+3,平行分组,按性别分类,按职称分类,男,女,高级,中级,初级,共计6组23,对教师的分类,复合分组,(三)数据
10、的汇总,数据汇总的组织形式,逐级汇总,集中汇总,综合汇总,按照一定的统计管理体制,自下而上逐级汇总统计数据的一种组织形式。,将全部调查数据集中到组织统计调查的最高一级机关进行统一汇总的形式。,将上述两种组织形式结合使用的汇总形式。,数据汇总的方法,手工汇总,电子计算机汇总,“条件计算函数”,“Frequency函数”, “分类汇总”,“直方图工具”,“数据透视表”,数据汇总的方式,计数汇总,求和汇总,平均值汇总,(四)频数分布,在统计分组基础上,将总体所有单位按组归并排列,形成总体中各个单位在各组间的分布,亦称频数分布数列。,各组变量值(可以是一组一个变量值、也可以是一定范围的变量值),2.构
11、成要素,频率,各组单位数占总体单位总数的比重,次数,总体单位在各组中出现的次数,亦称频数,各组的次数或频率,1.概念,累计次数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,某班学生数学成绩的分布情况,=13/50,数量数列-数值型数据的频数分布,品质数列-分类数据、顺序数据的频数分布,3.种类,某超市某日出售的50瓶饮料品牌的频数分布,分类数据的频数分布,品质数列、单项数列,某省2009年部分城镇居民收入高低的频数分布,
12、顺序数据的频数分布,品质数列、单项数列,某车间50名职工的家庭人口分布,数值型数据的频数分布,数量数列、单项数列,某班学生数学成绩的分布情况,数值型数据的频数分布,数量数列、组距数列,钟型分布,型分布,型分布,4.分布类型,二、统计数据的显示,作用,1、使统计数据系统化、条理化、生动化,便于资料的积累和比较分析。,2、清晰地显示现象的活动过程和现象之间的复杂关系,给人一种一目了然的印象。,总标题,数字资料,横行标题,纵栏标题,是统计表表的名称,放在表格的正上方,是横行的名称,通常用来表示各组的名称,一般放在表格的左边,是纵栏的名称,通常为统计指标的名称 ,一般放在表格的右上方,即指标数值,排列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计数据 整编 显示

限制150内