统计数据整理与显示.pptx
主要内容主要内容一、统计数据的整理一、统计数据的整理二、统计数据的显示二、统计数据的显示三、三、EXCELEXCEL在数据整理与显示中的应用在数据整理与显示中的应用第1页/共95页学习目标学习目标1 1了解统计数据整理的概念及步骤;了解统计数据整理的概念及步骤;2 2 掌握统计分组的方法;掌握统计分组的方法;3.3.熟悉频数分布的概念、构成与类型;熟悉频数分布的概念、构成与类型;4.4.运用运用EXCELEXCEL整理与显示数据。整理与显示数据。第2页/共95页 通过统计调查可以搜集到大量的统计资料,通过统计调查可以搜集到大量的统计资料,但是这些资料只是反映总体单位具体情况的分散但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。的、不系统的资料,不能用以反映总体的特征。统计整理统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的分类和汇总,使之成为系科学的分类和汇总,使之成为系统化、条理化的综合资料,以反统化、条理化的综合资料,以反映研究总体特征的过程。映研究总体特征的过程。是统计调查的继续,统计分析的前是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。提和基础,起着承前启后的作用。地位地位一、统计数据的整理一、统计数据的整理第3页/共95页数据的预处理数据的预处理数据的分组数据的分组数据的汇总数据的汇总分布数列(频数分布)分布数列(频数分布)统计数据整理的一般程序统计数据整理的一般程序第4页/共95页(一)数据的预处理(一)数据的预处理数据的审核检查数据中的错误数据的排序升序和降序寻找数据的基本特征数据的筛选找出符合条件的数据第5页/共95页完整性与及时性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全检查填报单位是否按时报送了有关数据 准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等数据的审核数据的审核第6页/共95页审核数据准确性的常用方法逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对分类和顺序数据的审核计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误1.主要用于对数值型数据的审核第7页/共95页按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成数据的排序数据的排序第8页/共95页分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分数值型数据的排序递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(2)x(n)第9页/共95页数据的筛选数据的筛选将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误的数据予以剔除误的数据予以剔除将符合某种特定条件的数据筛选出来将符合某种特定条件的数据筛选出来ExcelExcel的的筛筛选选功功能能有有两两种种,即即自自动动筛筛选选和和高高级筛选。级筛选。第10页/共95页用用ExcelExcel进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据 第11页/共95页(二)统计分组(二)统计分组指根据事物的内在特点和统计研究的指根据事物的内在特点和统计研究的目的,按一定的目的,按一定的标志标志将统计总体区分将统计总体区分为若干为若干性质不同性质不同的组成部分的统计研的组成部分的统计研究方法究方法q对总体而言,是对总体而言,是“分分”,即将总体区分为性质,即将总体区分为性质相异的若干部分。相异的若干部分。q对总体单位而言,是对总体单位而言,是“合合”,即将性质相同的,即将性质相同的个体组合起来,在同一组内则保持着相同的性个体组合起来,在同一组内则保持着相同的性质。质。1.1.概念概念第12页/共95页分组前分组前分组后分组后253342(1 1)划分现象的类型)划分现象的类型 例:如:国民经济按产业分组农业分成农、林、牧、如:国民经济按产业分组农业分成农、林、牧、渔业各组;企业按所有制分组等。渔业各组;企业按所有制分组等。2.2.作用作用第13页/共95页(2 2)揭示现象的内部结构)揭示现象的内部结构 (3 3)分析现象之间的依存关系)分析现象之间的依存关系我国五次人口普查的人口年龄构成表 单位:%按年龄分组(岁)1953年1964年1982年1990年2000年015156565以上36.359.34.440.755.73.633.661.54.927.566.75.822.970.17.0合计100100100100100 中国农民家庭按收入分组的恩格尔系数按收入分组(元)2003004005006008001000恩格尔系数(%)64.960.256.754.450.549.943.6第14页/共95页3.3.原则原则互斥性互斥性穷尽性穷尽性指各组之间指各组之间界限明确界限明确,总体中的,总体中的每一个单位,都只应属于其中的每一个单位,都只应属于其中的一个组。一个组。指在一个分组方案中拟定的所有指在一个分组方案中拟定的所有组,能够包容总体的组,能够包容总体的全部单位全部单位,不能排斥和遗漏任何一个单位。不能排斥和遗漏任何一个单位。第15页/共95页4.4.种类种类按分组标志不同按分组标志不同 按每组变量值的取值范围按每组变量值的取值范围 按分组标志多少及排列方式按分组标志多少及排列方式 品质分组品质分组数量分组数量分组 单项分组单项分组组距分组组距分组 平行分组平行分组复合分组复合分组简单分组简单分组第16页/共95页选择反映事物选择反映事物属性差异属性差异的标志进行的标志进行的分组。亦即对非数值型数据进行的分组。亦即对非数值型数据进行分组,包括对分类数据的分组与对分组,包括对分类数据的分组与对顺序数据的分组。顺序数据的分组。选择反映事物选择反映事物数量的差异数量的差异的标志进的标志进行的分组。亦即对数值型数据进行行的分组。亦即对数值型数据进行分组。分组。品质分组品质分组数量分组数量分组产品按等级可分为一等品、二等品、三等品等组产品按等级可分为一等品、二等品、三等品等组 如如饮料按品牌可分为百事可乐、可口可乐、芬达、雪碧、七喜等组饮料按品牌可分为百事可乐、可口可乐、芬达、雪碧、七喜等组 如人口按年龄分组:如人口按年龄分组:0-140-14岁,岁,15-6415-64岁,岁,6565岁以上。岁以上。第17页/共95页单项分组单项分组用用一个变量值一个变量值(数据)作为一组,适用(数据)作为一组,适用于分类数据、顺序数据以及对变动范围于分类数据、顺序数据以及对变动范围不大不大、不同变量值个数不多、不同变量值个数不多的离散型数的离散型数据进行分组。据进行分组。如家庭按子女人数分组:如家庭按子女人数分组:0 0,1 1,2 2,3 3,4 4,。组距分组组距分组将变量值的将变量值的一个区间一个区间作为一组,只适用作为一组,只适用于数值型数据。一般用来对连续型数据于数值型数据。一般用来对连续型数据或变动范围较大、不同变量值个数较多或变动范围较大、不同变量值个数较多的离散型数据进行分组。的离散型数据进行分组。如某班学生某学科成绩分组:如某班学生某学科成绩分组:6060分以下,分以下,60706070分,分,70807080分,分,80908090分,分,9090分以上。分以上。第18页/共95页组限组限上限上限下限下限每个组的每个组的最大值最大值每个组的每个组的最小值最小值组距组距每一组的区间长度每一组的区间长度组距组距=上限上限-下限下限 组中值组中值每一组每一组中点位置中点位置的数值的数值组中值组中值=(上限(上限+下限)下限)22开口组开口组缺少上限数值或下限数值的组缺少上限数值或下限数值的组注意注意开口组以相邻组的组距作为该组的组距,开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。确定其下限或上限,再计算组中值。组距分组中的一些概念组距分组中的一些概念第19页/共95页等距分组等距分组异距分组异距分组各组组距相等各组组距相等的分组称为等的分组称为等距分组距分组。各组组距不全相等各组组距不全相等的分组称的分组称为异距分组为异距分组。如某班学生某学科成绩分组:如某班学生某学科成绩分组:6060分以下,分以下,60706070分,分,70807080分,分,80908090分,分,9090分以上。分以上。如人口按年龄分组:如人口按年龄分组:0-150-15岁,岁,15-6015-60岁,岁,6060岁以上。岁以上。第20页/共95页进行组距分组需要注意的问题进行组距分组需要注意的问题要处理好组数与组距问题要处理好组数与组距问题 组数的确定主要凭经验;也可按不同的组数组数的确定主要凭经验;也可按不同的组数进行试验,比较其次数分布,看哪一个能够更好进行试验,比较其次数分布,看哪一个能够更好地显示出分组数据的特征;还可以根据美国学者地显示出分组数据的特征;还可以根据美国学者斯特杰斯(斯特杰斯(SturgesSturges)创立的经验公式)创立的经验公式k=1+3.3lgNk=1+3.3lgN(N(N为总体单位数为总体单位数)来确定。来确定。组数一旦确定,组距就可以根据全距来确组数一旦确定,组距就可以根据全距来确定。组距定。组距=全距全距/组数,宜采用组数,宜采用5或或10的倍数的倍数 对某组数值型数据是进行等距分组还是异对某组数值型数据是进行等距分组还是异距分组,这取决于变量值的分布状况。距分组,这取决于变量值的分布状况。第21页/共95页q对于离散变量,相邻组组限可以间断,也可重叠;对于离散变量,相邻组组限可以间断,也可重叠;q对于连续变量,相邻组组限必须重叠;对于连续变量,相邻组组限必须重叠;q遵循遵循“上限不在内上限不在内”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以上以上”的开口的开口组。组。第二、组限的表示第二、组限的表示要处理好组限的问题要处理好组限的问题 第一,最小组的下限应低于最小变量值,而最大组的第一,最小组的下限应低于最小变量值,而最大组的上限应高于最大变量值;上限应高于最大变量值;第22页/共95页某班学生数学成绩的分布情况某班学生数学成绩的分布情况按成绩分组(分)学生人数(人)60以下60-7070-8080-9090-100合 计上组限上组限U U下组限下组限L L组距组距d=U-Ld=U-L=90-80=10=90-80=10(分)(分)组中值组中值x=(U+L)/2 x=(U+L)/2 =(80+90)/2=(80+90)/2=85=85(分)(分)组中值组中值 x=L+d/2x=L+d/2=60-(70-60)/2=60-(70-60)/2=55=55(分)(分)上限不在内原则上限不在内原则第23页/共95页简单分组简单分组 复合分组复合分组 只按一个分组标志对所研究的只按一个分组标志对所研究的总体进行分组。总体进行分组。按两个或两个以上的标志层叠按两个或两个以上的标志层叠排列对同一总体进行分组。排列对同一总体进行分组。平行分组平行分组 按两个或两个以上的标志平行按两个或两个以上的标志平行排列对同一总体进行分组。排列对同一总体进行分组。第24页/共95页对教师对教师的分组的分组按性别分组按性别分组男性男性女性女性按职称分组按职称分组高级高级中级中级初级初级共计共计5 5组组 2+32+3平行分组平行分组第25页/共95页按性别按性别分类分类按职称按职称分类分类男男女女高级高级中级中级初级初级共计共计6 6组组2323对教师对教师的分类的分类复合分组复合分组第26页/共95页(三)数据的汇总(三)数据的汇总 数数据据汇汇总总的的组组织织形形式式逐级汇总逐级汇总集中汇总集中汇总综合汇总综合汇总按照一定的统计管理体制,自下而按照一定的统计管理体制,自下而上逐级汇总统计数据的一种组织形上逐级汇总统计数据的一种组织形式。式。将全部调查数据集中到组织统计调将全部调查数据集中到组织统计调查的最高一级机关进行统一汇总的查的最高一级机关进行统一汇总的形式。形式。将上述两种组织形式结合使用的将上述两种组织形式结合使用的汇总形式。汇总形式。第27页/共95页数数据据汇汇总总的的方方法法 手工汇总手工汇总电子计算机汇总电子计算机汇总“条件计算函数条件计算函数”“Frequency“Frequency函数函数”“分类汇总分类汇总”“直方图工具直方图工具”“数据透视表数据透视表”第28页/共95页数数据据汇汇总总的的方方式式 计数汇总计数汇总 求和汇总求和汇总 平均值汇总平均值汇总 第29页/共95页(四)频数分布(四)频数分布 在统计分组基础上在统计分组基础上,将总体所有单位按组将总体所有单位按组归并排列,形成总体中各个单位在各组归并排列,形成总体中各个单位在各组间的分布,亦称频数分布数列。间的分布,亦称频数分布数列。各组变量值各组变量值(可以是一组一个变量值、(可以是一组一个变量值、也可以是一定范围的变量值)也可以是一定范围的变量值)2.2.构成要素构成要素频率频率各组单位数占总体单位总数的比重各组单位数占总体单位总数的比重次数次数总体单位在各组中出现的次数,亦称频数总体单位在各组中出现的次数,亦称频数 各组的次数或频率各组的次数或频率1.1.概念概念第30页/共95页累计次数(频率)累计次数(频率)从变量值低的组开始,将各组次从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数说明某一组上限以下各组的累计次数(频率)。(频率)。向向上上累累计计向向下下累累计计 从变量值高的组开始,将各组次从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数说明某一组下限以上各组的累计次数(频率)。(频率)。第31页/共95页某班学生数学成绩的分布情况某班学生数学成绩的分布情况按成绩分组(分)学生人数(人)学生比例(%)累计学生人数(人)向上累计向上累计累计学生比例(%)向上累计向上累计60以下 51051060-70 918142870-801326275480-901530428490-100 81650100合 计50100-=13/50第32页/共95页数量数列数量数列-数值型数据的频数分布数值型数据的频数分布品质数列品质数列-分类数据、顺序数据的频数分布分类数据、顺序数据的频数分布异距数列异距数列等距数列等距数列组距数列组距数列单项数列单项数列3.3.种类种类第33页/共95页某超市某日出售的某超市某日出售的5050瓶饮料品牌的频数分布瓶饮料品牌的频数分布饮料品牌频数(瓶)可口可乐15旭日升冰茶11百事可乐9汇源果汁6露 露9合 计50分类数据的频数分布分类数据的频数分布品质数列、单项数列品质数列、单项数列第34页/共95页某省某省20092009年部分城镇居民收入高低的频数分布年部分城镇居民收入高低的频数分布 按收入高低分组调查人数(人)最低收入418低收入398中下收入763中等收入738中上收入693高收入313最高收入305合 计3628顺序数据的频数分布顺序数据的频数分布品质数列、单项数列品质数列、单项数列第35页/共95页 某车间某车间5050名职工的家庭人口分布名职工的家庭人口分布子女人数分组(人)户数(户)比例(%)0123 935 5 1187010 2合 计50100数值型数据的频数分布数值型数据的频数分布数量数列、单项数列数量数列、单项数列第36页/共95页某班学生数学成绩的分布情况某班学生数学成绩的分布情况按成绩分组(分)学生人数(人)学生比例(%)60以下 51060-70 91870-80132680-90153090-100 816合 计50100数值型数据的频数分布数值型数据的频数分布数量数列、组距数列数量数列、组距数列第37页/共95页钟型分布钟型分布 型分布型分布 型分布型分布 4.4.分布类型分布类型第38页/共95页二、统计数据的显示二、统计数据的显示作用作用1 1、使统计数据、使统计数据系统化、条理化、生动化,系统化、条理化、生动化,便于资料的积累和比较分析。便于资料的积累和比较分析。2 2、清晰清晰地显示现象的活动过程和现象之间地显示现象的活动过程和现象之间的复杂关系,给人一种一目了然的印象。的复杂关系,给人一种一目了然的印象。统计数据的显示统计表统计图第39页/共95页总标题总标题数字资料数字资料横行标题横行标题纵栏标题纵栏标题是统计表表的名称,放在表格的正是统计表表的名称,放在表格的正上方上方 是横行的名称,通常用来表示各组的是横行的名称,通常用来表示各组的名称,一般放在表格的左边名称,一般放在表格的左边 是纵栏的名称,通常为统计指标的是纵栏的名称,通常为统计指标的名称名称 ,一般放在表格的右上方,一般放在表格的右上方即指标数值,排列在各横行标题与即指标数值,排列在各横行标题与纵栏标题的交叉处纵栏标题的交叉处 从从形形式式看看 (一)统计表(一)统计表1.统计表的概念与结构统计表的概念与结构 统计表可分为广义统计表和狭义统计表两种。人们统计表可分为广义统计表和狭义统计表两种。人们通常所说的统计表是反映频数分布的表格。通常所说的统计表是反映频数分布的表格。第40页/共95页主词主词宾词宾词统计表所要说明的总体及其组成部分统计表所要说明的总体及其组成部分说明总体及总体各组数量特征而采用说明总体及总体各组数量特征而采用的统计指标的统计指标 从从内内容容看看第41页/共95页2.统计表的种类统计表的种类常见的统计表主要有以下几种:常见的统计表主要有以下几种:显示未分组数据的统计表显示未分组数据的统计表显示分组数据的统计表显示分组数据的统计表简单表简单表 简单分组表简单分组表 平行分组表平行分组表 复合分组表复合分组表 第42页/共95页简单表简单表显示未分组数据的统计表显示未分组数据的统计表 某地区某地区20022002年铁矿计划完成情况年铁矿计划完成情况企业名称企业名称计划产量计划产量(吨吨)实际产量实际产量(吨吨)计划完成计划完成(%)(%)甲矿甲矿乙矿乙矿丙矿丙矿丁矿丁矿第43页/共95页简单分组表简单分组表对总体进行简单分组的统计表对总体进行简单分组的统计表 某地区某地区20022002年各类型企业总产值表年各类型企业总产值表企业按规模分组企业按规模分组总产值总产值(亿元亿元)比上年增长比上年增长(%)(%)大型企业大型企业中型企业中型企业小型企业小型企业合合 计计第44页/共95页平行分组表平行分组表对总体选择二个或二个以上标志进行对总体选择二个或二个以上标志进行平行分组的统计表。平行分组的统计表。20092009年末某地区人口统计表年末某地区人口统计表 按城镇与性别分组按城镇与性别分组人口数人口数(万人万人)比例比例(%)(%)全地区人口合计全地区人口合计一、按城镇分组一、按城镇分组 城镇城镇 农村农村二、按性别分组二、按性别分组 男性男性 女性女性4257-10683189-21172140100.00-25.0974.91-49.7350.27第45页/共95页复合分组表复合分组表对总体进行复合分组的统计表对总体进行复合分组的统计表 20092009年末某地区人口统计表年末某地区人口统计表按城镇与性别分组人 口 数绝对数(万人)比例(%)全地区人口总计 一、城镇 男性 女性 二、农村 男性 女性4,2571,0685165523,1891,6011,588100.0025.0912.1212.9774.9137.6137.30第46页/共95页男性男性女性女性 合计合计比例比例(%)城镇城镇516552106825.09农村农村16011588318974.91合计合计211721404257100.00比例比例(%)49.7350.27100.00-城乡城乡性别性别20092009年末某地区人口统计表年末某地区人口统计表 单位:万人单位:万人第47页/共95页(1)总标题内容应满足3 3W W 要求(2)合理安排统计表的结构(3)表中的上下两条横线一般用粗线,其他线用细线,通常情况下,统计表的左右两边不封口(4)统计表各纵列若须合计时,一般应将合计列在最后一行,各横行若须要合计时,可将合计列在最前一栏或最后一栏(5)数据计量单位相同时,可放在表的右上角,不同时应放在每个指标后或单列出计量单位栏(6)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一(7)对于没有数字的表格单元,一般用“”表示(8)必要时可在表的下方加上注释3.统计表的设计统计表的设计第48页/共95页(二)统计图(二)统计图1.1.统计图的概念和结构统计图的概念和结构 统计图是以图形形象地表现统计数据的一统计图是以图形形象地表现统计数据的一种形式。种形式。统计图一般包括以下几部分:统计图一般包括以下几部分:标题,一般包括图表标题、数值轴(标题,一般包括图表标题、数值轴(X X、Y Y)标题;标题;坐标轴和网格线;坐标轴和网格线;图表区和绘图区;图表区和绘图区;图例,图例用来标明图表中的数据系列。图例,图例用来标明图表中的数据系列。第49页/共95页2.2.统计图的种类统计图的种类显示分组数据的统计图显示分组数据的统计图显示未分组数据的统计图显示未分组数据的统计图箱线图箱线图茎叶图茎叶图环形图环形图 饼饼 图图直方图 条形图条形图 折线图折线图第50页/共95页用宽度相同的条形的高度或长短来表示数据多少的图形有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图条形图条形图第51页/共95页第52页/共95页用长方形的宽度和高度来表示频数分布的图形,实际上是用长方形的面积来表示各组的频率分布在直角坐标中,用横轴表示数据分组,即各组组限,纵轴表示频数或频率,各组组距与相应的频数就形成了一个个竖立长方形直方图下的总面积等于1只能用于显示数值型数据的频数分布如果是异距数列,则通常按频数密度(频数密度=频数组距)绘制直方图 直方图直方图第53页/共95页第54页/共95页条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用长方形的高度表示每一组的频数或频率,宽度则表示各组的组距,其高度与宽度均有意义直方图中的长方形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数值型数据直方图与条形图的区别:直方图与条形图的区别:第55页/共95页折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉也可以根据各组组中值与频数求出各组的坐标点,并用折线连接各点而成折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的折线图折线图第56页/共95页第57页/共95页 折线图可以用来表示累计频数或累计频率分布,但折线图可以用来表示累计频数或累计频率分布,但累计频数分布图的画法和频数分布折线图画法有所不同。累计频数分布图的画法和频数分布折线图画法有所不同。第58页/共95页 在社会经济统计中,折线图主要用于显示时序数在社会经济统计中,折线图主要用于显示时序数据,反映现象的动态变化。据,反映现象的动态变化。中国历年中国历年GDPGDP的折线图的折线图 第59页/共95页也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的饼图适用于任何分组数据,但更多地应用于分类数据和顺序数据。饼图饼图第60页/共95页第61页/共95页环形图中间有一个“空洞”,总体中的每一部分数据是用环中的一段来表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据环形图环形图第62页/共95页8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价第63页/共95页用于显示未分组的原始数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最最大大值值、最最小小值值、中中位位数数M Me e 和两个四四分分位位数数(下四分位数Q QL L和上四分位数Q QU U)连接两个四分位数画出箱子,再将两个极值点与箱子相连接 箱线图箱线图第64页/共95页4 46 68 810101212QQU UUQQL LL简单箱线图简单箱线图中位数中位数X X最小值最小值X X最大值最大值第65页/共95页 对称分布对称分布Q QQL LL中位数中位数中位数 Q QQU UU左偏分布左偏分布Q QQL LL中位数中位数中位数 Q QQU UU右偏分布右偏分布Q QQL LL 中位数中位数中位数 Q QQU UU不同分布的箱线图分布的形状与箱线图分布的形状与箱线图第66页/共95页市市学校1学校2学校3学校4学校5学校6学校7学校8学校9学校10某市某市1010个学校中考成绩的箱线图个学校中考成绩的箱线图第67页/共95页茎叶图茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字适用于小批量数据6.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息第68页/共95页某电脑公司某电脑公司120120天日销售量分布情况天日销售量分布情况第69页/共95页某班学生数学考试成绩分布情况某班学生数学考试成绩分布情况 第70页/共95页q明确制图目的,根据统计数据的性质和特明确制图目的,根据统计数据的性质和特点,突出重点,选择合适的统计图形点,突出重点,选择合适的统计图形 q统计图的设计和绘制要保持严格的科学性统计图的设计和绘制要保持严格的科学性与艺术性,简明扼要,通俗易懂,图形布与艺术性,简明扼要,通俗易懂,图形布局合理局合理 q统计图的坐标与尺度应科学合理统计图的坐标与尺度应科学合理 3.3.绘制统计图应注意的事项绘制统计图应注意的事项第71页/共95页三、三、ExcelExcel在数据整理与显示中的应用在数据整理与显示中的应用 某公司在职员工档案职工编号姓名学历部门年龄工资奖金婚否ZG017申得时申得时大专大专办公室办公室44670687未婚未婚ZG019审中军审中军大学本科大学本科办公室办公室692686928未婚未婚ZG008李本国李本国硕士硕士办公室办公室212972864已婚已婚ZG002李立李立中专中专人力资源部人力资源部562091496未婚未婚ZG016藜职藜职大学本科大学本科人力资源部人力资源部5127141234未婚未婚ZG020刘明明刘明明硕士硕士人力资源部人力资源部443427925未婚未婚ZG011高少保高少保大学本科大学本科人力资源部人力资源部2229411066已婚已婚ZG012历回历回硕士硕士市场部市场部35984398未婚未婚ZG003叶开钱叶开钱大专大专市场部市场部453014309已婚已婚ZG010王海王海大专大专市场部市场部522934700已婚已婚ZG004王立新王立新中专中专信息资源部信息资源部581481814未婚未婚ZG013孙大海孙大海大专大专信息资源部信息资源部691252238未婚未婚ZG006关冰关冰硕士硕士信息资源部信息资源部297301088已婚已婚ZG014高少保高少保博士博士信息资源部信息资源部3114602105已婚已婚ZG001王光培王光培大学本科大学本科运维部运维部322270618未婚未婚ZG007江三江三大专大专运维部运维部633041639未婚未婚ZG009刘成刘成硕士硕士运维部运维部592001419未婚未婚ZG018高明高明大专大专运维部运维部662760627未婚未婚ZG005张包张包大学本科大学本科运维部运维部232831448已婚已婚ZG015赵春梅赵春梅中专中专运维部运维部291677520已婚已婚要求:试利用Excel整理并显示表中的数据。第72页/共95页(一)数据整理前的预处理(一)数据整理前的预处理 1.1.把待整理数据输入把待整理数据输入ExcelExcel数据表中数据表中 第73页/共95页2.2.对数据进行排序对数据进行排序 升序降序第74页/共95页3.3.对数据进行筛选对数据进行筛选 第第1 1步,点击数据清单的任一单元格,选择步,点击数据清单的任一单元格,选择“数数据据”菜单下的菜单下的“筛选筛选”命令。如果要筛选出给命令。如果要筛选出给定条件的数据,可使用定条件的数据,可使用“自动筛选自动筛选”命令命令 第75页/共95页第第2 2步,在下拉菜单方框内选择要筛选出的数步,在下拉菜单方框内选择要筛选出的数据,比如要筛选出学历是硕士的员工,点击据,比如要筛选出学历是硕士的员工,点击“硕士硕士”,得到如下结果,得到如下结果 第76页/共95页 要想得到符合多个条件的员工数据,则要想得到符合多个条件的员工数据,则需要使用需要使用“高级筛选高级筛选”命令。命令。第77页/共95页(二)数据的整理与显示(二)数据的整理与显示 1.1.品质数据的整理与显示品质数据的整理与显示“分类汇总分类汇总”第第1 1步,必须对要进行分类汇总的变量列(部门)步,必须对要进行分类汇总的变量列(部门)数据进行排序。数据进行排序。第第2 2步,选择步,选择“数据数据”菜单中菜单中“分类汇总分类汇总”,打开,打开“分类汇总分类汇总”的对话框,选择的对话框,选择“部门部门”变量为分类变量为分类字段,选择字段,选择“计数计数”为汇总方式,在选定汇总项选为汇总方式,在选定汇总项选择择“姓名姓名”。第第3 3步:单击步:单击“确定确定”按钮,可得如下结果按钮,可得如下结果 第78页/共95页第79页/共95页第第4 4步步:单击分级显示符号单击分级显示符号,和和 可创建汇总报表。这样可以隐藏明细数据而可创建汇总报表。这样可以隐藏明细数据而只显示汇总结果。只显示汇总结果。第80页/共95页将前面的汇总结果稍加修饰就可以得到该公司按部将前面的汇总结果稍加修饰就可以得到该公司按部门分组的频数分布,如下表。门分组的频数分布,如下表。第81页/共95页 按同样的方法可以得到反映该公司员工婚姻状况以按同样的方法可以得到反映该公司员工婚姻状况以及学历的频数分布。及学历的频数分布。第82页/共95页 为了能直观的显示数据,可以将统计表中的数据用统为了能直观的显示数据,可以将统计表中的数据用统计图展示出来计图展示出来第83页/共95页2.2.数值型数据的整理与显示数值型数据的整理与显示“直方图直方图”“直方图直方图”工具用于在给定工作表中数工具用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据单元格区域和接收区间的情况下,计算数据的个数和累积频率。据的个数和累积频率。第第1 1步,用鼠标点击步,用鼠标点击ExcelExcel数据清单中待整理数数据清单中待整理数据(工资)所在列的任意单元格,再单击工具据(工资)所在列的任意单元格,再单击工具栏中的栏中的“升序排序升序排序”第84页/共95页第85页/共95页第第2 2步,观察步,观察“工资工资”数据的分布特征,将工资数据数据的分布特征,将工资数据分为若干组,并将每组的上限数值输入某列单元格,分为若干组,并将每组的上限数值输入某列单元格,本例为本例为J2:J7 J2:J7 第第3 3步,在工具菜单中单击步,在工具菜单中单击“数据分析数据分析”选项,从其选项,从其对话框的分析工具列表中选择对话框的分析工具列表中选择“直方图直方图”,打开直,打开直方图对话框,并填好相关内容方图对话框,并填好相关内容第第4 4步,按步,按“确定确定”按扭,即可得到如下结果按扭,即可得到如下结果第86页/共95页第87页/共95页 直接利用直接利用ExcelExcel得出的统计图表,与传统意义的统计得出的统计图表,与传统意义的统计图表不太一致,需要对图表进行修饰图表不太一致,需要对图表进行修饰,修饰后的图表如下修饰后的图表如下 表3.18 该公司在职员工工资频数分布表工资(元)工资(元)频数(人)频数(人)累积频率累积频率670-1170315.00%1170-1670330.00%1670-2170345.00%2170-2670150.00%2670-3170995.00%3170-36701100.00%合合 计计20-第88页/共95页3.3.数据透视表数据透视表 不仅可以用来作单变量数据的次数分布或总和不仅可以用来作单变量数据的次数分布或总和分析,还可以用来作多变量数据的交叉频数分析、分析,还可以用来作多变量数据的交叉频数分析、总和分析和其它统计量的分析。总和分析和其它统计量的分析。利用数据透视表时,数据源表中的首行必须利用数据透视表时,数据源表中的首行必须有列标题。有列标题。注意注意第89页/共95页第第1 1步,在数据清单中,选定任一单元格,然后选择步,在数据清单中,选定任一单元格,然后选择“数据数据”菜单的菜单的“数据透视表和数据透视图数据透视表和数据透视图”子菜单,进子菜单,进入创建数据透视表的对话框,然后根据需要选择入创建数据透视表的对话框,然后根据需要选择“数据数据源类型源类型”和和“报表类型报表类型”,并单击下一步,并单击下一步,弹出对话框弹出对话框 第第2 2步,在对话框中确定数据源区域,本例为步,在对话框中确定数据源区域,本例为A2A2:H22H22,并单击下一步,弹出对话框,并单击下一步,弹出对话框 第第3 3步,在对话框中选择数据透视表显示位置,为方便起步,在对话框中选择数据透视表显示位置,为方便起见,可选择见,可选择“现有工作表现有工作表”,本例为,本例为M2M2,然后点击,然后点击“布布局局”,弹出对话框,弹出对话框第90页/共95页第91页/共95页第第5 5步,单击步,单击“确定确定”,自动返回,自动返回“数据透视表和数据数据透视表和数据透视图向导透视图向导”对话框,然后单击对话框,然后单击“完成完成”,可得如下结,可得如下结果。果。本表反映的是该公司发放的奖金在不同学历而且婚姻本表反映的是该公司发放的奖金在不同学历而且婚姻状况不同、所在部门不同的员工中的分配情况。状况不同、所在部门不同的员工中的分配情况。第92页/共95页 要想得到频数分布表,需要双击上图中左上角的要想得到频数分布表,需要双击上图中左上角的“求和项:奖金求和项:奖金”,将其改为计数项,单击,将其改为计数项,单击“确定确定”,即可得到根据,即可得到根据“学历学历”、“婚否婚否”、“部门部门”建立建立的交叉频数分布表。的交叉频数分布表。第93页/共95页本章小结本章小结统计整理的概念与一般程序数据预处理的内容统计分组的概念、作用、原则与分类数据汇总的组织形式、方法与方式频数分布的概念、构成、分类与类型统计表与统计图的构成、种类及绘制事项如何用Excel制作频数分布表和图形第94页/共95页2023/3/17第一章 绪论95感谢您的观看!第95页/共95页