数据的整理和显示统计学课件.ppt
《数据的整理和显示统计学课件.ppt》由会员分享,可在线阅读,更多相关《数据的整理和显示统计学课件.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3-1统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院第第 3 章章 数据的图表展示数据的图表展示作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学3-2统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院第第 3 章章 数据的图表展示数据的图表展示3.1 数据的预处理数据的预处理 3.2 品质数据的整理与显示品质数据的整理与显示3.3 数值型数据的整理与显示数值型数据的整理与显示3.4 合理使用图表合理使用图表3-3统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院学习目标学习
2、目标1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.掌握分类和顺序数据的整理与显示方法掌握分类和顺序数据的整理与显示方法3.掌握数值型数据的整理与显示方法掌握数值型数据的整理与显示方法4.用用Excel作作频数分布表和图形频数分布表和图形5.合理使用图表合理使用图表3-4统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院3.1 数据的预处理数据的预处理3.1.1 数据审核数据审核3.1.2 数据筛选数据筛选3.1.3 数据排序数据排序3.1.4 数据透视表数据透视表3-5统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学
3、院数据的预处理数据的预处理1.数据审核数据审核 检查数据中的错误检查数据中的错误2.数据筛选数据筛选 找出符合条件的数据找出符合条件的数据3.数据排序数据排序 升序和降序升序和降序 寻找数据的基本特征寻找数据的基本特征4.数据透视数据透视n n按需要汇总按需要汇总3-6统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据审核数据审核3-7统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据审核数据审核原始数据原始数据(raw data)1.完整性审核n n应调查的单位或个体是否有遗漏应调查的单位或个体是否有遗漏n n所有的调查
4、项目或变量是否填写齐全所有的调查项目或变量是否填写齐全2.准确性审核n n数数据据是是否否真真实实反反映映实实际际情情况况,内内容容是是否否符符合合实际实际n n数据是否有错误,计算是否正确等数据是否有错误,计算是否正确等3-8统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据的审核数据的审核二手数据二手数据(second hand data)1.适用性审核n n弄弄清清楚楚数数据据的的来来源源、数数据据的的口口径径以以及及有有关关的的背景材料背景材料n n确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要2.时效性审核n n尽可能使用最新
5、的数据尽可能使用最新的数据3.确认是否有必要做进一步的加工整理3-9统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据筛选与排序数据筛选与排序3-10统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据筛选数据筛选(data filter)1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2.数据筛选的内容将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误误的的数数据予以剔除据予以剔除将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定
6、条件的数据予以剔除符合特定条件的数据予以剔除3-11统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院用用Excel进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据筛选数据筛选(data filter)3-12统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据排序数据排序 (data rank)1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的
7、目的之一4.排序可借助于计算机完成3-13统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据排序数据排序(方法方法)1.分类数据的排序字字母母型型数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯惯上上用升序用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼拼音音字字母母排排列列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的的升升序序降降序之分序之分2.数值型数据的排序n n递递增增排排序序:设设一一组组数数据据为为x x1 1,x x2 2,x xn n,递递增增排序后可表示为:排序后可表示为:x x(1)(1)x x(
8、2)2)x x(2)(2)x x(n n)3-14统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据透视表数据透视表3-15统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据透视表数据透视表(pivot table)1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题3-16统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据透视表数据透视表(用用Exc
9、el创建数据透视表创建数据透视表)第第第第1 1步:步:步:步:在在ExcelExcel工作表中建立数据清单工作表中建立数据清单第第第第2 2步:步:步:步:选中数据清单中的任意单元格,并选择选中数据清单中的任意单元格,并选择【数据数据】菜单菜单 中的中的【数据透视表和数据透视图数据透视表和数据透视图】第第第第3 3步:步:步:步:确定数据源区域确定数据源区域第第第第4 4步:步:步:步:在在【向导向导33步骤之步骤之3 3】中选择数据透视表的输出位置中选择数据透视表的输出位置 。然后选择。然后选择【布局布局】第第第第5 5步步步步:在在【向向导导布布局局】对对话话框框中中,依依次次将将”分分
10、类类变变量量“拖拖至至 左左边边的的“行行”区区域域,上上边边的的“列列”区区域域,将将需需要要汇汇总总的的“变变 量量”拖至拖至“数据区域数据区域”第第第第6 6步:步:步:步:然后单击然后单击【确定确定】,自动返回【向导,自动返回【向导33步骤之步骤之3 3】对】对 话框。然后单击话框。然后单击【完成】完成】,即可输出数据透视表,即可输出数据透视表 3-17统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院3.2 品质数据的整理与展示品质数据的整理与展示3.2.1 分类数据的整理与图示分类数据的整理与图示3.2.2 顺序数据的整理与图示顺序数据的整理与图示3
11、-18统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据的整理与显示数据的整理与显示(基本问题基本问题)1.要弄清所面对的数据类型n n不同类型的数据,采取不同的处理方式和方法不同类型的数据,采取不同的处理方式和方法2.对分类数据和顺序数据主要是作分类整理3.对数值型数据则主要是作分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据3-19统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的整理与图示分类数据的整理与图示3-20统计学统计学STATI
12、STICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的整理分类数据的整理(基本过程基本过程)1.列出各类别 2.2.计算各类别的频数3.制作频数分布表4.用图形显示数据分类分类分类分类频数频数频数频数比例比例比例比例百分比百分比百分比百分比比率比率比率比率A AB BC CD DE E3-21统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的整理分类数据的整理(可计算的统计量可计算的统计量)1.频数频数(frequency):落在各类别中的数据个数2.比例比例(proportion):某一类别数据个数占全部数据个数的比值3.百分比百分比
13、(percentage):将对比的基数作为100而计算的比值4.比率比率(ratio):不同类别数值个数的比值3-22统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据整理分类数据整理频数分布表频数分布表(例题分析例题分析)【例例例例】一一家家市市场场调调查查公公司司为为研研究究不不同同品品牌牌饮饮料料的的市市场场占占有有率率,对对随随机机抽抽取取的的一一家家超超市市进进行行了了调调查查。调调查查员员在在某某天天对对5050名名顾顾客客购购买买饮饮料料的的品品牌牌进进行行了了记记录录,如如果果一一个个顾顾客客购购买买某某一一品品牌牌的的饮饮料料,就就将将
14、这这一一饮饮料料的的品品牌牌名名字字记记录录一一次次 。右右边边就就是是记记录录的的原原始始数数据据用用Excel制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品3-23统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的图示分类数据的图示条形图条形图(bar Chart)1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布4.绘制时,各类别可以放在纵轴,称为条条形形图图,也可以放在横轴,称为柱柱形形图图(column chart)3-24统计学统计学STA
15、TISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的图示分类数据的图示条形图条形图(例题分析例题分析)3-25统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的图示分类数据的图示对比条形图对比条形图(side-by-side bar chart)1.分类变量在不同时间或不同空间上有多个取值2.对比分类变量的取值在不同时间或不同空间上的差异或变化趋势电脑品牌电脑品牌电脑品牌电脑品牌一季度一季度一季度一季度二季度二季度二季度二季度联想联想联想联想256256468468IBMIBM285285397397康柏康柏康柏康柏2472473
16、28328戴尔戴尔戴尔戴尔5635636886883-26统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的图示分类数据的图示对比条形图对比条形图 (例题分析例题分析)3-27统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的图示分类数据的图示帕累托图帕累托图(pareto chart)1.按按各各类类别别数数据据出出现现的的频频数数多多少少排排序序后后绘绘制制的的柱柱形图形图 2.主主要要用用于于展展示示分分类类数数据据的的分分布布3-28统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民
17、大学统计学院分类数据的图示分类数据的图示饼图饼图(pie Chart)1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题3.绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定3-29统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院分类数据的图示分类数据的图示饼图饼图 (例题分析例题分析)3-30统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院顺序数据的整理与图示顺序数据的整理与
18、图示3-31统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量)1.累累积积频频数数(cumulative frequencies):各类别频数的逐级累加2.累累积积频频率率(cumulative percentages):各类别频率(百分比)的逐级累加 3-32统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)【例例例例】在在一一项项城城市市住住房房问问题题的的研研究究中中,研研究究人人员员在在甲甲乙乙两两个个城
19、城市市各各抽抽样样调调查查300300户户,其其中中的的一一个个问问题题是是:“您您对对您您家家庭庭目目前前的的住住房房状状况是否满意?况是否满意?”1 1 非非 常常 不不满满意意;2 2不不满满意意;3 3一一般般;4 4满满意;意;5 5非常满意。非常满意。甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数
20、户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意 24 24108108 93 93 45 45 30 30 8 83636313115151010 24 24132132225225270270300300 8.0 8.0 44.0 44.0 75.0 75.0 90.0 90.0100.0100.0300300276276168168 75 75 30 30100.0100.0929256
21、5625251010合计合计合计合计300300100.0100.03-33统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院顺序数据的频数分布表顺序数据的频数分布表 (例题分析例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别乙城市乙城市乙城市乙城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%
22、)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意21219999787864643838 7.0 7.033.033.026.026.021.321.312.712.7 21 21120120198198262262300300 7.0 7.0 40.0 40.0 66.0 66.0 87.3 87.3100.0100.0300300279279180180102102 38 38100.0100.0 93.0 93.0 60.0 60
23、.0 34.0 34.0 12.7 12.7合计合计合计合计300300100.0100.03-34统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院顺序数据的图示顺序数据的图示累计频数分布图累计频数分布图(例题分析例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城
24、市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布3-35统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院环形图环形图(doughnut chart)1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别n n饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例n n环环形形图图则则可可以以同同时时绘绘制制多多个个样样本本或或总总体体的的数数据据系列,每一个样本或总体的数据系列为一个环系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究 4.用于展示分类和顺序数据3-
25、36统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院环形图环形图(例题分析例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价3-37统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院3.3 数值型数据的整理与展示数值型数据的整理与展示3.3.1 数据分组数据分组3.3.2 数值型数据的图示数值型数据的图示3-38统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院数据分组数据分组3-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 整理 显示 统计学 课件
限制150内