《数据的图表》PPT课件.ppt
《《数据的图表》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据的图表》PPT课件.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 3 章章 数据的图表展示数据的图表展示统计学第第 3 章章 数据的图表展示数据的图表展示3.1 数据的预处理数据的预处理 3.2 品质数据的整理与显示品质数据的整理与显示3.3 数值型数据的整理与显示数值型数据的整理与显示3.4 合理使用图表合理使用图表学习目标学习目标1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.掌握分类和顺序数据的整理与显示方法掌握分类和顺序数据的整理与显示方法3.掌握数值型数据的整理与显示方法掌握数值型数据的整理与显示方法4.用用Excel作作频数分布表和图形频数分布表和图形5.合理使用图表合理使用图表3.1 数据的预处理数据的预处理3.1.1 数据审
2、核数据审核3.1.2 数据筛选数据筛选3.1.3 数据排序数据排序3.1.4 数据透视表数据透视表数据的预处理数据的预处理1.数据审核数据审核检查数据中的错误检查数据中的错误2.数据筛选数据筛选找出符合条件的数据找出符合条件的数据3.数据排序数据排序升序和降序升序和降序寻找数据的基本特征寻找数据的基本特征4.数据透视数据透视按需要汇总按需要汇总数据审核数据审核数据审核数据审核原始数据原始数据(raw data)1.完整性审核完整性审核应调查的单位或个体是否有遗漏应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全所有的调查项目或变量是否填写齐全2.准确性审核准确性审核数数据据是是否否真
3、真实实反反映映实实际际情情况况,内内容容是是否否符符合合实际实际数据是否有错误,计算是否正确等数据是否有错误,计算是否正确等数据的审核数据的审核二手数据二手数据(second hand data)1.适用性审核适用性审核弄弄清清楚楚数数据据的的来来源源、数数据据的的口口径径以以及及有有关关的的背景材料背景材料确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要2.时效性审核时效性审核尽可能使用最新的数据尽可能使用最新的数据3.确认是否有必要做进一步的加工整理确认是否有必要做进一步的加工整理数据筛选与排序数据筛选与排序数据筛选数据筛选(data filter)1.当当数数据据中中
4、的的错错误误不不能能予予以以纠纠正正,或或者者有有些些数数据据不不符符合合调调查查的的要要求求而而又又无无法法弥弥补补时时,需要对数据进行筛选需要对数据进行筛选2.数据筛选的内容数据筛选的内容将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误误的的数数据予以剔除据予以剔除将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定条件的数据予以剔除符合特定条件的数据予以剔除用用Excel进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据筛选数据筛选(data filter)数据排序数据排序
5、(data rank)1.按按一一定定顺顺序序将将数数据据排排列列,以以发发现现一一些些明明显的特征或趋势,找到解决问题的线索显的特征或趋势,找到解决问题的线索2.排排序序有有助助于于对对数数据据检检查查纠纠错错,以以及及为为重重新归类或分组等提供依据新归类或分组等提供依据3.在在某某些些场场合合,排排序序本本身身就就是是分分析析的的目目的的之一之一4.排序可借助于计算机完成排序可借助于计算机完成数据排序数据排序(方法方法)1.分类数据的排序分类数据的排序字字母母型型数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯惯上上用升序用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼
6、拼音音字字母母排排列列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的的升升序序降降序之分序之分2.数值型数据的排序数值型数据的排序递递增增排排序序:设设一一组组数数据据为为x1,x2,xn,递递增增排序后可表示为:排序后可表示为:x(1)x(2)x(2)x(n)数据透视表数据透视表数据透视表数据透视表(pivot table)1.可以从复杂的数据中提取有用的信息可以从复杂的数据中提取有用的信息2.可可以以对对数数据据表表的的重重要要信信息息按按使使用用者者的的习习惯惯或分析要求进行汇总和作图或分析要求进行汇总和作图3.形成一个符合需要的交叉表形成一个符合需要的交叉表(列联表
7、列联表)4.在在利利用用数数据据透透视视表表时时,数数据据源源表表中中的的首首行行必须有列标题必须有列标题数据透视表数据透视表(用用Excel创建数据透视表创建数据透视表)第第1步:步:在在Excel工作表中建立数据清单工作表中建立数据清单第第2步步:选选中中数数据据清清单单中中的的任任意意单单元元格格,并并选选择择【数数据据】菜单中的【菜单中的【数据透视表和数据透视图数据透视表和数据透视图】第第3步:步:确定数据源区域确定数据源区域第第4步步:在在【向向导导3步步骤骤之之3】中中选选择择数数据据透透视视表表的的输输出出位置位置。然后选择【。然后选择【布局布局】第第5步步:在在【向向导导布布局
8、局】对对话话框框中中,依依次次将将”分分类类变变量量“拖拖至至 左左边边的的“行行”区区域域,上上边边的的“列列”区区域域,将将需需要要汇总的汇总的“变量变量”拖至拖至“数据区域数据区域”第第6步步:然然后后单单击击【确确定定】,自自动动返返回回【向向导导3步步骤骤之之3】对话框。然后单击【】对话框。然后单击【完成完成】,即可输出数据透视表】,即可输出数据透视表 3.2 品质数据的整理与展示品质数据的整理与展示3.2.1 分类数据的整理与图示分类数据的整理与图示3.2.2 顺序数据的整理与图示顺序数据的整理与图示数据的整理与显示数据的整理与显示(基本问题基本问题)1.要弄清所面对的数据类型要弄
9、清所面对的数据类型不同类型的数据,采取不同的处理方式和方法不同类型的数据,采取不同的处理方式和方法2.对对分类数据和顺序数据分类数据和顺序数据主要是作主要是作分类整理分类整理3.对对数值型数据数值型数据则主要是作则主要是作分组整理分组整理4.适适合合于于低低层层次次数数据据的的整整理理和和显显示示方方法法也也适适合合于于高高层层次次的的数数据据;但但适适合合于于高高层层次次数数据据的的整整理和显示方法并不适合于低层次的数据理和显示方法并不适合于低层次的数据分类数据的整理与图示分类数据的整理与图示分类数据的整理分类数据的整理(基本过程基本过程)1.列出各类别列出各类别 2.2.计算各类别的频数计
10、算各类别的频数3.制作频数分布表制作频数分布表4.用图形显示数据用图形显示数据分类分类频数频数比例比例百分比百分比比率比率ABCDE分类数据的整理分类数据的整理(可计算的统计量可计算的统计量)1.频数频数(frequency):落在各类别中的数据个数落在各类别中的数据个数2.比例比例(proportion):某一类别数据个数占全某一类别数据个数占全部数据个数的比值部数据个数的比值3.百分比百分比(percentage):将对比的基数作为将对比的基数作为100而计算的比值而计算的比值4.比率比率(ratio):不同类别数值个数的比值不同类别数值个数的比值分类数据整理分类数据整理频数分布表频数分布
11、表(例题分析例题分析)【例例例例】一一一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某
12、一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边边边就就就就是是是是记记记记录录录录的的的的原原原原始始始始数数数数据据据据用用Excel制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品分类数据的图示分类数据的图示条形图条形图(bar Chart)1.用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来来表表示示各各类别数据的图形类别数据的图形2.有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式3.主要用于反映分
13、类数据的频数分布主要用于反映分类数据的频数分布4.绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图图,也也 可可 以以 放放 在在 横横 轴轴,称称 为为 柱柱 形形 图图(column chart)分类数据的图示分类数据的图示条形图条形图(例题分析例题分析)分类数据的图示分类数据的图示对比条形图对比条形图(side-by-side bar chart)1.分分类类变变量量在在不不同同时时间间或或不不同同空空间间上上有有多多个个取值取值2.对对比比分分类类变变量量的的取取值值在在不不同同时时间间或或不不同同空空间间上上的的差差异异或或变化趋势变化趋势电脑品牌电脑品牌一季度
14、一季度二季度二季度联想联想256468IBM285397康柏康柏247328戴尔戴尔563688分类数据的图示分类数据的图示对比条形图对比条形图(例题分析例题分析)分类数据的图示分类数据的图示帕累托图帕累托图(pareto chart)1.按按各各类类别别数数据据出出现现的的频频数数多多少少排排序序后后绘绘制制的的柱柱形图形图 2.主主要要用用于于展展示示分分类类数数据据的的分分布布分类数据的图示分类数据的图示饼图饼图(pie Chart)1.也也称称圆圆形形图图,是是用用圆圆形形及及圆圆内内扇扇形形的的角角度度来来表示数值大小的图形表示数值大小的图形2.主主要要用用于于表表示示样样本本或或总
15、总体体中中各各组组成成部部分分所所占占的比例,用于研究结构性问题的比例,用于研究结构性问题3.绘绘制制圆圆形形图图时时,样样本本或或总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形角角度度表表示示,这这些些扇扇形形的的中中心心角角度度,按按各各部部分分数数据据百百分分比比乘乘以以3600确定确定分类数据的图示分类数据的图示饼图饼图(例题分析例题分析)顺序数据的整理与图示顺序数据的整理与图示顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量)1.累积频数累积频数(cumulative frequencies):各类别频数的逐级累加各类别频数的逐级累加2.累
16、积频率累积频率(cumulative percentages):各类别频率各类别频率(百分比百分比)的逐级累加的逐级累加 顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)【例例例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状
17、状状状况是否满意?况是否满意?况是否满意?况是否满意?”1 1 非非非非 常常常常 不不不不满满满满意意意意;2 2不不不不满满满满意意意意;3 3一一一一般般般般;4 4满满满满意;意;意;意;5 5非常满意。非常满意。非常满意。非常满意。甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510
18、24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计合计300100.0顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2199786438 7.033.026.021.312.7 21120198
19、262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计合计300100.0顺序数据的图示顺序数据的图示累计频数分布图累计频数分布图(例题分析例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评
20、价的累积频数分布甲城市家庭对住房状况评价的累积频数分布环形图环形图(doughnut chart)1.环环形形图图中中间间有有一一个个“空空洞洞”,样样本本或或总总体体中中的每一部分数据用环中的一段表示的每一部分数据用环中的一段表示2.与饼图类似,但又有区别与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例环环形形图图则则可可以以同同时时绘绘制制多多个个样样本本或或总总体体的的数数据据系列,每一个样本或总体的数据系列为一个环系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究用于结构比较研究 4.用于展示分类和顺序数据用于展示分类和顺序数据环
21、形图环形图(例题分析例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价3.3 数值型数据的整理与展示数值型数据的整理与展示3.3.1 数据分组数据分组3.3.2 数值型数据的图示数值型数据的图示数据分组数据分组组距分组组距分组(要点要点)1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.适合于连续变量适合于连续变量3.适合于变量值较多的情况适合于变量值较多的情况4.需要遵循需要遵循“不重不漏不重不漏”的原则的原则5.可可采采用用等等距距分分组组,也也可可采采用用不不等
22、距分组等距分组 组距分组组距分组(步骤步骤)1.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。在在实实际际分分组时,组数一般为组时,组数一般为5 K 152.确确定定组组距距:组组距距(Class Width)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值和最小值及所分的组数来确定,即值和最小值及所分的组数来确定,即3.组距组距(最大值最大值-最小值最小值)组数组数3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表 组距分组(几个概念)1.下限下限(lowe
23、r limit):一个组的最小值2.上限上限(upper limit):一个组的最大值3.组距组距(class width):上限与下限之差4.组中值组中值(class midpoint):下限与上限之间的中点值下限值下限值+上限值上限值2组中值组中值=频数分布表的编制频数分布表的编制(例题分析例题分析)【例例例例】某某某某 电电电电脑脑脑脑 公公公公 司司司司 20052005年年年年 前前前前 四四四四 个个个个 月月月月各各各各 天天天天 的的的的 销销销销 售售售售量量量量数数数数据据据据(单单单单位位位位:台台台台)。试试试试对对对对数数数数据进行分组据进行分组据进行分组据进行分组等
24、距分组表等距分组表(上下组限重叠上下组限重叠)等距分组表等距分组表(上下组限间断上下组限间断)等距分组表等距分组表(使用开口组使用开口组)数值型数据的图示数值型数据的图示Excel分组数据分组数据直方图和折线图直方图和折线图分组数据分组数据直方图直方图(histogram)1.用于展示分组数据分布的一种图形用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布用矩形的宽度和高度来表示频数分布本质上是用矩形的本质上是用矩形的面积面积来表示频数分布来表示频数分布3.在在直直角角坐坐标标中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据的图表 数据 图表 PPT 课件
限制150内