教学课件商务数据可视化 第1章ppt(全).pptx
《教学课件商务数据可视化 第1章ppt(全).pptx》由会员分享,可在线阅读,更多相关《教学课件商务数据可视化 第1章ppt(全).pptx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教学课件商务数据可视化 第1章第1章 绪论商务数据可视化思维导图Mind Mapping数据的采集和清洗1.11.1 数据的采集和清洗 第1章 绪论在开始分析数据,进行数据可视化之前,需要完成两个关键的任务:数据的采集和数据的清洗。接下来的两小节将会对这两个关键任务进行详细地解释与阐述。数据的采集又称为数据的收集,就是指通过各种工具和方法,获取需要数据的过程,为以后数据的分析和数据可视化提供直接的依据和素材。第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 数据采集的来源有很多种方式,比如内部数据可以通过公司自有的数据库进行获取。外部数据在如今更易收集,比如可以通过公开的出版物或者
2、搜索引擎快速找到需要的数据,一些专业的数据可以从国家或地方统计局的网站,行业组织的官方网站或行业信息网站获得。本节将会对数据的采集进行详细地解释与阐述,以采集国家统计局数据为案例讲解数据采集。第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 步骤一:从web导入数据打开Excel2016,新建一个工作簿,在菜单中找到数据这一栏,点击自网站,从Web获取数据,见图1-1图 1-1 从Web导入数据第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 步骤二:新建web查询点击以后,会弹出一个新建Web查询窗口,在地址这一栏输入想要跳转的网址,在这里选取了国家统计局中第四次全国
3、经济普查公报中的数据,按地区分组的单位情况,见图1-2,网址如下:http:/ 1-2 新建web查询第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 步骤三:导入报表输入网址跳转以后,网站会显示出黄色箭头,单击选中报表,然后单击导入,见图1-3。图 1-3 导入报表第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 步骤四:选择导入的位置点击导入以后,会弹出一个窗口指导你导入数据,可以在窗口改变你想要导入数据的位置,见图1-4。图 1-4 选择导入的位置第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 步骤五:刷新数据一般网上的数据都是实时更新的,因此我们需
4、要通过数据刷新来获取最新的数据,一般有两种方法,点击数据中的全部刷新,见图1-5,或者选中任意数据单元格,右击鼠标设置“数据范围属性”,见图1-6。图 1-5 刷新数据图 1-6 数据范围属性第1章 绪论1.1 数据的采集和清洗 1.1.1 数据的采集 步骤六:实时更新数据点击数据范围属性后,将刷新控件中的前三项勾选,在点击右下角的确定,这样数据就会实时更新了,见图1-7。图 1-7 实时更新数据第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗 当我们完成了数据的采集,可以看出网上的数据实际上是纷繁复杂的,因此数据不是导入就可以使用的,还需要我们通过数据清洗来选出我们所需要的数据,
5、这样做出来的数据可视化才有它存在的意义。数据清洗一般有三种方法:数据工具法、高亮排序法和函数法。图 1-8 成功导入的数据第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:工具数据法 步骤一:选中想要数据清洗的完整数据表,完整数据表见图1-9。找到菜单中的数据一栏,找到数据工具中的删除重复项,见图1-10。图 1-10 点击数据工具中的删除重复项 图 1-9 完整数据表第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:工具数据法 步骤二:点击删除重复项以后,会跳出一个窗口,在窗口里可以选择需要删除重复项的列,勾选“数据包含标题”选项,可以显示数据列的标题,见图1-11。
6、点击确定会跳出一个提示框,表示删除重复项成功,见图1-12,删除之后的效果图见图1-13。图 1-11 选择并删除重复项 图 1-12成功删除重复项 图 1-13 删除之后的效果图第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:高亮排序法 步骤一:选中想要删除重复项的值,选择开始菜单里的条件格式选项,找到其中的重复项并点击,见图1-14,点击以后可以看到跳出一个设置格式的窗口,并且有重复项的数据格已经标红,高亮显示,见图1-15。图 1-14 选中想删除重复项的列图 1-15 设置单元格格式第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:高亮排序法 步骤二:全选数据
7、表,在菜单中找到数据一栏,点击排序和筛选里的排序按钮,见图1-16。图 1-16 对数据表排序第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:高亮排序法 步骤三:因为刚才我们选择的是A列,所以我们要在弹出的排序窗口里添加列的主要关键字A列、排序依据为单元格颜色,次序选择刚才选择的颜色,把它们排在顶端,方便我们删除重复项,见图1-17。完成以后结果如图所示,见图1-18,随后可以根据自己的需要删除或修改。图 1-17 选择关键字和排序依据 图 1-18 排序结果展示第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:函数法 步骤一:新增一列用来放置COUNTIF()函数所
8、计算出来的值,通过COUNTIF()函数能知道关键字的个数,当它的关键字个数大于1的时候,说明这一项有重复项,见图1-19。图 1-19 新增一列放置函数值第1章 绪论1.1 数据的采集和清洗 1.1.2 数据的清洗:函数法 步骤二:光标停留在B4内,输入“=COUNTIF(A:A,A4)”,按下回车,会计算出函数值,这个式子表示从A列到A列,计算有A4这个数据格里的值的单元格的个数。我们可以看到A4单元格中的值是“广西”,计算出来的函数值表示A列中单元格中的值为“广西”的单元格的个数共有几个,从而查找出重复项,见图1-20。图 1-20 计算函数值第1章 绪论1.1 数据的采集和清洗 1.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件商务数据可视化 第1章ppt全 教学 课件 商务 数据 可视化 ppt
限制150内