第3章 数据处理基础教学课件.pptx





《第3章 数据处理基础教学课件.pptx》由会员分享,可在线阅读,更多相关《第3章 数据处理基础教学课件.pptx(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第3章 数据处理基础教学课件第3章 数据处理基础2章节内容第3章 数据处理基础3.1 数据的清理3.1.1 文本编码的处理3.1.2 异常数据值的处理3.1.3 行列数据的简单处理3.2 基本数据类型数据的处理3.2.1 文本数据的处理3.2.2 数值数据的处理3.2.3 日期时间数据处理3.3 高级类型数据的处理3第3章 数据处理基础在将数据导入到Power BI Desktop中之后,为了将导入的数据整理成为适合于存储和分析的状态,需要对数据进行进一步的处理。在“主页”中使用“转换数据”按钮将当前的数据表使用Power Query查询编辑器打开进一步处理,从导入数据到进行数据处理的每一个操
2、作步骤都会被查询编辑器记录下来,以后当数据源发生变化之后,则可以通过“转换数据”按钮右边的“刷新”按钮重新读取数据源,并自动执行保存下来的处理步骤。4第3章 数据处理基础Power Query查询编辑器的主要界面由“主页”、“转换”、“添加列”、“视图”、“工具”以及“帮助”等几个功能选项卡构成;当完成数据处理工作后,可以使用“关闭并应用”按钮,将对导入数据表的具体处理步骤记录并应用,并将最终的处理结果数据表保存到当前pbix文件中。53.1.1 数据的清理文本编码的处理在获取数据时,如果没有设置正确的文本编码,常常会导致乱码问题,通过识别和设置正确的文本编码可以解决乱码。63.1.2 数据的
3、清理异常数据值的处理导入的数据表中可能会因为各种原因有一些缺失值或错误的值,为了数据建模分析的需要,要使用有意义的值替换这些异常的数据值,或者简单的过滤掉这些异常的数据值。例:导入并处理有关学生信息的EXCEL数据表格数据(studentdata.xlsx),可以看到该表格中有缺失的成绩,可能是学生没有参加该门课程的考试造成的,此外,表格中还是用了单元格合并等格式,因此,当导入该表格数据后,使用Power BI编辑该查询,可以看到格式和缺失数据造成了很多缺失值。73.1.2 数据的清理异常数据值的处理(1)删除异常的数据值对于因为EXCEL表格格式造成的全是空值的行,直接采用删除的方法去除掉。
4、可以通过主页中“删除行”按钮下拉菜单中的“删除空行”完成删除操作,也可以通过在表格中任何一列右上角的三角箭头下拉菜单中选择“删除空”菜单项实现删除操作。83.1.2 数据的清理异常数据值的处理(2)将异常的数据值替换为特定值将缺失的学生成绩替换为0是比较合理的,也可以方便后续的数据分析。在表中任何位置单击,然后按CTRL+A选中整个表格,在主页中选择“替换值”按钮,在替换之对话框中设置将空值替换为0。93.1.3 数据的清理行列数据的简单处理1.将首行数据提升为标题Power BI Desktop在导入数据时会尝试区分并识别可能的列名,在有些列名存在但是无法区分列名和数据的情况下,列名会被识别
5、为数据的第一行,此时生成的数据表的列名由默认的column1、column2。等形式命名;可以在Power Query编辑器中使用“将第一行用作标题”按钮来把数据表的第一行提升为列名。103.1.3 数据的清理行列数据的简单处理2.修改数据列的数据类型在导入数据时,Power BI Desktop会尝试识别每一列数据的数据类型,如果自动识别的数据类型不满足要求,则可以通过鼠标右键单击每一列列名左边的数据类型图标,调出数据类型设置菜单并手工设置来进行修改。113.1.3 数据的清理行列数据的简单处理3.删除行从数据源导入的数据中,会因为各种情况导致有一些数据行是不符合需要的,这时可以使用“删除行
6、”功能对指定的数据行进行删除操作。Power Query中通过“删除行”功能按钮的下拉菜单提供了不同的对数据行进行删除的选择,包括“删除最前面几行”、“删除最后几行”、“删除间隔行”、“删除重复项”以及“删除空行”等。123.1.3 数据的清理行列数据的简单处理导入的数据表中,可能有一些属性列是重复多余的,或者是后续分析不需要的,此时可以通过“删除列”或者“删除其他列”功能实现对不需要的属性列的删除。133.1.3 数据的清理行列数据的简单处理5.添加列出于后续数据分析的需要,有可能需要根据当前数据表中的某一列或者某些列生成新的属性列,例如生成索引列、提取日期中的年、月、日等分量生成新的属性列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 数据处理基础教学课件 数据处理 基础 教学 课件

限制150内