财务大数据分析项目三 任务1 教学课件.pptx
《财务大数据分析项目三 任务1 教学课件.pptx》由会员分享,可在线阅读,更多相关《财务大数据分析项目三 任务1 教学课件.pptx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、财务大数据分析任课老师:目录项目一 大数据基础项目二数据获取项目三 数据预处理项目四 大数据+财报数据分析项目五 大数据+资金分析项目六大数据+销售分析项目七大数据+费用分析 任务1 数据清洗 任务2 数据集成项目三数据预处理任务1 Python简介及安装【知识精讲】一、数据预处理概念及预处理流程方法(一)数据预处理的基本概念数据预处理(Data Preprocessing)是指在主要的处理以前对数据进行的一些处理。数据预处理包含数据清洗、数据集成、数据转换、数据归约等方法。这些数据处理技术在数据挖掘和数据分析之前使用,大大提高了数据挖掘模型的质量,减少了实际挖掘和分析所需要的时间。从数据准备
2、到数据分析会经过一系列的过程,如图3-1所示。图3-1 数据准备至数据分析过程图 (二)常见的数据预处理工具(1)专业图形化工具:比如Pentaho Data Integration-Kettle,IBM DataStage,Informatica等。Pentaho Data Integration-Kettle:PDI(Pentaho Data Integration,或者Kettle)是一款开源的ETL工具,可以用它来对数据进行抽取、清洗和转换操作,从而获得我们想要的数据。IBM DataStage:一种数据集成软件平台,能够帮助企业从散布在各个系统中的复杂异构信息中获得更多价值。Info
3、Sphere Information Server提供了一个统一的平台。Informatica:Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据管理 、数据质量、数据治理、主数据管理、数据安全和云数据集成等。(2)专业非图形化工具:Python、SQL、R。(3)简单图形化工具:Tableau Prep、Alteryx、Right Data、OpenRefine(前身为Google refine)、Data Wrangler、Trifacta Wrangler。Trifacta Wrangler和Excel、OpenRefine不同,是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 财务大数据分析项目三 任务1 教学课件 财务 数据 分析 项目 任务 教学 课件
限制150内