财务大数据分析项目一 任务2 教学课件.pptx
《财务大数据分析项目一 任务2 教学课件.pptx》由会员分享,可在线阅读,更多相关《财务大数据分析项目一 任务2 教学课件.pptx(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、财务大数据分析任课老师:目录项目一 大数据基础项目二数据获取项目三 数据预处理项目四 大数据+财报数据分析项目五 大数据+资金分析项目六大数据+销售分析项目七大数据+费用分析任务1 大数据基础认知任务2 数据库基础认知项目一大数据基础什么是大数据https:/ 大数据基础知识01一、数据库、数据库系统及数据库管理系统的基本概念 数据库(DataBase,简称DB):就是数据的仓库,是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可被各种用户共享。数据库系统(DataBase System,简称D
2、BS):是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。解析数据库系统和数据库是两个概念。数据库系统是一个人一机系统,数据库是数据库系统的一个组成部分。但是在日常工作中人们常常把数据库系统简称为数据库。数据库管理系统(DataBase Management System,简称DBMS):是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。数据库管理系统是用来对数据进行存储、管理等操作的软件。数据库管理系统的主要功能包括数据定义、数据操纵、数据库的运行管理、数据库的建立和维护。(一)大数据的起
3、源(一)大数据的起源二、数据库分类 数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。而在当今的互联网中,最常见的数据库模型主要是两种,即关系型数据库(SQL)和非关系型数据库(NoSQL,Not Only SQL)。(一)大数据的起源(一)大数据的起源(一)关系型数据库1.关系型数据库的基本概念 关系型数据库是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便用户理解。关系型数据库这一系列的行和列被称为表,一组表组成了数据库。关系模型可以简单理解为二维表格模型,而一个关系型数据库就是由二维表及其之间的关系组成的一个数据
4、组织。二维表格模型见表1-1。表1-1 二维表格模型 关系型数据库的最大特点就是事务的一致性。传统的关系型数据库读写操作都是事务的,具有ACID,即Atomic(原子性)、Consistency(一致性)、Isolation(隔离性)和Durability(持久性)的特点,这个特性使得关系型数据库可以用于几乎所有对一致性有要求的系统中,如典型的银行系统。常见的关系型数据库有以下几种,见表1-2。表1-2 关系型数据库类型2.关系型数据库的特性 关系型数据库以其强大的功能备受业界青睐,并应用广泛。其具有以下特性:(1)关系型数据库,是指采用了关系模型来组织数据的数据库。(2)关系型数据库的最大特
5、点就是事务的一致性。(3)关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。03 关系型数据库有以下优点:(1)容易理解:二维表结构是非常贴近逻辑世界的一个概念,关系模型相对网状、层次等其他模型来说更容易理解。(2)使用方便:通用的SQL语言使得操作关系型数据库非常方便。(3)易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大降低了数据冗余和数据不一致的概率。04关系型数据库有以下缺点:(1)数据读写必须经过sql解析,大量数据、高并发下读写性能不足。对于传统关系型数据库来说,硬盘I/O是一个很大的瓶颈。(2)具有固定的表结构,
6、因此扩展困难。(3)多表的关联查询导致性能欠佳。3.MySQL概述 MySQL本质上是一个数据库管理系统,最初是由“MySQL AB公司”开发的一套关系型数据库管理系统(RDBMS-Relation DataBase Management System)。MySQL不仅是最流行的开源数据库,而且是业界成长最快的数据库,每天有超过7万次的下载量,其应用范围从大型企业到专有的嵌入应用系统。在MySQL服务器中,可以创建很多数据库(database)。MySQL AB是由:两个瑞典人David Axmark、Allan Larsson和一个荷兰人Michael“Monty”Widenius在瑞典创办
7、的。2008年年初,Sun Microsystems 收购了MySQL AB公司。2009年,Oracle收购了Sun公司,使MySQL并入Oracle的数据库产品线。MySQL是开放源码的小型关系型数据库管理系统,广泛应用在中小型网站中,总体拥有成本低,规模较Oracle和DB2小。其具有以下优点:(1)体积小、速度快、总体拥有成本低,开源,提供的接口支持多种语言连接操作,支持多种操作系统。(2)MySQL的核心程序采用完全的多线程编程。线程是轻量级的进程,它可以灵活地为用户提供服务,而不过多的系统资源。用多线程和C语言实现的MySQL 能很容易充分利用CPU。(3)MySQL有一个非常灵活
8、而且安全的权限和口令系统。当客户与MySQL 服务器连接时,它们之间所有的口令传送被加密,而且MySQL 支持主机认证。(4)MySQL能够提供很多不同的使用者界面,包括命令行客户端操作、网页浏览器,以及各式各样的程序语言界面,如 C+、Perl、Java、PHP,以及Python。用户可以使用事先包装好的客户端,或者干脆自己写一个合适的应用程序。MySQL可用于 Unix、Windows,以及OS/2等平台,因此它可以用在个人电脑或者服务器上。在使用过程中,MySQL的某些特性也限制了其进一步发展,其缺点如下:(1)不支持热备份。(2)MySQL不支持自定义数据类型。(3)MySQL最大的缺
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 财务大数据分析项目一 任务2 教学课件 财务 数据 分析 项目 任务 教学 课件
限制150内