大数据技术原理与应用之NoSQL数据库13727.pptx
《大数据技术原理与应用之NoSQL数据库13727.pptx》由会员分享,可在线阅读,更多相关《大数据技术原理与应用之NoSQL数据库13727.pptx(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据技术原理与应用 厦门大学计算机科学系 林子雨 厦门大学计算机科学系 2015 年版第5 章 NoSQL 数据库(PPT 版本号:2015 年6 月第1.0 版)大数据技术原理与应用http:/的厦大校徽和底部文字大数据技术原理与应用 厦门大学计算机科学系 林子雨 提纲 5.1 NoSQL 简介 5.2 NoSQL 兴起的原因 5.3 NoSQL 与关系数据库的比较 5.4 NoSQL 的四大类型 5.5 NoSQL 的三大基石 5.6 从NoSQL 到NewSQL 数据库 本章小结欢迎访问大数据技术原理与应用教材官方网站:http:/是如下教材的配套讲义:21 世纪高等教育计算机规划教材
2、大数据技术原理与应用概念、存储、处理、分析与应用(2015 年6 月第1 版)厦门大学 林子雨 编著,人民邮电出版社ISBN:978-7-115-39287-9大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.1 NoSQL 简介通常,NoSQL 数据库具有以下几个特点:(1)灵活的可扩展性(2)灵活的数据模型(3)与云计算紧密融合大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.2 NoSQL 兴起的原因1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面:(1)无法满足海量数据的管理需求(2)无法满足数据高并发的需求(3)无法满足高可扩展性和高可用性的需求2、关
3、系数据库的关键特性包括完善的事务机制和高效的查询机制。但是,关系数据库引以为傲的两个关键特性,到了Web2.0 时代却成了鸡肋,主要表现在以下几个方面:(1)Web2.0 网站系统通常不要求严格的数据库事务(2)Web2.0 并不要求严格的读写实时性(3)Web2.0 通常不包含大量复杂的SQL 查询大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.3 NoSQL 与关系数据库的比较比较标准 RDBMS NoSQL 备注数据库原理 完全支持 部分支持RDBMS 有关系代数理论作为基础NoSQL 没有统一的理论基础数据规模 大 超大RDBMS 很 难 实 现 横 向 扩 展,纵 向 扩 展
4、 的 空 间 也 比 较 有 限,性 能 会随着数据规模的增大而降低NoSQL 可以很容易通过添加更多设备来支持更大规模的数据数据库模式 固定 灵活RDBMS 需要定义数据库模式,严格遵守数据定义和相关约束条件NoSQL 不 存 在 数 据 库 模 式,可 以 自 由 灵 活 定 义 并 存 储 各 种 不 同 类型的数据查询效率 快可以实现高效的简单查询,但是不具备高度结构化查询等特性,复杂查询的性能不尽人意RDBMS 借 助 于 索 引 机 制 可 以 实 现 快 速 查 询(包 括 记 录 查 询 和 范 围查询)NoSQL 没 有 索 引,虽 然NoSQL 可 以 使 用MapRedu
5、ce 来 加 速 查 询,但是,在复杂查询方面的性能仍然不如RDBMS表5-1 NoSQL 和关系数据库的简单比较 大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.3 NoSQL 与关系数据库的比较比较标准 RDBMS NoSQL 备注一致性 强一致性 弱一致性RDBMS 严格遵守事务ACID 模型,可以保证事务强一致性NoSQL 放 松 对 事 务ACID 四 性 的 要 求,而 是 遵 守BASE 模 型,只 能保证最终一致性数据完整性 容易实现 很难实现任 何 一 个RDBMS 都 可 以 很 容 易 实 现 数 据 完 整 性,比 如 通 过 主 键 或者 非 空 约 束 来
6、实 现 实 体 完 整 性,通 过 主 键、外 键 来 实 现 参 照 完 整性,通过约束或者触发器来实现用户自定义完整性但是,在NoSQL 数据库却无法实现扩展性 一般 好RDBMS 很难实现横向扩展,纵向扩展的空间也比较有限NoSQL 在 设 计 之 初 就 充 分 考 虑 了 横 向 扩 展 的 需 求,可 以 很 容 易 通过添加廉价设备实现扩展可用性 好 很好RDBMS 在 任 何 时 候 都 以 保 证 数 据 一 致 性 为 优 先 目 标,其 次 才 是 优化 系 统 性 能,随 着 数 据 规 模 的 增 大,RDBMS 为 了 保 证 严 格 的 一 致性,只能提供相对较弱
7、的可用性NoSQL 任何时候都能提供较高的可用性表5-1 NoSQL 和关系数据库的简单比较(续)大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.3 NoSQL 与关系数据库的比较比较标准 RDBMS NoSQL 备注标准化 是 否RDBMS 已经标准化(SQL)NoSQL 还 没 有 行 业 标 准,不 同 的NoSQL 数 据 库 都 有 自 己 的 查 询 语言,很难规范应用程序接口技术支持 高 低RDBMS 经 过 几 十 年 的 发 展,已 经 非 常 成 熟,Oracle 等 大 型 厂 商 都可以提供很好的技术支持NoSQL 在 技 术 支 持 方 面 仍 然 处 于 起
8、 步 阶 段,还 不 成 熟,缺 乏 有 力的技术支持可维护性 复杂 复杂RDBMS 需要专门的数据库管理员(DBA)维护NoSQL 数据库虽然没有DBMS 复杂,也难以维护表5-1 NoSQL 和关系数据库的简单比较(续)大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4 NoSQL 的四大类型 NoSQL 数 据 库 虽 然 数 量 众 多,但 是,归 结 起 来,典 型 的NoSQL 数据库通常包括键值数据库、列族数据库、文档数据库和图形数据库大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4 NoSQL 的四大类型 NoSQL 数 据 库 虽 然 数 量 众 多,但 是
9、,归 结 起 来,典 型 的NoSQL 数据库通常包括键值数据库、列族数据库、文档数据库和图形数据库大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4.1 键值数据库相关产品 Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached数据模型 键/值对典型应用 内容缓存,比如会话、配置文件、参数、购物车等优点 扩展性好,灵活性好,大量写操作时性能高缺点 无法存储结构化信息,条件查询效率较低使用者百度云数据库(Redis)、GitHub(Riak)、BestBuy(Riak)、Twitter(Redis 和Memcached)、StackOverFl
10、ow(Redis)、Instagram(Redis)、Youtube(Memcached)、Wikipedia(Memcached)大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4.2 列族数据库相关产品 BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS数据模型 列族典型应用 分布式数据存储与管理优点 查找速度快,可扩展性强,容易进行分布式扩展,复杂性低缺点 功能较少,大都不支持强事务一致性使用者Ebay(Cassandra)、Instagram(Cassandra)、NASA(Cassandra)、Twitter(Cassandra
11、 and HBase)、Facebook(HBase)、Yahoo!(HBase)大数据技术原理与应用 厦门大学计算机科学系 林子雨 5.4.3 文档数据库相关产品CouchDB、MongoDB、Terrastore、ThruDB、RavenDB、SisoDB、RaptorDB、CloudKit、Perservere、Jackrabbit数据模型 版本化的文档典型应用 存储、索引并管理面向文档的数据或者类似的半结构化数据优点 性能好,灵活性高,复杂性低,数据结构灵活缺点 缺乏统一的查询语法使用者百度云数据库(MongoDB)、SAP(MongoDB)、Codecademy(MongoDB)、F
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 原理 应用 NoSQL 数据库 13727
限制150内