云计算和大数据基础知识教学教材.docx
《云计算和大数据基础知识教学教材.docx》由会员分享,可在线阅读,更多相关《云计算和大数据基础知识教学教材.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、* 1: 100. 云计算一 大数据(BigData)1. 定义:海量数据或巨量数据,其规模巨大到无法用当前主流的计算机系统在合理时间内猎取、存储、治理、处理并提取以帮助使用者决策。2. 特点:1数据量大 VolumePB级以上长快源及格式多样2) 快速Velocity- 数 据 增3) 多样Variety- 数 据 来4) 价值密度低Value从大量、多样数据中提取价值的体系构造5) 简单度Complexity-对数据处理和分析的难度大3. 大数据与云计算的关系:从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不行分。大数据必定无法用单台的计算机进展处理,必需承受分布式计算架构。它
2、的特色在于对海量数据的挖掘,但它必需依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。二云计算(Cloud Computing)1. 定义:1云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够依据需要猎取计算力、存储空间和信息效劳。/分布式计算2云计算是通过网络按需供给可动态伸缩的廉价计算效劳。2. 特点:1超大规模2虚拟化 3高牢靠性 4通用性 5高可伸缩性6按需效劳 7极其廉价3. 效劳类型分类:1) SaaS 软件即效劳::Software as a Service)/针对性更强,它将某些特定应用软件功能封装成效劳如:Salesforce o
3、nline CRM2) PaaS 平台即效劳: Platform as a Service/ 对资源的抽象层次更进一步,供给用户应用程序运行环境如:Google App Engine,Microsoft Windows Azure3) IaaS根底设施作为效劳:Infrastructure as a Service/将硬件设备等根底资源封装成效劳供用户使用 , 如:Amazon EC2/S34. 云计算的实现机制体系构造1 SOA 面对效劳的体系构造: 它将应用程序的不同功能单元称为效劳通过这些效劳之间定义良好的接口和契约联系起来。 使得其效劳能以一种统一的、通用的方式进展交互。SOA可以看作
4、是 B/S模型、XML/Web Service 技术之后的自然延长。2治理中间件: 关键局部的资源池。3资源池层:将大量一样类型的资源构成同构或接近同构4物理资源层:计算机、存储器、网络设施、数据库和软件等5. 云计算与网格计算1) 网格是基于 SOA、使用互操作、按需集成等技术,将分散在不同地理位置的资源虚拟化为一个整体。2) 关系类似于 TCP/IP 协议 之于 OSI 模型6. 云计算与物联网1) 物联网有 全面感知,牢靠传递、智能处理三个特征。 云计算供给对智能处理所需要的海量信息的分析和处理支持。2) 云计算架构与互联网之上,而物联网依靠于互联网来供给有效延长。因而, 云计算模式是物
5、理网的后端支撑关键。* 1.1: 1. Google 云计算原理一 文件系统 GFS 1 系统架构2) 实现机制: 节点分类:Client - Master Chunk Server Master 负责治理。 Client 与 Master 之间只有掌握流,而没有数据流【数据流 与掌握流 分别】 Client 可以同时访问多个 Chunk Server 。【高度的 I/O 并行】3) 特点 承受中心效劳器【Master 把握 Chunk Server 状况,便利实现负载均衡】 不缓存数据 在用户态下实现4) 容错机制 Master 容错 :a. 对应 Chunk Server 留有备份 Chu
6、nk Server 容错:a. 多个副本备份3 个b. GFS 每个文件被分为多个 Chunk 64MBc. Chunk 分为 Block64kb, 每个 Block 对应一个 32 bit 校验和二 分布式计算编程模型 MapReduce 1 编程模型 划分为 M 个 Map , 每一个 Map 针对不同的原始数据,相互独立、并行操作。 Reduce 操作则是对每个 Map 产生的中间结果进展合并。每个 Reduce 所处理的最终结果互不穿插,通过简洁相连即可形成完整的结果集。PS:Map: (in key, in value )- N 个 MapReduce: ( key(value1,v
7、alue2,. ) )- 对一样的 Key 对应的 value 进展并行处理/ 统计单词消灭次数,每个 Map 统计一局部文本,Reduce 进展合并。2) 实现机制3) 容错机制 Master 失效: 周期性地设置检查点,一旦任务失效,则从最近一个检查点重执行 Worker 失效: Master 周期性地 ping Worker , Worker 不答复即失效,任务调度安排给其他 Worker三分布式锁效劳 Chubby1) 作用: Chubby 是 Google 设计的供给粗粒度锁效劳的一个文件系统,它基于松耦合分布式系统,解决了分布的全都性问题2) Paxos 算法 proposers
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 数据 基础知识 教学 教材
限制150内