高性能计算、分布式计算、网格计算、云计算概念与区别.pdf
《高性能计算、分布式计算、网格计算、云计算概念与区别.pdf》由会员分享,可在线阅读,更多相关《高性能计算、分布式计算、网格计算、云计算概念与区别.pdf(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高性能计算、分布式计算、网格计算、云计算-概念和区别程序员 2009-02 P34“见证高性能计算 21 年”高性能计算(High Performance Computing)HPC是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。分布式计算 是利用互联网上的计算机的中央处理器的闲置处理能力来解决大型计算问题的一种计算科学。网格计算也是一种分布式计算。网格计算的思路是聚合分布资源,支持虚拟组织,提供高层次的服务,例如分布协同科学研究等。网格计算更多地面向科研应用,商业模型不清晰。网格计算则是聚合分散的资源,支持大型
2、集中式应用(一个大的应用分到多处执行)。云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算的资源相对集中,主要以数据中心的形式提供底层资源的使用,并不强调虚拟组织(VO)的概念。云计算从诞生开始就是针对企业商业应用,商业模型比较清晰。云计算是以相对集中的资源,运行分散的应用(大量分散的应用在若干大的中心执行);目录高性能计算、分布式计算、网格计算、云计算-概念和区别 .1高性能计算.3百科名片.3概念.3
3、服务领域.3网格.5百科名片.5网格的产生.5网格技术的特征及其体系结构.5高性能计算机的发展与应用.17我国高性能计算机应用前景及发展中的问题.17高性能计算机与大众生活息息相关.17高性能计算机发展任重道远.18分布式计算、网格计算和云计算.21分布式计算.21网格计算.21云计算.22网格计算和云计算的概念和区别.24目标不同.24分配资源方式的不同.25殊途同归.26钱德沛教授:云计算和网格计算差别何在?.27云计算与网格计算的概念.27网格计算的特点是什么呢?.27云计算与网格计算区别何在.28高性能计算百科名片随着科技的发展,人们要求处理事情的速度也在不断的提高,正所谓“高效率办事
4、,快节奏生活”,因此高性能计算(High Performance Computing)也就应运而生,高性能计算机在高性能运算中扮演了重要的角色,高性能计算机的出现,云计算(Cloud Computing)的概念也随之而生,作为一种全新的商业和应用模式“云计算”成为互联网和 IT巨头追逐的热点。概念简单的说,高性能计算(High Performance Computing)是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。高性能计算(HPC)指通常使用很多 处理器(作为单个机器的一部分)或者某一集群中组织的几台 计算
5、机(作为单个计算资源操作)的计算系统和环境。有许多类型的 HPC 系统,其范围从标准计算机的大型集群,到高度专用的硬件。大多 数 基 于集 群的HPC 系 统 使 用高 性能 网 络 互连,比如 那些 来 自InfiniBand 或 Myrinet 的网络互连。基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的 环境中,网状网络系统在 主机之间提供较短的 潜伏期,所以可改善总体网络性能和传输速率。服务领域随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高,不仅石油勘探、气象预报、航天国防、科学研究等需求高性能计算机,而且金融、政府信息化、教育、企业、网络游戏等更广泛的领域对高
6、性能计算的需求迅猛增长。随着科技的发展,人们要求处理事情的速度也在不断的提高,正所谓“高效率办事,快节奏生活”,因此高性能计算(High Performance Computing)也就应运而生,高性能计算机在高性能运算中扮演了重要的角色,高性能计算机的出现,云计算(Cloud Computing)的概念也随之而生,作为一种全新的商业和应用模式“云计算”成为互联网和 IT 巨头追逐的热点。高性能计算机是人类探索未知世界的最有力的武器,高性能技术计算解决方案的本质是支持全面分析、快速决策,即通过收集、分析和处理全面的材料、大量原始资料以及模拟自然现象或产品,以最快的速度得到最终分析结果,揭示客观
7、规律、支持科学决策。对科研工作者来说,这意味着减少科学突破的时间、增加突破的深度;对工程师来说,这意味着缩短新产品上市的时间、增加复杂设计的可信度;对国家来说,这意味着提高综合国力和参与全球竞争的实力。网格百科名片在生物学中,网格是由支柱和细层组成的网格状骨骼结构。在通信学中,网格是一种用于集成或共享地理上分布的各种资源(包括计算机系统、存储系统、通信系统、文件、数据库、程序等),使之成为有机的整体,共同完成各种所需任务的机制。网格的产生网格(Grid)这个词来自于电力网格(PowerGrid)。“网格”与“电力网格”形神相似。一方面,计算机网纵横交错,很像电力网;另一方面,电力网格用高压线路
8、把分散在各地的发电站连接在一起,向用户提供源源不断的电力。用户只需插上插头、打开开关就能用电,一点都不需要关心电能是从哪个电站送来的,也不需要知道是水力电、火力电还是核能电。建设网格的目的也是一样,其最终目的是希望它能够把分布在因特网上数以亿计的计算机、存储器、贵重设备、数据库等结合起来,形成一个虚拟的、空前强大的超级计算机,满足不断增长的计算、存储需求,并使信息世界成为一个有机的整体。网格技术的特征及其体系结构网络技术的特征网格技术 的特征在介绍网格的特征之前,我们首先要解决一个重要的问题:网格是不是分布式系统?这个问题之所以必须回答,因为人们常常会问另一个相关的问题:为什么我们需要网格?现
9、在已经有很多系统(比如海关报关系统、飞机订票系统)实现了资源共享与协同工作。这些系统与网格有什么区别?对这个问题的简要回答是:网格是一种分布式系统,但网格不同于传统的分布式系统。IBM Global Service 与 EDS 是在这个分布式领域最著名的公司。构建分布式系统有三种方法:即传统方法(我们称之为EDS 方法)、分布自律系统(Autonomous Decentralized Systems,ADS)方法,网格(grid)方法。ADS 通常用于工业控制系统中。网格方法与传统方法的区别见下表:特征传统分布式系统网格开放性需求和技术有一定确定性、封闭性开放技术、开放系统通用性专门领域、专有
10、技术通用技术集中性很可能是统一规划、集中控制一般而言是自然进化、非集中控制使用模式常常是终端模式或C/S 模式服务模式为主标准化领域标准或行业标准通用标准(+行业标准)平台性应用解决方案平台或基础设施通过以上对比,网格具有以下四点优势:(1)资源共享,消除资源孤岛:网格能够提供资源共享,它能消除信息孤岛、实现应用程序的互连互通。网格与计算机网络不同,计算机网络实现的是一种硬件的连通,而网格能实现应用层面的连通。(2)协同工作:网格第二个特点是协同工作,很多网格结点可以共同处理一个项目。(3)通用开放标准,非集中控制,非平凡服务质量:这是Ian Foster最近提出的网格检验标准。网格是基于国际
11、的开放技术标准,这跟以前很多行业、部门或者公司推出的软件产品不一样。(4)动态功能,高度可扩展性:网格可以提供动态的服务,能够适应变化。同时网格并非限制性的,它实现了高度的可扩展性。网格的体系特征网格之所以能有以上所说的种种优势特征,是由网格的体系结构赋予它的。网格体系结构的主要功能是划分系统基本组件,指定组件的目的与功能,刻画组件之间的相互作用,整合各部分组件。科研工作者已经提出并实现了若干种合理的网格体系结构。下面介绍目前影响比较广泛的两个网格体系结构:网格计算 协议体系结构(Grid Protocol Architecture,GPA)和计算经济网格体系结构(GRACE)模型。OGSA(
12、Open Grid Services Architecture)被称为是下一代的网格体系结构,它是在原来“五层沙漏结构”的基础上,结合最新的Web Service 技术提出来的。OGSA 包括两大关键技术即网格技术和Web Service 技术。随着网格计算研究的深入,人们越来越发现网格体系结构的重要。网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分和各部分功能的定义和描述,网格各部分相互关系与集成方法的规定,网格有效运行机制的刻画。显然,网格体系结构是网格的骨架和灵魂,是网格最核心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格,才能够使网格有效地发挥作用。OGSA 最
13、突出的思想就是以“服务”为中心。在OGSA框架中,将一切都抽象为服务,包括计算机、程序、数据、仪器设备等。这种观念,有利于通过统一的标准接口来管理和使用网格。Web Service提供了一种基于服务的框架结构,但是,Web Service 面对的一般都是永久服务,而在网格应用环境中,大量的是临时性的短暂服务,比如一个计算任务的执行等。考虑到网格环境的具体特点,OGSA 在原来 Web Service 服务概念的基础上,提出了“网格服务(Grid Service)”的概念,用于解决服务发现、动态服务创建、服务生命周期管理等与临时服务有关的问题。基于网格服务的概念,OGSA 将整个网格看作是“网格
14、服务”的集合,但是这个集合不是一成不变的,是可以扩展的,这反映了网格的动态特性。网格服务通过定义接口来完成不同的功能,服务数据是关于网格服务实例的信息,因此网格服务可以简单地表示为“网格服务接口/行为服务数据”。在目前,网格服务提供的接口还比较有限,OGSA 还在不断的完善过程之中,下一步将考虑扩充管理、安全等等方面的内容。网络协议体系结构Ian Foster于 2001 年提出了网格计算协议体系结构,认为网格建设的核心是标准化的协议与服务,并与 Internet 网络协议进行类比(如图 1)。该结构主要包括以下五个层次:构造层(Fabric):控制局部的资源。由物理或逻辑实体组成,目的是为上
15、层提供共享的资源。常用的物理资源包括计算资源、存储系统、目录、网络资源等;逻辑资源包括分布式文件系统、分布计算池、计算机群等。构造层组件的功能受高层需求影响,基本功能包括资源查询和资源管理的QoS 保证。连接层(Connectivity):支持便利安全的通信。该层定义了网格中安全通信与认证授权控制的核心协议。资源间的数据交换和授权认证、安全控制都在这一层控制实现。该层组件提供单点登录、代理委托、同本地安全策略的整合和基于用户的信任策略等功能。资源层(Resource):共享单一资源。该层建立在连接层的通信和认证协议之上,满足安全会话、资源初始化、资源运行状况监测、资源使用状况统计等需求,通过调
16、用构造层函数来访问和控制局部资源。汇集层(Collective):协调各种资源。该层将资源层提交的受控资源汇集在一起,供虚拟组织的应用程序共享和调用。该层组件可以实现各种共享行为,包括目录服务、资源协同、资源监测诊断、数据复制、负荷控制、账户管理等功能。应用层(Application):为网格上用户的应用程序层。应用层是在虚拟组织环境中存在的。应用程序通过各层的应用程序编程接口(API)调用相应的服务,再通过服务调动网格上的资源来完成任务。为便于网格应用程序的开发,需要构建支持网格计算的大型函数库。当今网格的运用现在国内国外运用得最多的可能是在一些大型院校的计算网格(实现计算资源的共享。什么是
17、计算资源:简单来说就是计算能力,CPU。计算资源共享就是CPU 计算的共享)。人们把一个集群(cluster,也就是常说的机房,通常有几十台操作系统为Linux 的计算机)的计算机连成一个局域型网格。这样就好像把这几十台电脑连成了一台超级计算机,计算能力当然大大提高了。这种局域计算网格主要运用于一些科研的研究。比如说生物科学。当生物科学的研究员需要高性能的计算资源来帮助他们分析试验的结果时,他们就把这些分析试验的程序提交(submit)给网格,网格通过计算再把结果返回给这些研究员。计算结果可能是一些图像(rendering)也可能是一些数据。这些计算如果在单一PC(Personal compu
18、ter,个人计算机)上运行的话,往往会花费几个月的时间,然而在网格中运行一,两天 也 就 完 成 了。这 就 是 网 格 技 术 最 直 观 的 优 点 之 一。当 然 现 在 有 一 些 大 型 主 机(super-mainframe)也有很强的计算能力(比如常说的IBM deepblue,打败人类国际象棋大师 Kasparov那位),但是这种主机太昂贵,而且配置(deploy)往往不方便,是名副其实的重量级(heavyweight)计算。SETIHome(SETIHomes,一个分布式计算的项目,通过互联网络上的计算机搜索地球外智慧讯息,网格在分布式计算的成功运用。)的网站指出,世界上最强
19、大的计算机IBM 的 ASCI White,可以实现每秒12 万亿次的浮点运算,但是花费了1 亿千万美元;然而SETIHOME 只用了 50 万美元却实现了每秒15 万亿次浮点运算。网格另外一个显著的运用可能就是虚拟组织(Virtual Organisations)。这种虚拟组织往往是针对与某一个特定的项目,或者是某一类特定研究人员。在这里面可以实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。比如说中国2008年奥运会开幕式研究组就可以运用网格组成一个虚拟组织。在这个虚拟组织里,任何成员不管在哪个地方都可以有权访问组织的共享资源(如开幕式场地图纸,开幕式资金,开幕式节
20、目单);而且可以和另一地方的虚拟组织成员进行交流。这个虚拟组织就像把所有奥运会开幕式的资源,信息,以及人员集中到了一个虚拟的空间,让人们集中精力研讨开幕式项目的问题,而不必考虑其他的问题。据个实例,由英国利兹大学,牛津大学,约克大学和谢菲尔德大学合作的DAME 项目就是致力于研究和运用虚拟组织。DAME 架构在这四个大学合建的白玫瑰网格White Rose Computational Grid(WRCG)上,运用于对飞机故障的快速检测和维修。网格基础设施组件首先,我们来看看有哪些典型的网格基础设施组件,每一种组件如何对应用程序的架构、设计和部署产生影响。下面是网格基础设施中的一些主要组件:安全
21、性。安全性是网格计算中的重要问题。每一种网格资源都可能需要遵从多种不同的安全策略。单点登录认证是一种必不可少的方法。得到普遍遵守的协商授权机制也是很必要的。资源管理。当提交一项任务的时候,网格资源管理器需要考虑如何为该任务指派资源、如何监视其状态以及如何返回它的执行结果。信息服务。由于网格资源管理器在指派资源之前要经过综合全面的考虑,因此它需要知道哪些网格资源是可用的,以及这些资源的容量与当前使用的情况。这些有关网格资源的知识是通过网格信息服务(Grid Information Service,GIS)维护和提供的,又称为监视与发现服务(Monitoring and Discovery Ser
22、vice,MDS)。数据管理。数据管理主要解决任务如何传输数据以及如何访问共享存储的问题。下面让我们以Globus Toolkit为例分别详细讨论一下每一种组件。安全性如果您是一名用户,要在远程系统上运行一项任务,您会关心远程系统是否安全,是否能保证其他人不能访问到您的数据。如果您是提供资源的一方,用户可以在您的系统中执行任务,那么您必须确信所有的任务都不会遭到破坏和干扰,也不能访问您系统中的其他私有数据。除了这两方面的内容之外,网格环境也面临着一般分布式计算环境中存在的其他所有安全问题。网格安全基础设施(Grid Security Infrastructure,GSI)是 Globus To
23、olkit 的基础,它提供了很多工具,可以帮助我们对网格环境中的安全问题进行管理。在您开发面向网格环境的应用程序时,您的脑子里必须时刻考虑到安全问题,并用GSI 提供的工具来解决这些问题。网格架构中与安全性有关的功能主要负责完成认证、授权以及实现网格资源之间的安全通信。在应用程序中启用网格时的考虑:安全性。当我们设计一个能够使用网格的应用程序时,安全性问题必须考虑在内。下面的列表总结了需要考虑的一些问题:单点登录。跨系统的ID 映射。如上所述,GSI 提供了认证、授权以及安全的通信。然而,您需要对安全性管理及其含义有深刻完整的理解。比如说:您是否可以将多个用户映射到目标系统中的同一个用户ID
24、上?是否需要特定的审计机制来确定实际发起应用程序的是哪一个用户?应用程序不应该要求在使用网格上的不同资源时使用不同的用户ID 映射机制。多种平台。尽管GSI 基于开放的标准化软件,可以在多种平台上运行,然而各种不同的平台其底层的安全机制并不总是一致。比如说,在传统的UNIX 或基于Linux 的系统上,读、写、执行等操作的安全机制就与微软的Windows 环境不同。您应该考虑应用程序可能运行的平台。使用GSI。对于任何应用程序特有的、且可能需要进行认证或特殊授权的功能而言,应用程序的设计应该使用GSI,这样能够简化开发,并通过维护单一的登录机制,使用户的体验也得到简化。数据加密。尽管GSI 与
25、后文将要讨论到的数据管理工具一起,提供了跨网络的安全通信与数据加密,但是您也应该考虑到,当数据到达目的地的时候会发生什么事情。比如说,如果一些敏感的数据传递到某项资源上供任务使用,随后又以非加密的格式保存到本地磁盘上,那么其他的用户或应用程序也就能访问这些数据了。资源管理网格资源管理器致力于在任务提交时进行资源指派。它的角色就像是异质网格资源的抽象接口。资源管理组件提供的工具可以将任务分配给特定的资源,可以提供一种手段,在任务运行过程中获取任务状态信息,并获取任务完成的信息,还可以提供终止任务或对其进行管理的能力。在 Globus 中,远程任务提交是由Globus Resource Alloc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 性能 计算 分布式 网格 概念 区别
限制150内