云计算数据中心网络技术全面剖析图.docx
《云计算数据中心网络技术全面剖析图.docx》由会员分享,可在线阅读,更多相关《云计算数据中心网络技术全面剖析图.docx(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【转】云计算数据中心网络技术全面剖析(图)1、m题目并不吸引人,主要是作者犯懒,罗列了一下关键词而已,当然好处是看就知道文章要 说啥。简单说下结构,首先讲讲云计算,其次是数据中心,再然后是网络,重点还是技术.内容是 循序渐进的,可以理解前面每个词都是后面词的定语。本文希望能够帮读者对云计算的数据中心的网络的技术建立起全面的结构性认识,因此除了 总体思路的描述外,在介绍过程中也会力争用三言两语对前面部分中涉及的每个技术点都有 所说明,至少让人明白这个东东怎么来的,要干啥和怎么干。但由于受篇幅所限,无法做到 很详细,大家如果对某个技术点真感兴趣时,还是去网上找些更细节的资料来理解,本文是 打算没有
2、写成一本书的.力争做到让文档读起来不感到枯燥吧,对作者来说那是相当有挑战的。2、云计算最早接触这个词好像是06年了,当时也是刚刚开始接触数据中心不久,这几年眼睁睁看着 它被炒作得一塌糊涂,现在已经成为非常给的个概念。和别人谈数据中心要是不提云计 算,你还真不好意思张这个嘴。服务器厂商在喊云计算,网络、操作系统、应用软件甚至存储厂商都在喊。大家各喊各的, 让我们感觉听上去都有那么点儿味道,但下来仔细琢磨大都还在云里雾里。看看这张网上 截取的云计算产业全景图,估计没有几个能够不头晕的。Yelp SaaS Kz. aim*SauccLabs hp“s”11 21 Echos,即 SalcsR) la
3、lcoZephyrDoxoGM imuit GroupOn 族a#Shack Baiu OpenAir伟库TurbAp夕cl;咄RiglvScalc【小。(CE Zoho( ;3沙产heeler(刈岫犍色. Sh r, ConhcMVrFT 1ESB Obai FacebookPingldcntitt QuickbaEW1r5r 、Plalfbrm , 2;淤 AppCloud。(名氏波化、:S;ra* J- *-。喉匕協S(irid BludimH!1皿”“登3I叫 常 陟吗巴,厶 “、 、“卜。 Skytap Ann/np .y Bluclock |.|umc 山気 陰、人, ing 1
4、hluXlot.d 厂, ,Hep, VMa即“皿HR1露心、尸 懸渉修2親屮 温 STydoon , “,由、h / / z j1。1wiho ( loudStackarenQRM Hexiseai SAP Deltdcloiiii SGE Swis .4182 Biisincss Abiquo .IJUCC HZ,、VMa。、%- Adobe CogHcad DclJA Cqnd Egcn 叫g3;泞l、”:麗海湍*X:AppNexu、 /Ict?OTlirkrt,?)urc MecluiKal U齊:喰蒲或M%関 盘謳逊。券军鑼、噓i |姉、凡,”.”“,Ar . dgeftaiiorm
5、丸小、R:;号Wirxi(K s Xtools Bungee Gx)ple Af*tri)gine HM(, Ztm ,Ck)ud foundry Fair Scheduler Oracle111 Acrobat Connect 腾以eVapt(吗盘第Fm微lipper SR HenSku (Kkjt*HPC tire 10rph ms AzureConcurPPAvahrt i TriCi 八百HnaoctalLive ShiftboiibitsCN.comEAOpenFhw. Litem . Linxter github帥1、化 “ Kaavo I lickr 缶加ry色呻海(通714(
6、p1媪 乂内讯: flSCOUC,由即 Quicken SuaS刎溫3飼需向upacucw1 Basecamp011cnio SSSfe Apps(云计算的各方面定义很多,基于用户的视角来看,目的就是让使用者在不需了解资源的具体情况下做到按需分配,将计算资源虚拟化为一片云。站在高处看,当前的主流云计算更贴切 于云服务,个人认为可理解为早先运营商提供数据中心服务器租用服务的延伸。以前用户租 用的是一台台物理服务器,现在租用的是虚拟机,是软件平台甚至是应用程序。公认的三个 云计算服务层次是 laaS (Infrastructure as a Service PaaS ( Platform as a
7、 Service ) 和SaaS ( Software as a Service ),分别对应硬件资源、平台资源和应用资源。对于用户来说:1、当提供商给你的是一套a个核CPU、b G大小内存的主机、c M带宽网络以及d G大 小存储空间,需要你自己去装系统和搞定应用程序,那么这就是!aaS,举例如Amazon EC2 ;2、当提供的是包含基本数据库和中间件程序的套完整系统,但你还需要根据接口编写自 己的应用程序时,那么就是PaaS ,举例如Google AppEngine、Microsoft Azure和 Amazon SimpleDB, SQS ;3、最傻瓜的方式自然是连应用程序都写好了,例
8、如你只需要告诉服务提供商想要的是个500 人的薪酬管理系统,返回的服务就是个HTTPS的地址,设定好帐号密码就可以访问过去直 接使用,这就是 SaaS 了,如 SalesForce、Yahoo Hadoop 和 Cisco Webex: Collaboration SaaS 等。厳务Amazon EC2Google App EngineMicrosoft AzureYahoo Hadoop架构laaS/PaaSPaaSPaaSSaaS服务形态Compute/ StorageWeb applicationWeb and nonwebSoftware管理枝木OS on Xen hypervisor
9、Application containerOS through Fabric controllerMap / Reduce Architecture使用者界面EC2 Command-line toolsWeb-based Administratio n consoleWindows Azure portalCommand line and webAPIsyesyesyesyes收费yesyesyesno bitsCN.comAMI (Amazon Machine Image)Python.NET frameworkJava.为啥举例都是国外的呢,因为国内目前的云服务状况是,能提供的都处于!aa
10、S阶段,有喊着要做PaaS的,但还没听说有SaaS的。说完公共的,该讲些私货了。 个人理解云计算的核心首先是计算,什么网络、存储、安全等等都是外延,从技术上讲云计 算就是计算虚拟化。最早的云计算来自于网格计算,通过一堆性能较差的服务器完成一台超 级计算机才能完成的计算任务,简单的说就是计算多虚。但是现如今一虚多(VM/XEN 等)也被些厂商扯着大旗给忽悠进来,并且成为主流。但是单从技术角度来看,这两者是 南辕匕辙的。因此云计算技术在下面被作者主观的分为集中云与分散云两个概念来阐述。2.1 集中云首先是集中云,根正苗红的多虚,最早期的也是目前最大的个典型实际用户就是 GoogleT (注意这里说
11、的不是现在Google云服务)。搜索引擎是超级消耗资源的典型应用, 从你在网页上一个关键词的搜索点击,到搜索结果的产生,后台是经过了几百上千台服务器 的统计算。至于搜索引擎的工作模型本文就不多说了,网上很多资料的。随着互联网的发 展,现在的开心、淘宝、新浪微博等等(好孩子不翻墙),虽然使用者看到的只是在简单的 页面逬行点击输入,但是后台的工作量已经远远不是少量几台大勖艮务器能够胜任的了,即 使天河一号也不见得能搞定。集中云的应用主力就是这些大型的互联网内容提供商们,当然 还有一些传统应用如地震、气象和科研项目的计算也会存在此类需求。HPC1 -Parallel Message Passing
12、HPC2 -Oslnbuted I/OHPC3 -Parallel Ffe Proceswg D8 -Data Base Cluster APP -Appbcabon Cluster HA -High AvaiaMity Cluster LB -Load Balanang Cluster SC -Stretched ClustenngHPC Today: MarUy consists of comercase or very custom imptemenlabons.Uitency Requirements了解了需求,下面简单谈下技术,上图是Cluster集群多虚技术的简单分布,除了按照承
13、载网络类型可分成Infiniband和Ethernet外,根据技术分,还可分为Active-Standby主 备与LoadBalance负载均衡两类。主备模式好理解,所有的Server里面只有一台干活,其他都是候着的,只有侦听到干活的 歇菜了,开始接管处理任务。主备模式大部分就二虚提供服务,多了如三虚什么的其 实意义都不太大,无是为了再多增加些可靠性。主备模式以各类HA集群技术为代表.而负载均衡模式复杂些,在所有的LB技术中都存在两个角色,协调者与执行者,协调者 一般是个或多个(需要主备冗余时),主要工作就是接活丿母口分活儿(有点儿像包工头); 而执行者就只处理计算了,分到啥就完成啥,典型的苦
14、力.从流量模型上来说,LB集群技 术有来回路径一致和三角传输两种,来回路径致指流量都是客户发起连接,请求协调者进 行处理,协调者分配任务给执行者逬行计算,计算完成后结果会都返回到协调者,再由协调 者应答客户。 这种结构简单,计算者不需要了解外界情况,由协调者统一作为内外接口,安全性最高。此 模型主要应用于搜索和地震气象科研计算等业务处理中。三角传输模型指计算者完成计算后 直接将结果反馈给客户,此时由于计算者会和客户直接通信,造成安全性降低,但返回流量 减少了协调者这个处理节点,性能得到很大提升。此模型主要应用于腾讯新浪的新闻页面和 阿里淘宝的电子商务等WEB访问业务。集中云在云服务中属于富人倶
15、乐部的范围,不是给中小企业和个人玩的,实际上都是各大互 联网服务提供商自行搭建集中云以提供自己的业务给用户,不会说哪天雅虎去租用个 Google的云来向用户提供自己的新闻页面访问。集中云服务可能的租用对象是那些高度科 研项目,因而也导致当前集中云建设上升到国家宏观战略层面的地位。你能想象哪天百度的 云服务提供给总装研究院去计算个导弹轨迹,核裂变什么嘛,完全不可能的事。最后是多虚对网络的需求。在集中云计算中,服务器之间的交互流量多了,而外部访问的 流量相对减少,数据中心网络内部通信的压增大,对带宽和延迟有了更高的要求,自然而 然就催生出后面会讲到的些新技术(L2MP/TRILL/SPB等题外话,
16、当前的多虚技术个人认为不够给,现在把10台4核CPU的服务器虚拟合一后 虚拟的服务器远远达不到个40核CPU的计算能力。准确的说现在的多虚只能基于物理 服务器的粒度进行合并,理想的情况应该是能够精细到CPU核以及每台设备的内存缓存等 等物理构件虚拟合一。这块应该就涉及到超算了,不熟不深谈。总的来说认为技术进步空间 巨大,有些搞头。2.2 分散云 再讲分散云,这块是目前的主流,也是前面提到的云服务的关键底层技术。由于有VMware 和Citrix等厂家在大力推广,而且应用内容较集中云更加平民化,随便找台PC或服务器, 装几个虚拟机大家都能玩玩,想干点儿啥都成,也就使其的认知度更加广泛。一虚多的最
17、主要目的是为了提高效率,力争让所有的CPU都跑到100% ,力争让所有的内 存和带宽都占满。以前10台Server干的事,我整两台Server每台跑5个虚拟机VM( Virtual Machine )就搞定了,省电省空间省制冷省网线,总之省钱是第一位的(用高级词儿就是 绿色环保!技术方面从实现方案来看,目前大致可分为三类:操作系统圜以化OS-Level在操作系统中模拟出个个跑应用程序的容器,所有虚拟机共享内核空间,性能最好,耗费 资源最少,一? CPU 号称可最多模拟500个 VPS(Virtual Private Server)或 VE(Virtual Environment).缺点是操作系
18、统唯一,如底层操作系统跑的Windows , VPS/VE就都得跑 Windows,代表是Parallels公司(以前叫SWsoft)的Virtuozzo(商用产品)和OpenVZ (开源项目I Cisco的Nexus 7000猜测也是采用这种方案运行的VDC技术,但不太清楚 为什么会有最多4个VDC的数量限制,也许是基于当前应用场景进行规格控制的种商业 手段.主机虚拟化Hosted先说下Hypervisor或叫做Virtual Machine Monitor ( VMM ),它是管理虚拟机VM的软 件平台。在主机虚拟化中,Hypervisor就是跑在基础操作系统上的应用软件,与OS-Leve
19、l 中VE的主要区别在于:Hypervisor构建出一整套虚拟硬件平台(CPU/Memory/Storage/Adapter),上面需要你 再去安装新的操作系统和需要的应用软件,这样底层和上层的OS就可以完全无关化,诸如 Windows上跑Linux一点儿问题没有;VE则可以理解为盗用了底层基础操作系统的资源去欺骗装在VE上的应用程序,每新创建 出个VE(其操作系统都是已经安装好了的,和底层操作系统完全样,所以VE檄VM (包括主机虚拟化和后面的裸金属虚拟化)运行在更高的层次上,相对消耗资源也少很多. 主机虚拟化中VM的应用程序调用硬件资源时需要经过:VM内核Hypervisor-主机内 核,
20、导致性能是三种虚拟化技术中最差的。主机虚拟化技术代表是VMware Server( GSX Workstation 和 Microsoft Virtual PC、Virtual Server 等。裸金属虚拟化Bare-metal裸金属虚拟化中Hypervisor直接管理调用硬件资源,不需要底层操作系统,也可以理解为 Hypervisor被做成了一个很薄的操作系统。这种方案的性能处于主机虚拟化与操作系统虚 拟化之间。代表是 VMware ESX Server, Citrix XenServer 和 Microso代 Hyper-V。HostedBare-Metal上图描述了三种虚拟化方案的形态区
21、别。当前分散云数据中心服务器虚拟化使用的主要是Bare-Metal方案。分散云给数据中心网络带来了新的挑战,虚拟机之间的数据通信管理需求促使了一系列网络新技术的发展。在OS-Level与Hosted方案中,虚拟机都是架设于操 作系统之上的,因此VM/E之间的通信主要由同样运行于基础操作系统之上的网络交换应 用程序来完成。而在最主流的Bare-Meta!结构中,由于Hypervisoi薄操作系统的引入, 性能、管理、安全和可靠性等多维度的考虑,造成VM间网络通信管理发展出不同的技术 道路(EVB与BPE ),后文会对这些技术方向加以详述。VMware ESX与Xen/Hyper-V的Bare-M
22、etal方案实现结构有所不同,简单如下图所示。分散云除了给网络带来上述的VM通信问题,同样由于其对服务器硬件能力的极端榨取, 造成网络中的流量压力增大,与集中云样存在着带宽扩展的需求。原本一台服务器一个操 作系统跑个应用只需要10M流量带宽就够了,现在装了 10个VM跑10个应用,带宽可能 就需要100M 了。大型机与小型机的一虚多技术早在30年前IBM就做出来了,现在RISC平台上已经相当完 善了,相比较而言X86架构的虚拟化处于起步阶段,但X86架构由于性价比更高成为了 分散云计算的首选。X86架构最早期是纯软件层面的Hypervisor提供虚拟化服务,缺陷很多,性能也不够,直 到2006
23、年Inte!推出了实现硬件辅助虚拟化的VT技术CPU产品后开始迅猛发展(AMD 也跟着出了 VM技术!硬件辅助虚拟化技术主要包括CPU/Chipset/Network Adapter 等几个方面,和网络技术紧密相关的就是网卡虚拟化了,后文会对如SR-IOV等网卡虚拟化 技术应用进行更具体分析。随着2007年Intel VT FlexMigration技术的推出,虚拟机迁移 成为可能,2009年!ntel支持异构CPU间动态迁移再次向前迈进。vMotion这里再多唠叨几句vMotion技术。vMotion是VMware公司提出的虚拟机动态迁移技术 名称(XEN也有相应的XENMotion技术),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 数据中心 网络技术 全面 剖析
限制150内