储存(磁盘阵列柜)基础知识说课讲解.ppt
储存储存(chcn)(磁盘阵列柜磁盘阵列柜)基础知识培训基础知识培训IBM公共(gnggng)技术支持中心IBM technical support center for public 第一页,共47页。2磁磁盘阵列柜概述列柜概述(i sh)磁盘阵列简称RAID(Redundant Arrays of Inexpensive Disks),有“价格便宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列主要针对硬盘,在容量(rngling)及速度上,无法跟上CPU及内存的发展,提出改善方法。磁盘阵列是由很多便宜、容量(rngling)较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将故障硬盘内的数据,经计算后重新置入新硬盘中。而磁盘阵列柜就是装配了众多硬盘的外置的RAID。第二页,共47页。ServerHBARAID sub-systemFibre ChannelEthernet to ClientworkstationsDual Controller RAID with only one controllerin use(B not used in this example).This RAID system has four SCSI buses with five drives on each bus.ControllerSCSIChipControllerSCSIChip基本基本(jbn)配置配置第三页,共47页。ServerRAID sub-systemHBAFibre ChannelEthernet to ClientworkstationsDual independent controllers with automatic fail-over for continuous availability in case one controller or one fiber link fails.HBAFibre ChannelControllerSCSIChipControllerSCSIChipSample SCSI/SAS subsystem双控配置双控配置(pizh)第四页,共47页。5存储存储(cn ch)的参数的参数主机通道(主机接口(ji ku)):几个?什么类型?SCSI接口(ji ku)、FC接口(ji ku)、iSCSI接口(ji ku)、SAS接口(ji ku)磁盘通道(磁盘接口(ji ku)):能接多少块硬盘?什么接口(ji ku)?SATA、SCSI、FC、SAS存储连接设备:用于服务器与存储直接连接的设备。SCSI 卡、SAS卡、RAID卡、FC通道卡、以太网口、FC交换机、以太网交换机第五页,共47页。磁磁盘阵列柜的列柜的应用用(yngyng)由于磁盘阵列柜具有数据存储速度快、存储容量大等优点,所以磁盘阵列柜通常比较适合在企业内部(nib)的中小型中央集群网存储区域进行海量数据存储。6第六页,共47页。7存储存储(cn ch)网络的架构网络的架构 企业存储技术发展日新月异,早期大型服务器的DAS 技术(Direct Attached Storage,直接附加存储,又称直连存储),后来为了提高存储空间的利用及管理安装上的效率,因而有了SAN(Storage Area Network,存储局域网络)技术的诞生,SAN 可说是DAS 网络化发展趋势下的产物(chnw)。早先的SAN 采用的是光纤通道(FC,Fiber Channel)技术,所以在iSCSI出现以前,SAN 多半单指FC 而言。一直到iSCSI 问世,为了方便区别,业界才分别以FC-SAN和IP-SAN。NAS(Network Attached Storage:网络附属存储)是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。第七页,共47页。8DAS:直接:直接(zhji)附加存附加存储储的DAS(Driect Attached Storage直接附件存储)是指将存储设备通过(tnggu)SAS线缆或光纤通道直接连接到服务器上。第八页,共47页。9DAS:直接附加:直接附加(fji)存存储储存储直接连接到一台服务器上存储直接连接到一台服务器上SCSI,SAS,iSCSI,FC块级别块级别 I/O内部内部(nib)磁盘磁盘具备具备/不具备不具备RAID保护保护外部磁盘外部磁盘存储系统存储系统基于控制器的基于控制器的RAID引擎引擎第九页,共47页。内部内部(nib)DASMotherboardMotherboard内部(nib)磁盘 无RAID ROC 内部磁盘(c pn)主板集成RAID (ROC)MotherboardHA 内部磁盘 RAID 主机卡MotherboardSW 内部磁盘 软件 RAIDApplication ServerApplication ServerApplication ServerApplication Server第十页,共47页。外部外部(wib)DASMotherboardHA 通过主机连接(linji)卡连接(linji)的外部存储系统 基于控制器的 RAIDControllersApplicationServer第十一页,共47页。外部外部(wib)DAS 优势优势成本低驱动器通常在服务器内部使用迅速(xn s)具备一些数据保护内部内部(nib)DAS 优势优势比将数据存储在客户端更好增加的可靠性和性能RAID保护增强的特性和功能性 可扩展性第十二页,共47页。13SAN:存:存储储(cn ch)区域网区域网络络 SAN(Storage Aera Network)存储区域(qy)网络,是一种通过网络方式连接存储设备和应用服务器的存储构架,这个网络专用于主机和存储设备之间的访问。当有数据的存取需求时,数据可以通过存储区域(qy)网络在服务器和后台存储设备之间高速传输。(FC-SAN)(IP-SAN)第十三页,共47页。14SAN的的误区区SAN的发展历程较短,从90年代后期兴起,由于当时以太网的带宽有限,而FC协议在当时就可以支持1Gb的带宽,因此早期的SAN存储系统多数由FC存储设备构成,导致(dozh)很多用户误以为SAN就是光纤通道设备,其实SAN代表的是一种专用于存储的网络架构,与协议和设备类型无关,随着千兆以太网的普及和万兆以太网的实现,人们对于SAN的理解将更为全面。第十四页,共47页。15SAN的的组组成成(z chn)SAN由服由服务务器,后端存器,后端存储储系系统统,SAN连连接接设备组设备组成;成;后端存后端存储储系系统统由由SAN控制器和磁控制器和磁盘盘系系统统构成,控制器是后端存构成,控制器是后端存储储系系统统的关的关键键,它提供存它提供存储储接入,数据操作及接入,数据操作及备备份,数据共享、数据快照等数据安全管理,及份,数据共享、数据快照等数据安全管理,及系系统统管理等一系列功能。管理等一系列功能。后端存后端存储储系系统为统为SAN解决方案提供了存解决方案提供了存储储空空间间。使用磁。使用磁盘阵盘阵列和列和RAID策略策略为为数据提供存数据提供存储储空空间间和安全保和安全保护护措施。措施。连连接接设备设备包括交包括交换换机,机,HBA卡和各种介卡和各种介质质的的连连接接线线。SAN的的优优点:点:设备设备整合,多台服整合,多台服务务器可以通器可以通过过存存储储网网络络同同时访问时访问后端存后端存储储系系统统,不必,不必为为每台每台服服务务器器单单独独购买购买存存储设备储设备,降低存,降低存储设备储设备异构化程度,减异构化程度,减轻维护轻维护工作工作(gngzu)量,降低量,降低维护费维护费用;用;数据集中,不同数据集中,不同应应用和服用和服务务器的数据器的数据实现实现了物理上的集中,空了物理上的集中,空间调间调整和数据复整和数据复制等工作制等工作(gngzu)可以在一台可以在一台设备设备上完成,大大提高了存上完成,大大提高了存储资储资源利用率;源利用率;高高扩扩展性,存展性,存储储网网络络架构使得服架构使得服务务器可以方便的接入器可以方便的接入现现有有SAN环环境,境,较较好的适好的适应应应应用用变变化的需求;化的需求;总总体体拥拥有成本低,存有成本低,存储设备储设备的整合和数据集中管理,大大降低了重复投的整合和数据集中管理,大大降低了重复投资资率和率和长长期管理期管理维护维护成本;成本;第十五页,共47页。16FC-SAN早期的SAN采用的是光纤通道(FC,Fiber Channel)技术,所以,以前的SAN多指采用光纤通道的存储局域网络,到了iSCSI协议(xiy)出现以后,为了区分,业界就把SAN分为FC-SAN和IP-SAN。第十六页,共47页。17IP-SANIP SAN的基本(jbn)想法是通过高速以太网络连接服务器和后端存储系统。将SCSI指令和数据块经过高速以太网传输,继承以太网的优点,实现建立一个开放、高性能、高可靠性,高可扩展的存储资源平台。将数据块和SCSI指令通过TCP/IP协议承载,通过千兆/万兆专用的以太网络连接应用服务器和存储设备,这样的解决方案称为IP SAN。第十七页,共47页。18NAS(Network Attached Storage:网:网络络(wnglu)附附属存属存储储)NAS(Network Attached Storage:网:网络络附属存附属存储储)是一种将分布、独立的数据整合)是一种将分布、独立的数据整合为为大型、大型、集中化管理的数据中心,以便于集中化管理的数据中心,以便于对对不同主机和不同主机和应应用服用服务务器器进进行行访问访问的技的技术术。按字面。按字面简单说简单说就是就是连连接接在网在网络络上上,具具备资备资料存料存储储功能的装置,因此也称功能的装置,因此也称为为“网网络络存存储储器器”。它是一种。它是一种专专用数据存用数据存储储服服务务器。器。它以数据它以数据为为中心,将存中心,将存储设备储设备与服与服务务器器彻彻底分离,集中管理数据,从而底分离,集中管理数据,从而释释放放带宽带宽、提高性能、降低、提高性能、降低总拥总拥有成本、保有成本、保护护投投资资。其成本。其成本远远远远低于使用服低于使用服务务器存器存储储,而效率却,而效率却远远远远高于后者。高于后者。NAS(Network Attached Storage网网络络附加存附加存储储),是一种文件共享服),是一种文件共享服务务。拥拥有自己的文有自己的文件系件系统统,通,通过过NFS或或CIFS对对外提供外提供(tgng)文件文件访问访问服服务务。第十八页,共47页。19NAS定定义义(dngy)NAS被定义为一种特殊的专用数据存储服务器,包括存储器件(例如磁盘阵列、CD/DVD驱动器、磁带驱动器或可移动的存储介质)和内嵌系统软件,可提供跨平台文件共享功能。NAS通常在一个LAN上占有自己的节点,无需应用服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作系统。通过任何一台工作站,采用IE或Netscape浏览器就可以(ky)对NAS设备进行直观方便的管理。第十九页,共47页。20SAN 和NAS的区别(qbi):SAN是一种网络,NAS产品是一个专有文件服务器或一个只能文件访问设备。SAN是在服务器和存储器之间用作I/O路径的专用网络。SAN包括(boku)面向块(SCIS)和面向文件(NAS)的存储产品。NAS产品能通过SAN连接到存储设备第二十页,共47页。21NAS网关网关NAS和SAN结合中出现了NAS网关这个部件。NAS网关主要由专为提供(tgng)文件服务而优化的操作系统和相关硬件组成,可以看作是一个专门的文件管理器。NAS网关连接到后端上的SAN上,使的SAN的大容量存储空间可以为NAS所用。因此,NAS网关后面的存储空间可以根据环境的需求扩展到非常大的容量。第二十一页,共47页。22NAS网关网关“NAS网关”方案主要是在NAS一端增加了可与SAN相连的“接口”,系统对外只有一个用户接口。NAS网关系统虽然在一定程度上解决(jiju)了NAS与SAN系统的存储设备级的共享问题,但在文件级的共享问题上却与传统的NAS系统遇到了同样的可扩展性问题。当一个文件系统负载很大时,NAS网关很可能成为系统的瓶颈第二十二页,共47页。主要主要协议和相关和相关(xinggun)技技术SCSISCSI是小型是小型计计算机系算机系统统接口(接口(Small Computer System Interface)的)的简简称,于称,于1979首次提出,是首次提出,是为为小型机研制的一种接口技小型机研制的一种接口技术术,现现在已完全普及到了小型机,高低在已完全普及到了小型机,高低端服端服务务器以及普通器以及普通PC上。上。SCSI可以划分可以划分为为SCSI-1、SCSI-2、SCSI-3,最新的,最新的为为SCSI-3,也是目前,也是目前应应用最广用最广泛的泛的SCSI版本。版本。1、SCSI-1:1979年提出,支持同步年提出,支持同步(tngb)和异步和异步SCSI外外围设备围设备;支持;支持7台台8位的位的外外围设备围设备,最大数据,最大数据传输传输速度速度为为5MB/s。2、SCSI-2:1992年提出,也称年提出,也称为为Fast SCSI,数据,数据传输传输率提高到率提高到20MB/s。3、SCSI-3:1995年提出,年提出,Ultra SCSI(Fast-20)。)。Ultra 2 SCSI(Fast-40)出)出现现于于1997年,最高年,最高传输传输速率可达速率可达80MB/s。1998年年9月,月,Ultra 3 SCSI(Utra 160 SCSI)正式)正式发发布,最高数据布,最高数据传输传输率率为为160MB/s。Ultra 320 SCSI的最高数据的最高数据传输传输率率已已经经达到了达到了320MB/s。23第二十三页,共47页。SCSI是什么是什么(shn me)?微型(wixng)计算机系统接口(SCSI)Pronounced“skuzzy”SAS 是什么(shn me)?串联 SCSI第二十四页,共47页。SCSI接口接口(ji ku).started it all!工业(gngy)标准 I/O 总线Standard connectors are the same on each deviceAll devices share a common bus8-bit data bus16-bit data bus第二十五页,共47页。What is SAS?串联(chunlin)SCSI(SAS)是并口SCSI的终结者新的工业标准提供了非凡的性能提升3-Gbps SAS x4“宽”端口提供累计高达(o d)12-Gbps的带宽 主机连接以及扩展第二十六页,共47页。理解理解(lji)SAS“宽宽”端口端口每SAS 线缆是3-Gbps到驱动器是独立(dl)线缆“x4 宽”在一个接口中包括4根线缆2,3,4 线缆仅在当前 I/Os 超出1号线缆通道性能情况下使用第二十七页,共47页。理解理解(lji)SAS“宽宽”端口端口每SAS 线缆是3-Gbps到驱动器是独立(dl)线缆“x4 宽”在一个接口中包括4根线缆2,3,4 线缆仅在当前 I/Os 超出1号线缆通道性能情况下使用第二十八页,共47页。ServerSAS HBA or SCSI adapterRAID sub-systemSCSI or SASEthernet to ClientworkstationsDual Controller RAID with only one controllerin use(B not used in this example).This RAID system has four SCSI buses with five drives on each bus.ControllerSCSI/SAS ChipControllerSCSI/SAS ChipSCSI 与与SAS 适用适用(shyng)于哪里于哪里?第二十九页,共47页。RAID技技术术(jsh)RAID概述概述RAID为为廉价磁廉价磁盘盘冗余冗余阵阵列(列(Redundant Array of Inexpensive Disks),),RAID技技术术将一个个将一个个单单独的磁独的磁盘盘以不同的以不同的组组合合(zh)方式方式形成一个形成一个逻辑逻辑硬硬盘盘,从而提高了磁,从而提高了磁盘读盘读取的性能和数据的安全性。不取的性能和数据的安全性。不同的同的组组合合(zh)方式用方式用RAID级别级别来来标识标识。RAID技技术术是由美国加州大学伯克利分校是由美国加州大学伯克利分校D.A.Patterson教授在教授在1988年提出的,作年提出的,作为为高性能、高可靠的存高性能、高可靠的存储储技技术术,在今天已,在今天已经经得到了广泛得到了广泛的的应应用。用。30第三十页,共47页。RAID级别级别(jbi)RAID技术经过不断的发展,现在已拥有了从 RAID 0 到 5等6种明确标准级别的RAID 级别。另外,其他还有6、7、10(RAID 1与RAID 0的组合)、01(RAID 0与RAID 1的组合)、30(RAID 3与RAID 0的组合)、50(RAID 0与RAID 5的组合)等。不同RAID 级别代表(dibio)着不同的存储性能、数据安全性和存储成本,下面将介绍如下RAID级别:0、1、2、3、4、5、6、01、10。31第三十一页,共47页。RAID-0RAID0也称为条带化(stripe),将数据分成一定的大小顺序的写道阵列的磁盘里,RAID0可以并行的执行读写操作,可以充分利用总线的带宽,理论上讲,一个由N个磁盘组成的RAID0系统,它的读写性能将是单个磁盘读取性能的N倍。且磁盘空间的存储效率最大(100)RAID0有一个明显的缺点(qudin):不提供数据冗余保护,一旦数据损坏,将无法恢复。32第三十二页,共47页。RAID-033第三十三页,共47页。如图所示:系统向RAID0系统(2个磁盘(c pn)组成)发出的I/O数据请求被转化为2项操作,其中的每一项操作都对应于一块物理硬盘。通过建立RAID 0,原先顺序的数据请求被分散到2块硬盘中同时执行。从理论上讲,2块硬盘的并行操作使同一时间内磁盘(c pn)读写速度提升了2倍。但由于总线带宽等多种因素的影响,实际的提升速率会低于理论值,但是,大量数据并行传输与串行传输比较,性能必然大幅提高。RAID0应用于对读取性能要求较高但所存储的数据为非重要数据的情况下。34第三十四页,共47页。RAID-1RAID1成为镜像(mirror),它将数据完全一致的分别写到工作磁盘和镜像磁盘,因此它的磁盘空间利用率为50,在数据写入时时间(shjin)会有影响,但是读的时候没有任何影响,RAID0提供了最佳的数据保护,一旦工作磁盘发生故障,系统自动从镜像磁盘读取数据,不会影响用户工作。RAID1应用于对数据保护极为重视的应用35第三十五页,共47页。RAID-2RAID2称为纠错海明码磁盘阵列,阵列中序号为2N的磁盘(第1、2、4、6)作为校验盘,其余的磁盘用于存放数据,磁盘数目越多,校验盘所占比率(bl)越少。RAID2在大数据存储额情况下性能很高,RAID2的实际应用很少。36第三十六页,共47页。RAID-3RAID3采用一个硬盘作为校验盘,其余磁盘作为数据盘,数据按位或字节的方式交叉的存取到各个数据盘中。不同(b tn)磁盘上同一带区的数据做异或校验,并把校验值写入到校验盘中。RAID3系统在完整的情况下读取时没有任何性能上的影响,读性能与RAID0一致,却提供了数据容错能力,但是,在写时性能大为下降,因为每一次写操作,即使是改动某个数据盘上的一个数据块,也必须根据所有同一带区的数据来重新计算校验值写入到校验盘中,一个写操作包含了写入数据块,读取同一带区的数据块,计算校验值,写入校验值等操作,系统开销大为增加。当RAID3中有数据盘出现损坏,不会影响用户读取数据,如果读取的数据块正好在损坏的磁盘上,则系统需要读取所有同一带区的数据块,然后根据校验值重新构建数据,系统性能受到影响。37第三十七页,共47页。RAID-3 RAID3的校验盘在系统接受大量的写操作时容易形成性能瓶颈(pn jn),因而适用于有大量读操作如web系统以及信息查询等应用或持续大块数据流(例如非线性编辑)的应用38第三十八页,共47页。RAID-4RAID4与RAID3基本一致,区别在于条带化的方式不一样,RAID4按照块的方式存放数据,所以在写操作时只涉及两块磁盘,数据盘和校验盘,提高了系统的IO性能。但面对随机的分散的写操作,单一(dny)的校验盘往往成为性能瓶颈39第三十九页,共47页。RAID-5RAID5与RAID3的机制相似,但是数据校验的信息被均匀的分散到的阵列的各个磁盘上,这样就不存在并发写操作时的校验盘性能瓶颈。阵列的磁盘上既有数据,也有数据校验信息,数据块和对应的校验信息会存储于不同的磁盘上,当一个(y)数据盘损坏时,系统可以根据同一带区的其他数据块和对应的校验信息来重构损坏的数据。40第四十页,共47页。RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障,但保障程度要比RAID1低而磁盘空间利用率要比RAID1高。RAID 5具有和RAID 0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个(du)数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较低。41第四十一页,共47页。RAID-6RAID 6提供两级冗余,即阵列中的两个(lin)驱动器失败时,阵列仍然能够继续工作42第四十二页,共47页。一般而言,RAID 6的实现代价最高,因为RAID 6不仅要支持数据的恢复,又要支持校验的恢复,这使RAID 6控制器比其他级R A I D更复杂和更昂贵。1.RAID 6的校验数据当对每个数据块执行写操作时,RAID 6做两个独立的校验计算,因此,它能够支持两个磁盘的失败。为了实现这个思想,目前基本上有两个已经接受的方法:使用多种算法,如X O R和某种其他的函数。在不同的数据分条或者磁盘上,使用排列的数据。2.RAID 6的一维冗余RAID 6的第一种方法是用两种不同的方法计算校验数据。实现这个思想最容易的方法之一是用两个校验磁盘支持数据磁盘,第一个校验磁盘支持一种校验算法,而第二个磁盘支持另一种校验算法,使用两种算法称为P+Q校验。一维冗余是指使用另一个校验磁盘,但所包含的分块数据是相同的。例如,P校验值可能(knng)由X O R函数产生,这样,Q校验函数需要是其他的某种操作,一个很有力的侯选者是Reed Solomon误差修正编码的变体,这个误差修正编码一般用于磁盘和磁带驱动器。假如两个磁盘失败,那么,通过求解带有两个变量的方程,可以恢复两个磁盘上的数据,这是一个代数方法,可以由硬件辅助处理器加速求解。43第四十三页,共47页。RAID-10RAID10是RAID1和RAID0的结合,也称为RAID(0+1),先做镜像然后做条带化,既提高了系统的读写性能,有提供了数据冗余保护,RAID10的磁盘空间利用率和RAID1是一样的,为50。RAID10适用于既有大量(dling)的数据需要存储,有对数据安全性有严格要求的领域,比如金融,证券等。44第四十四页,共47页。JBODJBOD(Just Bundle Of Disks)译成中文可以是简单磁盘捆绑,通常又称为Span。JBOD 不是标准的RAID级别,它只是在近几年才被一些厂家提出,并被广泛采用。Span是在逻辑上把几个物理磁盘一个(y)接一个(y)串联到一起,从而提供一个(y)大的逻辑磁盘。Span上的数据简单的从第一个(y)磁盘开始存储,当第一个(y)磁盘的存储空间用完后,再依次从后面的磁盘开始存储数据。Span存取性能完全等同于对单一磁盘的存取操作。Span也不提供数据安全保障。它只是简单的提供一种利用磁盘空间的方法,Span的存储容量等于组成Span的所有磁盘的容量的总和。45第四十五页,共47页。46第四十六页,共47页。47第四十七页,共47页。