《SAN存储技术知识介绍.docx》由会员分享,可在线阅读,更多相关《SAN存储技术知识介绍.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SAN 存储技术进阶学问介绍SAN 是千兆位速率的网络,它依托光纤通道(Fibre Channel)为效劳器和存储设备之间的连接供给更高的吞吐力量、支持更远的距离和更牢靠的连通。SAN 可以是交换式网络,也可以是共享式网络。以目前的技术,其中任何一种网络都能够供给更好的伸缩性、故障恢复和诊断信息;此外,以其中任何一种网络为根底建设 SAN 都不需要对现有设施进展全面升级。由于降低了治理本钱,SAN 的根本设施的最初本钱也就变得并不昂贵。 SAN 的组成通常包括效劳器(主机)、存储设备(磁带或者磁盘阵列)以及桥接器和多路复用器,并且全部这些设备都连接在光纤通道的交换机上。在 LAN 和 WAN
2、环境中,交换机为连接着的全部设备供给主干,其中的一个或多个交换机称为光纤通道交换矩阵(Switching Fabric)。SAN 的交换矩阵允许数以千计的结点进展连接。SAN 还可以组成FC-AL 环网(Fibre Channel Arbitrated Loop),这是一种共享介质的网络。FC-AL 环网构造在每个环上允很多达 126 个设备,可以直接连接到光纤通道的交换机上,也可以连接到和交换机相连的集线器上。此外,光纤通道还有助于分担效劳器的负载,以前效劳器始终要担当向存储设备和 LAN 传输数据的负担;而现在,效劳器可以将传输数据的工作交给 SAN。SAN 的设计要进展 SAN 网络的安
3、装,任务是相当简洁的。光纤通道SAN 可以设计成共享介质的网络,也可以设计成交换式访问的网络。在共享介质的网络中,全部设备共享同一个千兆位的环,这种构造的问题在于随着设备的增加,网络的吞吐力量会下降。尽管对于小型应用环境来说这或许是可以承受的,但基于光纤通道交换机的主干将大大增加 SAN 的总带宽。建立交换矩阵 SAN 可以使用一个或多个光纤通道交换机,然而只有当全部存储设备的网卡象操作系统和应用一样能够连接到这一交换矩阵上,才有可能访问由这一交换矩阵所供给的效劳。这是由于首先网卡要通过登录到这一交换矩阵来成为网络的一个成员,这一过程称作Fabric Login。因而显而易见,在组建 SAN
4、时选用支持 Fabric Login 的网卡是格外重要的。对于连接到 SAN 中的设备,另外一个关键的问题是觉察整个交换矩阵中的全部 设备的力量。 光纤通 道定义了一 种觉察机 制 SNS(Simple Name Service),它能够知道连接在这一体系构造上的设备的地址、类型以及特征。SNS 信息驻留在光纤通道交换机中,而网卡和存储掌握器则从交换机中查询SNS 数据,因而网络治理员同时还应当寻求支持 SNS 的光纤通道网卡和存储 掌握器。对于错误恢复和故障隔离,光纤通道有着一个称为 RSCN(Registered State Change Notification)的可选功能,能够对设备进
5、展配置更改。假设RAID(Redundant Array of Independent Disks)或者是 JBOD(Just a Bunch of Disks,没有 RAID 掌握器的磁盘集)、磁带设备和主机是直接连接到一个交换阵列矩阵上,而不是同处于一个共享访问的连接环上,则 RSCN 所起的作用会更大。由于故障结点不会影响到其他任何连接到这一交换矩阵体系上的设备。同时由于有问题的设备或是连接能够被隔离,因而交换式网络的故障恢复速度也要比共享介质的网络要快得多。此外,光纤通道本身还具有多点传送的功能特性。别名效劳器是一个可选的交换矩阵的效劳,它的角色相当于一个光纤通道多点传送场所,进展多点
6、发送组的创立和删除。但是光纤通道的多点传送和 IP 多点传送并不一样, 在 IP 多点传送中,是由主机来建立多点传送组,而且这一团组也仅仅工作在网络层;然而交换矩阵本身能够帮助进展多点传送,这种团组关系基于光纤通道的物理地址,对上层的协议是完全透亮的。由于光纤通道能够结合很多不同的协议,网络治理员可以通过建立 SAN 来满足最大规模的数据中心的存储需求。例如,通过使用SNA 到光纤通道的网关和光纤通道到 SSA(Serial Storage Architecture)的桥接设备,完全可以将 Escon(Enterprise Systems Connection)设备和 SSA 设备集成到 SA
7、N 中。将来的大型主机和SSA 设备将支持到光纤通道的直接连接。通过使用分布式锁治理软件或者一些分区机制,这些数据中心的 SAN 甚至可以允许存储设备为企业环境中的全部效劳器共享,而不管他们所运行的操作系统是 Unix 操作系统还是 NT。SAN 的治理为了做好治理工作,网络人员应当能够使用 LAN 和 WAN 环境中的全部工具和系统。这就意味着他们必需查找能够通过 SNMP 协议治理或者运用 传输协议通过 Web 界面进展治理的 SAN 设备。同时设备还应当支持 telnet 登录协议;SCSI 设备上另一个可供选择的特性是 SES(SCSI Enclosure Services)。全部这些
8、设备都应当供给有关设备状态、性能级别、配置和拓扑变化以及历史数据等方面的具体信息,主要的状态和性能信息包括吞吐量和响应时间,将来还要求供给一些传输确认和优化工具。在 FC-AL 网络中,由集线器来供给环网上全部设备的治理信息。但是它不能供给连接在环以外的设备的信息。固然,当这个环连接到交换矩阵上以后,就能够对任何设备进展远程治理和诊断了。在确定使用何种方式将环连接到交换机上以后,网络治理员们应当尽量寻求性能良好的设备,以使它们能够充分利用独占环的时间来传输数据。SAN 的选择现在,一些企业用户已经安装了交换式或者共享介质的SAN 网络,但他们需要将两种网络进展合并,所以应当一开头就考虑好 SA
9、N 的哪些局部需要承受交换式网络、哪些局部又需要承受共享式网络。对小型网络而言(只有一两台效劳器和一两个 RAID 或是 JBOD 磁盘阵列),存在着 3 种选择:仅仅承受 SCSI 应用模式;转移到点对点的光纤通道网络(一块网卡连接一个存储设备使效劳器到全部存储设备都存在连接 );通过环形拓扑构造承受一个共享访问(基于集线器)的 SAN。主要的考虑因素是本钱和平滑升级的力量。对于具有多个效劳器和数据量超过 500GB 的智能阵列的网络,则最好承受基于交换方式的 SAN。对于具有 3 台效劳器、多个 RAID 阵列和一个磁带系统的中等规模网络,可以将 RAID 阵列和效劳器进展交换式的连接,效
10、劳器和多个 JBOD 设备之间承受环型连接,而磁带系统则承受桥接方式连接 (见图)。但同时要记住,由于这一 SAN 是基于交换机而组建的,因而它可以进展故障隔离,能够供给其他交换矩阵的效劳。到底一个 SAN 的哪些局部应当设计成共享式的、又有多少局部应当设计成交换式的,这个问题必需视具体状况而定。在这一问题上,不应当将所存储的数据量作为打算组建何种类型的 SAN 网络的主要因素。相反,应当从数据的重要程度、网络的距离要求、存储设备的治理需求、数据的可用性和灾难恢复的需求以及治理和应付配置转变的力量方面来考虑。首先,应考虑企业内部如何进展重要数据的访问。例如,对于通过并行的 SCSI 接口连接的
11、存储设备,效劳器是掌握中心。当效劳器发生问题时, 可能需要 30 到 90 秒才能够正常复位。对于供给电子商务效劳的公司,这段时间足以带来致命的打击,因此不能承受共享介质的 SAN。由于这种网络不能够消退复位时间,而且由于令牌环还要进展一个环初始化过程 (Loop Initialization Process),这将导致全部设备的复位。假设对数据的访问具有相互竞争的需求,那交换式的构造体系则正好符合要求。假设对于存储有距离要求(如跨越建筑物或是跨越园区内的多幢建筑物),则SCSI 可能就不是一种适宜的选择,由于SCSI 的传输有 70 米的距离限制,即使使用了 SCSI 集线器或者中继器也没有
12、用处。假设想要监视位于多个建筑物中的设备的状态,光纤通道的SAN 比较适合,由于它本身就能够供给治理特性。使用位于环上的 JBOD 设备的部门,可以直接连接到位于SAN 网络主干上的交换机上,交换式主干于是就与效劳器以及位于环上的存储阵列直接连接,创立了一个虚拟的数据中心,为网络治理员供给治理数据和信息。最终,从灾难恢复的角度来看,交换式的构造也是一个正确的选择。在10 公里或更远距离以外创立一个冗余(备份)的数据中心,需要格外高的带宽来进展数据同步,这一要求目前只有交换的方式能够供给。SAN 的 ASP对于不同专业的从业人员,ASP 有着不同的含义。但是当它和支持 Web 功能的 ERP 以
13、及电子商务应用发生联系时,ASP 只能是可用性、敏捷性和性能(Availability、Scalability、Performance)的代名词。在这种解释之下的 ASP 带来了很多技术难题,那就是要求向用户供给跨越网络的可以持续稳定访问的应用系统。网络上这种开放的效劳刺激了用户数量和数据的传输量,同时在应用上也产生了很多不行预知的问题。那些大型的 ERP 和电子商务系统遍布全球, 为了提高性能,对这种应用的访问需要强有力的数据缓存。沿用以前的系统(如大型主机)来装载的应用是一个极端,而选择基于 PC 的低端效劳器运行应用则是另外一个极端。相比之下,SAN 是最正确的选择,它能够减轻全部这些问
14、题。SAN 和集群SAN 可以被用作全部存储资源的高级网络主干,其中包括硬盘、磁带、光纤通道的硬盘和遥控设备,它们在网络上的全部效劳器节点之间共享。支持 SAN 功能的集群使用了集群技术,也就是两台或多台相互之间知道彼此配置和所供给的效劳/应用的计算机系统完全协同工作在 SAN 拓扑环境中。一个真正意义上的 SAN 网络早已超越了任意连通性、任意效劳器到任意存储系统的连通的观念。事实上,通过将全部存储系统从一个高速的网络主干上隔离出来,或是通过在数据、存储治理和使用这些数据的应用之间引入规律层/物理层,这种好处是相当巨大的。为了实现无缝的存储治理,SAN 构造原来应当在全部存储资源(如磁盘阵列
15、、备份设备、规律卷的治理、文件系统治理和备份治理 )以及全部需要这些资源的应用系统根底之上,引进一个软件层。那些运行在CPU 数目满足需求的效劳器上的应用效劳(如应用效劳器、数据库治理系统、中间件、 效劳器)能够供给负载均衡和故障切换功能,而不需要特地的存储设备。这些应用效劳并不知道数据存储方面的有关信息,比方数据实际上到底存放在什么地方、数据是否已经了镜像和分布式处理等。全部基于网络的RAID、分布式 I/O、数据冗余、配置冗余、硬盘组、规律卷、动态的多个路径、分层存储、在线的高速备份等有关的问题都由存储治理系统来处理。一个正确的 SAN 是一个能够供给高可用性、增加的敏捷性和改进的性能的根
16、底构架。SAN 能够供给一个抱负的拓扑构造来实现集群系统,因而其中一个系统的故障并不意味着所供给的效劳会发生任何中断。参与这一集群的其他一个或多个生还的结点将自动处理由故障结点所供给的应用或效劳。支持 SAN 的集群的一个优点就是在集群环境中发生故障时恢复速度快。由于数据是持续可用的,问题仅仅是由备用或协同工作的应用来访问原先由故障结点来访问的数据。在能够容忍的灾难发生之后,SAN 能够通过光纤通道从 10 公里以外供给数据。挑战 ERP 和电子商务在可用性、敏捷性和性能要求很高的大型的、支持Web 功能的 ERP 和电子商务环境中,SAN 和支持 SAN 的集群解决了一些主要的技术问题,如更
17、为敏捷的备份手段、更快的恢复、正常运行时间更长。从更高层次来看,现在具有三层或更多层构造的 ERP 和电子商务体系都向着一个方向进展,同时 Baan 公司、Oracle 公司、PeopleSoft 公司和 SAP 公司等不同厂商的系统之间还存在差异。现今全部 ERP 和电子商务应用都是支持 Web 功能的构件,就象 OLAP 构件、应用构件、数据库构件一样,在规律上是相互独立的。在应用构造适合 SAN 以后,最严峻的问题便是这些模块化的应用所访问的大局部数据都集中在一个或很少几个数据库中(数据相当集中)。在这种状况下,一般可以对数据进展复制,以支持数据仓库或是其他负载分解方式。由于这些应用支持
18、 Web 功能,使消费者能够对全球范围的用户分发他们的操作执行动作,这就使大量协同用户同时访问这些 ERP 和电子商务应用成为可能。而市场的这一趋向又带来了系统的可伸缩性问题。由于这些用户遍布世界各地,所供给的效劳就要求不能由于时间缘由而中断。这一趋势同样带来了可用性问题。随着用户以显著的速度增加,所收集和分发的数据的总量也以几何级数的速度快速增长。随之而来的便是要求对通过 ERP 和电子商务系统所收集到的数据(数据已经复制到了数据仓库)进展分析、加以分类,并通过现存的和启用的应用进展扩大,于是这又带来了与性能和速度有关的问题。全部这些因素更加明确地向构造体系提出了要求,要能够解决可用性、敏捷
19、性和性能问题。可用性(Availability)可用性是持续正常运行时间的一个衡量指标。固然,目标是 100%的正常运行时间,这说明ERP 和电子商务应用效劳没有停工时间。通过对根底构造的全部构件局部都建立冗余(即使这一冗余是明显多余的,这是完全有可能到达的。为全部冗余部件建立冗余备份的观念能够应用到SAN 中的全部硬件和软件中,如处理器、应用效劳器、中间件、DBMS 等。如今,为了实现高可用性和容错,在ERP 和电子商务应用环境中集群扮演了统治地位的角色。基于共享(如Oracle 公司的产品)或非共享(如Sybase 公司的产品)构造将两台或多台效劳器组成集群协同工作,是目前常用的方式。在这
20、两种构造中,在系统和它们的存储单元之间都有着必需的大量冗余的互连,这一问题直到 SAN 消灭才解决。随着 SAN 和基于 SAN 的集群的推出, 由于在存储系统和效劳器之间引入了一个规律/物理层,因而消退了这种连接要求。SAN 中的每一台参与集群工作的效劳器都能够访问 SAN 中的存储空间中的每一个字节,因而消退了系统和它们的存储系统之间的全部的互连需求。可伸缩性(Scalability)如今,在 SAN 中的集群配置已经到达了 32 个结点,这一数字近来还有可能上升到 128(例如,来自 Veritas Software 公司的 Veritas Cluster Server 软件)。SAN
21、这种构造体系使得在一个集群配置中包含大量的结点成为可能。随着基于SAN 的集群系统所供给的有效的负载平衡,真正的伸缩性和资源的有效利用也完全引入了 ERP 和电子商务系统。作为一种体系构造,SAN 能够为资源的有效利用铺平道路。假设一个效劳器需要使用硬盘资源,另外的存储资源就会被从网络中拖拉出来,而无须增加额外的存储子系统。假设一台特定的效劳器正严峻缺乏处理器或内存资源,应用这些资源的效劳将会转移到另一个未充分利用的系统上运行。网络延迟的可以承受的水平仅仅由SAN 中的存储资源或硬盘容量这些限制因素打算。由于存储容量的需求和数据库及应用亲热相关,因而在网络延迟可以承受的前提下,尽量往SAN 中
22、添加资源就可以解决这一问题。从理论上说,运行在 SAN 中的系统和应用的可伸缩性是无限的。网络中的全部资源能够被ERP 和电子商务(要求具有内置的智能功能)的全部构件所使用,以有效地使用可用资源。因而从长远眼光来看,这种网络就好象是一台计算机,而它的和处理器、内存相关的资源分布在多个分担结点上。SAN 中的存储和访问是集中处理的,为高级的应用机构、应用分割、故障恢复和负载均衡等供给余地。全部这些进展说明可伸缩性主要受到 SAN 中的资源的可用性的影响。假设一个特定处理中的内存消耗使得可伸缩性受到影响,这一处理就可以分布到基于 SAN 的集群系统中的两个或多个结点中并行处理。假设物理硬盘的I/O
23、 正在影响系统的可伸缩性,那么 SAN 中的基于网络的 RAID 则可以使得这一状况得到改善。假设全部的结点的使用率都已经到达了 100%,则应当考虑在集群的SAN 中增加结点,进而也应当对应用的配置也应当作出相应的调整。性能(Perfermance)假设资源需求影响到了一个特定构件的性能,这种问题可以通过将构件重部署到网络中,或是为构件在负载均衡的根底上建立冗余来解决。直到SAN 消灭,从客户机/效劳器构造方面考虑集中备份,这种跨越网络的高速备份和恢复才成为一种主要的观念。应用如今的技术,具有很多效劳器的网络中的集中备份意味着网络将会受到备份数据流的冲击和阻碍,哪怕使用最先进的压缩技术。要将
24、网络上的全部效劳器中的数据进展备份,或许要会花好几个小时。这是由于每一个备份客户端都要通过网络将数据传送到中心备份效劳器中, 而且有可能要通过广域网连接。首先由客户端机器从硬盘上读出数据,然后从网络的不同方向传送到中心效劳器上,最终由备份效劳器将它写到备份设备上。有了 SAN,SAN 中的中心备份效劳器将从存储设备读出数据,直接将它们存储到磁带、CD 光盘或者硬盘等备份设备上。由于备份和恢复都不会影响外部网络的工作状态,因而都能够在相当快的时间内完成。当进展了条带化或是镜像操作,RAID 通常能够防治因硬盘故障而造成数据丧失。由于通向冗余数据的通路丧失,位于冗余硬盘上的可用数据不能被访问到,掌
25、握器故障和连接故障问题目前仍旧没有解决。在SAN 上的存储治理中使用了规律卷治理,可以在位于网络上不同的存储子系统中的硬盘之间建立条带化和镜像操作,因而增加了可用性。由于到这一数据有多条通路可用,每次都使用最短的访问路径,这样就大大提高了 I/O 性能。同样,在SAN 中,由于物理上的I/O 分布完全不行能发生在位于存储子系统中的硬盘上,但能够被分布处理在网络上进展负载均衡,因而 I/O 性能也得到了推动。SAN 的蓝图总体上说,作为一种构造体系,SAN 格外适用于任何要求可用性、可伸缩性和性能的计算环境中,特别是那种 ERP 和电子商务应用扮演主要角色的环境中。这种类型的构造体系能够为运行于生产部门的基于事务的 ERP 和电子商务应用供给更高的可用性、增加的性能和提高的伸缩性。即使是在进展数据备份和归档,那些配备了冗余构件的效劳器彼此之间还是能够连续不断地高速访问数据。不管是数据、代码还是元数据,从底层来看它们都是数位和字节。在基于 SAN 的构造中随着规律卷治理层(位于存储效劳器端)的引入,全部这些数位和字节被冗余地存储在 SAN 中,并在需要时被访问。
限制150内