F5 电信解决方案知识分享.doc
《F5 电信解决方案知识分享.doc》由会员分享,可在线阅读,更多相关《F5 电信解决方案知识分享.doc(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Good is good, but better carries it.精益求精,善益求善。F5 电信解决方案-电信应用系统的高可用性解决方案F5(中国)有限公司2001年11月目录一.前言3二.电信应用系统概述51.电信综合业务支撑系统概述(以中国移动为例)52.电信综合业务的结构5三.电信综合业务系统现存的问题61.综合业务系统问题综述61)“不平衡”现象62)“峰值”问题63)多米诺”现象64)“N+1”方式65)“扩展”不便66)“免疫力”差77)“容灾”78)应用与网络脱节7四.F5相关技术及产品8五.解决方案131)避免“不平衡”现象132)解决因“峰值堵塞”带来的性能调整“不平衡
2、”143)避免“多米诺”现象144)更好的提供系统容错,提高系统可靠性145)“扩展”灵活156)“免疫力”强157)“容灾”168)网络感知应用,应用控制网络16六.相关技术资料191.BIG-IP提供支持99.999%的正常运行192.利用F5的BIG-IP控制器负载平衡BEAWebLogic集群流量213.利用OracleApplicationServer和BIGIP配置负载平衡22七.成功案例231.日本NTTi-Mode的应用系统F5负载均衡232.中国某某移动通信的负载均衡解决方案26八.公司简介271. 前言在现今的企业中,不论是否提供关键性任务的服务,都需要一个持续运行不断的高
3、可用性网络计算环境以维持不间断的高品质服务。所谓高可用性的环境,也是信息管理人员所必须考虑的四件事:使数据有一个安全的存储和运作方式,即使在设备故障时仍能保持数据的完整一致。2. 使服务器系统持续运行,即使发生故障仍然让服务持续下去。3. 使整个计算环境能更好的管理,如何容错、容灾、集群共享。 如何使投资有最好的效益,使系统有最佳的扩充能力,有最低的整体拥有成本,也就是在任何情况之下均能确保数据的完整一致,系统持续运行,使服务不间断,同时有最好的投资回报率。高可用性被定义为计算系统的连续运行。根据故障停机的业务影响,应用系统需要不同的可用性水平。要想实现一个应用系统的高可用性,所有组件(包括应
4、用和数据库服务器、存储设备以及端到端网络)都需要提供连续的服务。企业和机构对网络化应用及Internet的日益依赖,加上语音和数据的集成,创造了对高可用性应用的增加需求。任何类型的系统故障停机都可能意味着收入、信誉和客户满意的巨大损失。高度网络可用性的利用,企业实施高可用性网络来:防止财务损失 防止生产力损失 改进用户满意度 改进客户满意/信任 降低反应性IT支持成本,提高IT生产力 部署关键任务应用支持新业务实践的好处 典型的业务要求为了实现高度的网络可用性,需要部署下列组件:可靠的网络设备 H/W和S/W冗余及软件可靠性弹性网络技术 确保任何设备或链路故障快速恢复的功能性网络设计 定义良好
5、的网络拓扑和配置,旨在以一种优化和计划良好的方式利用网络弹性功能。最佳实践定义良好的网络部署和维护过程,以及简化这些政策实施所必需的事件和变化管理工具 全球性支持全球性积极的支持和纠错支持,可以实现抢先的快速反应维护支持 行业伙伴关系确保端到端应用可用性的技术、支持服务及最佳实践的集成一. 电信应用系统概述电信综合业务支撑系统概述(以中国移动为例)电信综合业务的结构二. 电信综合业务系统现存的问题1. 综合业务系统问题综述1) “不平衡”现象当系统完成“物理集中”后,大量的数据等待前置服务器处理。现有的方式多为采取单台或单组服务器负责处理某一组地区的用户数据。但是,由于地区发展的不平衡,人口密
6、度的差别,业务量的不同,等等这些问题造成了这些负责不同区域的服务器上的数据量大小差别很大。这样,有些服务器上数据量不大,系统资源空闲量很大,“吃不饱”,而同时,有些服务器上数据量很大,系统资源又严重不足,“被撑死”。这就是系统资源利用的“不平衡”现象。2) 为了解决这种现象,往往以增加服务器的方式增加系统资源,但仍无法利用空闲的系统资源,不能有效的解决“不平衡”现象“峰值”问题前置服务器的业务一般多为联机业务。联机业务的处理多存在“波峰”和“波谷”的变化。而且“波峰”时,业务量大小的变化又不规律,这就使前置服务器不得不面对“峰值堵塞”问题。3) 原有解决方法为增加前置服务器或主机数量,提高处理
7、能力。但仍存在性能不平衡问题,且这样做,投资成本大。多米诺”现象单台服务器的设置,不可避免会出现“单点故障”,需要进行服务器“容错”。4) 为实现容错,往往在主服务器旁安置一台或多台备份服务器。但这样做,平时只有一台服务器工作,其它服务器处于空闲状态,无法完全利用所有服务器的处理资源,投资得不到充分利用。且当出现“峰值堵塞”时,所得到的往往是“多米诺”效应,即所有服务器连续被“堵”至“死”。并且,当所有服务器都损坏时,无法动态地、合理地利用其它资源提供服务或备份。“N+1”方式这种方式也是在应对服务器“容错”时,提出的应用方式。“N”,即业务处理集群,“1”,即一台备份机。5) 我们注意到,虽
8、然存在一台备份机,随时准备对业务处理集群中的任意一台服务器进行备份,但是,如果又有服务器或更多服务器(软硬件)出现故障呢?所以“N+1”也不能很好地完成系统“容错”。“扩展”不便随着物理和应用的集中,前置服务器上所要处理的数据量(traffic)增大,客户交易产生的同时连接(concurrentconnection)数量会越来越多。 若处理资源不够,在未超出系统容量时,往往是客户的请求回应越来越慢,可容纳的同时连接数量逐渐减小,系统性能严重下降。当超出系统容量后,系统“死机”,银行业务中断。为应对日益增多的业务量,系统的扩展性尤为重要。当前所采用的扩展方式多为利用CLUSTER的方式。但这时,
9、需要配置CLUSTER卡和CLUSTER集线器。这些硬件设备成本高,投资大。CLUSTER对硬件系统存在限制。CLUSTER的容量有限。所有这些都会使系统“扩展”不便。6) “免疫力”差由于系统服务器“裸露”于网络连接中,而防火墙的安置又多在网络总入口处,所以服务器很容易受到来自各方面的“恶意性”或“无意”地攻击。7) 为每台或每组服务器单独设置防火墙,又会使系统投资加大,维护量大幅提高。“容灾”8) 随着数据中心的集中,数据中心的冗余或容错显得尤为重要。当建立备份中心或数据中心间形成备份后,在它们之间提供动态的、灵活的容错机制显得尤为突出。应用与网络脱节系统的变化随时随地都会发生,完全靠人工
10、的方式去调整网络与之适应,已经显出了其“非时时地”、“不灵活的”缺陷。如何使应用的变化动态地反映到网络的调整,已经成为现代化应用系统的一个新的课题。F5相关技术及产品5000BIG-IP5000IP应用交换机BIG-IP智能位于端口密集型硬件平台之上,可为您提供灵活、快速、安全的IP流量管理BIG-IP5000提供了一体化互联网流量管理(流量管理),在一台设备上提供了如下功能: 负载平衡 内容交换 流量管理 千兆位以太网交换 SSL加速/互联网加速 广域负载平衡从而大幅度减少了总保有成本,并为企业和服务提供商降低了管理复杂性。流量管理 屡获殊荣的BIG-IP软件具备所有先进特性和功能 为不同服
11、务器平台和应用提供静态和动态负载平衡 在线/在线控制器特性可支持额外性能、可扩充性和可靠性 两种会话故障切换方法:从在线到备份或到在线控制器 多种持续性模式 简单而先进的业务规则可确保服务质量 智能内容和应用决定可将内容请求路由到最合适的设备 独特的OneConnectTM内容交换可将带宽成本和服务器开销降低20% 支持iControl通过避免应用发生故障,使应用能够直接控制网络流量 支持屡获殊荣的广域负载平衡 实时性能监视和统计易于安装和管理最快速、最出色地进行IP流量管理支持高流量随着新企业和服务提供商应用的出现,流量管理产品必须支持大量日益增长的流量。BIG-IP5000便能够满足这一要
12、求。其它任何流量管理解决方案都不能提供如此强大的处理能力来深入检查目前和新型企业应用所需的流量。与分布式体系结构不同,BIG-IP5000能够随时将其全部处理能力应用于任何端口以制定决策。第一个集成SSL安全性的端口密集型流量管理解决方案关键任务应用要求通过互联网技术进行安全交付。BIG-IP5000是第一个集成了SSL加速的端口密集型流量管理设备。这使客户能够有效地管理通过SSL提供的企业应用,并进行先进的智能流量管理检查。从而,提供了更强大的性能,并降低了实施安全应用的成本。而且,还可以通过软件密钥增加额外SSL容量,使客户能够仅在其需要时购买SSL容量。最佳独立设备端口密度BIG-IP5
13、000提供了比其它任何独立流量管理设备更高的端口密度。4GB端口支持冗余链路和全啮合拓扑结构。24个快速以太网端口可同时方便地连接各种不同设备,包括应用服务器、防火墙、高速缓存、web服务器和VPN网关。最强大的处理能力BIG-IP5000经过专门设计,能够将2Ghz的处理能力用来进行全部智能流量处理。它能够深入检查数据包,并将现有和新型流量智能地导向正确的目的地。通过在需要时为流量提供智能和安全性,BIG-IP5000可确保为应用和基础设施提供最高可靠性和性能。集成的SSL大多数行业特别是金融行业都在利用SSL来保护其不断增长的通信和应用的安全。因此,流量管理设备必须要具备这一功能并要能够执
14、行这一任务。在所有主要厂商中,只有F5的BIG-IP5000具有100TPS(每秒处理交易数)SSL容量而且不收取任何额外费用。它还能够轻松升级,以根据需求提供更大容量。最智能、最灵活的流量管理支持99.999%正常运行时间的智能对于通过IP技术可靠地提供企业应用,领先性能和创新是负载平衡和流量管理的关键。随着互联网/内联网商业的使用率不断增长,新型数据和应用使内容管理越来越复杂。而这正是BIG-IP要解决的问题。不只是交换机的智能为了制定智能负载平衡决策和确保最高可用性,BIG-IP5000能够通过F5的开放式iControl接口直接从应用服务器(Windows2000、RealServer
15、、其它SNMP系统)接收信息。此外,它还能够读取请求包头上的详细信息(如请求内容的类型),以将请求路由最符合要求的服务器上。最快的第七层性能BIG-IP提供的第七层的快速功能为网络管理人员提供了一种经济高效的方式,可确保用户在每次通过互联网或企业内联网进行交易时将能获得轻松高效的体验。*参考报告#200204链路集合故障切换BIG-IP支持工业标准802.3ad,以支持链路集合,从而确保获得最大的吞吐量,并使您系统的每个端口都获得出色的可用性。3-DNS广域负载平衡为BIG-IP添加业界最出色的广域负载平衡器,支便将服务器负载平衡和全局负载平衡集中在同一机柜中,从而简化了管理、减少了机架空间的
16、占用率,并且降低了能耗。VLAN和TaggedVLANVLAN(虚拟局域网)允许网络被分为多个独立的局域网来管理。BIG-IP支持大多数现代交换机所使用的熟悉的VLAN体系结构,在改变网络拓扑结构时提供更大的灵活性。BIG-IP5000规范:服务器/节点操作系统兼容性:任何TCP/IP操作系统,包括WindowsNT、Windows95,所有UNIX平台和Mac/OS互联网/企业内联网协议支持:所有TCP服务、UDP和SSL;几乎所有基于IP的协议管理环境支持:DNS代理、SMTP、F-secureSSH、SNMP、动态/静态网络监视、预定批作业处理、系统状态报告和告警事件提示网络管理和监视:
17、基于安全SSL浏览器的接口、利用F-secureSSH监视器进行远程加密登录和文件传输、BIG-IP系统网络监视工具及附加实用软件;SNMP“get”命令与陷阱路由协议:RIP、OSPF、BGP解决方案如前所述电信应用系统出现的问题,经过认真的分析,结合F5在电信业多年的经验,利用F5的流量管理设备提供良好的解决方案。1) 如下图所示,在前置服务器或中间业务科服务器前放置两台BIGIP,利用其流量管理特性解决前面的问题。避免“不平衡”现象如果能够充分利用所有的服务器资源,将所有流量均衡的分配到各个服务器,我们就可以有效地避免“不平衡”现象的发生。 BIGIP是一台对流量和内容进行管理分配的设备
18、。它提供12种灵活的算法将数据流有效地转发到它所连接的服务器群。而面对用户,只是一台虚拟服务器。用户此时只须记住一台服务器,即虚拟服务器。但他们的数据流却被BIGIP灵活地均衡到所有的服务器。这12种算法包括:轮询(RoundRobin):顺序循环将请求一次顺序循环地连接每个服务器。当其中某个服务器发生第二到第7层的故障,BIGIP就把其从顺序循环队列中拿出,不参加下一次的轮询,直到其恢复正常。 比率(Ratio):给每个服务器分配一个加权值为比例,根椐这个比例,把用户的请求分配到每个服务器。当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分
19、配,直到其恢复正常。 优先权(Priority):给所有服务器分组,给每个组定义优先权,BIGIP用户的请求,分配给优先级最高的服务器组(在同一组内,采用轮询或比率算法,分配用户的请求);当最高优先级中所有服务器出现故障,BIGIP才将请求送给次优先级的服务器组。这种方式,实际为用户提供一种热备份的方式。 最少的连接方式(LeastConnection):传递新的连接给那些进行最少连接处理的服务器。当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。 最快模式(Fastest):传递连接给那些响应最快的服务器。当其中某个服务
20、器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。观察模式(Observed):连接数目和响应时间以这两项的最佳平衡为依据为新的请求选择服务器。当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。 预测模式(Predictive):BIGIP利用收集到的服务器当前的性能指标,进行预测分析,选择一台服务器在下一个时间片内,其性能将达到最佳的服务器相应用户的请求。(被BIGIP进行检测) 动态性能分配(DynamicRatio-APM):BIGIP收集到的应用程序和应用服
21、务器的各项性能参数,动态调整流量分配。 动态服务器补充(DynamicServerAct.):当主服务器群中因故障导致数量减少时,动态地将备份服务器补充至主服务器群。 服务质量(QoS):按不同的优先级对数据流进行分配。 服务类型(ToS):按不同的服务类型(在TypeofField中标识)对数据流进行分配。2) 规则模式:针对不同的数据流设置导向规则,用户可自行编辑流量分配规则,BIGIP利用这些规则对通过的数据流实施导向控制。解决因“峰值堵塞”带来的性能调整“不平衡”当出现流量“峰值”时,如果能调配所有服务器的资源同时提供服务,所谓的“峰值堵塞”压力就会由于系统性能的大大提高而明显减弱。3
22、) 由于BIGIP优秀的负载均衡能力,所有流量会被均衡的转发到各个服务器,即组织所有服务器提供服务。这时,系统性能等于所有服务器性能的总和,远大于流量“峰值”。这样,即缓解了“峰值堵塞”的压力,又降低了为调整系统性能而增加的投资。避免“多米诺”现象4) BIGIP将所有的服务器组织在一起提供服务,流量压力合理地分担到各个服务器,不会使服务器如同单台设备工作时出现“多米诺”现象。当本地服务器群中的服务器数量不能满足系统要求时,BIGIP会利用“动态服务器补充”功能自动调入服务器补充系统性能。并且即使当所有服务器都不能提供服务时,“Redirect”功能会把用户数据请求转发到“备份”点,满足系统的
23、可靠性要求。更好的提供系统容错,提高系统可靠性“N+1”方式因备份服务器的数量少而不能有效的提供系统容错能力。BIGIP将用户的服务请求均衡到所有的服务器。服务器群中的任何一台或多台设备发生故障后,用户的服务请求被均衡到其它服务器。而且,当本地服务器群中的服务器数量不能满足系统要求时,BIGIP会利用“动态服务器补充”功能自动调入服务器补充系统性能。如何有效地确定服务器、应用、内容的状态,使提高系统可靠性的关键。BIGIP利用其独到的、高效的“健康检测”手段,识别服务器、应用、内容的状态。它们包括: 服务器逻辑连接状态检测 应用类型状态检测 扩展内容查证(ECV:ExtendedContent
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- F5 电信解决方案知识分享 电信 解决方案 知识 分享
限制150内