基于IPMI的智能集中监控系统的设计与实现.doc
《基于IPMI的智能集中监控系统的设计与实现.doc》由会员分享,可在线阅读,更多相关《基于IPMI的智能集中监控系统的设计与实现.doc(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于IPMI的智能集中监控系统的设计与实现The design and Implementation of intelligent centralized monitoring system which based on IPMI摘要:空管自动化系统是空中交通管制的指挥核心,设备维护人员必须及时有效掌握自动化系统设备运行状态,排除设备存在的安全隐患。本文针对空管自动化系统地理位置分散、软硬件差异大的特点,设计并实现了一套基于IPMI技术的智能集中监控系统。该系统充分利用了IPMI技术独立于系统软硬件的特点,使用现有自动化系统的网络资源,实现了对自动化系统中不同软硬件架构的服务器的集中监控。该系
2、统的使用,对于减轻设备维护人员的工作强度、提高系统安全余度,能取得很好的效果。关键词:空管自动化系统;集中监控系统;IPMI空管自动化系统是现代化空中交通管制的指挥核心,是信息汇聚、处理和分发的中心。它利用多种处理技术对雷达数据、ADS数据、电报数据进行实时分析、处理、加工、融合,为空中交通提供一个大范围内的已经融合处理好的实时空中交通动态场景,以帮助管制员维持快速、安全、高效的空中交通秩序。然而,对于空管自动化系统的维护人员而言,自动化系统有效的统一管理一直是个难题。面对为数众多、地理位置分散、软硬件架构不同的空管自动化系统,设备维护人员为了掌握各个子系统的工作情况,及时发现异常情况,通常需
3、要在值班期间不厌其烦的到现场一台台的检测。虽然在网络出现以后,值班人员可以通过网络远程登录到各个工作站和服务器上,通过远程管理各个子系统。但面对数量众多、涉及多个硬件平台和操作系统的空管自动化系统而言,非常的繁琐和复杂。特别是近年来,随着航班流量的日益增长,管制席位的数量也不断的增加,这不仅增加了设备维护人员的工作量,也使得设备维护人员出错的几率大大增加,对于民航飞行安全而言也是一种隐患。为此,本文设计并实现了一个跨越多个硬件平台和操作系统的智能管理系统基于IPMI的智能集中监控系统,为维护人员对自动化系统的集中监控和管理带来了方便。1. IPMI技术介绍IPM I ( Intelligent
4、 Platform Management Interface)是由Intel、HP、Dell、NEC四家公司制定的一套跨平台管理和监控服务器工作状态的接口规范。其目的是为了让系统管理员能够在单一的控制台上实现对不同软、硬件平台的服务器进行监视和管理。通过IPMI规范,系统管理人员可以有效的对服务器内部的电源、风扇、CPU、内存、硬盘等各个部件的工作状态进行监控。其独特之处在于,IPMI规范采用了基板管理控制器BMC(Baseboard Management Controller),在完全单独的芯片上实现,独立于CPU、BIOS和操作系统,只要服务器的主板接通电源,不管服务器的状态如何,都可以提
5、供远程检测、管理和恢复功能,从而协助系统管理人员迅速诊断系统故障的原因,在尽可能短的时间内重新恢复工作1。IPMI实现控制和管理的核心是实现在独立芯片上的基板管理控制器。BMC的职责在于提供了一个系统底层硬件和上层管理软件交互的中间层。通过采集各个传感器信息并转换为相同的消息格式发送给不同的控制器和管理软件,同时把从系统内部总线、网络、串口、调制解调器等不同信息通道接收的控制命令发送给相应的控制器,从而实现在异构软、硬件平台上的远程管理2。IPMI的系统整体架构如图1所示:图1、IPMI的系统整体架构图可以看出,整个IPMI除了有BMC系统核心外,还有SDR、SEL、FRU、ICMB、IPMB
6、子系统构成。SDR(Sensor Data Record)传感器数据仓库包含了系统中所有传感器的信息,在每个单独的SDR中包含了把传感器读数转化为标准单位的公式和系数。BMC通过SDR得到传感器的位置、类型、门限等一系列信息。这些数据可以不通过CPU和BIOS而自由存取。IPMI会将采集到的CPU状态信息、风扇转速信息、温度信息等信息作为系统事件日志存储到SEL(System Event Log)中。使得系统管理员能够对系统历史状况有一个全面的了解,从而让系统管理员更容易定位系统的故障点和故障隐患。IPMI还支持FRU (non-volatile Field Replaceable Unit)
7、的存储与访问。系统可以将存在于主板上的各个系统组件的信息存储到FRU当中。这些信息包括设备序列号、部件号、型号、资产标签等等。这样就相当于拥有了一份各个系统组件的配置资料,即使管理员是通过远程访问该主机,也能够立即掌握主机内各个部件的详细信息。IPMI标准为了实现跨平台系统的管理,提供了IPMB(Intelligent Platform Management Bus)接口和ICMB(Intelligent Chassis Management Bus)接口。分别和不同服务器之间的通讯。IPMB基于I2C标准实现,用于实现主板上不同组件之间的通信。ICMB接口则主要用于实现不同服务器之间的通信。
8、通过IPMB和ICMB接口,IPMI标准真正实现了对软、硬件异构的系统的访问和管理3。2. IPMI的SOL消息接口空管自动化系统中执行不同任务的主机通常也处于不同的地理位置,且相距较远,所有主机都仅能通过远程网络进行通信。为了能远程集中监控处于不同地理位置的主机,我们必须有一种手段能够通过网络监控主机的运行状态,并修复操作系统和BIOS的异常,IPMI的SOL消息接口则正好为我们提供了这样一种手段。SOL是Serial Over Lan的缩写,它提供了一种机制,可以将基于IP网络的UDP消息重定向到本地串口,而且这种重定向是基于BMC实现的,完全独立于操作系统和BIOS。当系统发生故障时,系
9、统管理人员就可以通过串口进行BIOS、操作系统的相关配置,从而修复系统。由于SOL完全基于BMC实现,因此,当系统正常运行时,我们也可以通过SOL访问BMC,从而进一步获取主机上各个部件的运行状态,达到远程监控的目的。SOL消息被设计成RMCP+协议的一种负载。RMCP(Remote Management Control Protocol)是一种简单的应答协议,它完全基于IP网络的UDP包实现,IPMI中所有的LAN消息都是通过RMCP包传输的。RMCP+是基于RMCP协议的一种扩展,它完全兼容RMCP包,并扩展了RMCP的认证、加密和发现功能4。一个标准的RMCP+包如表1所示:表1、RMC
10、P消息格式字段字节数描述版本106h保留位100h序列号1可变消息类型17RMCP ACK0通用RMCP消息1RMCP ACK消息6:5保留4:0消息类型0-5保留6ASF7IPMI8OEM其他位保留数据可变长度基于消息类型的附加数据IPMI消息被封装为RMCP包并最终被封装成以太网帧通过IP网络发送,具体的封装结构如图2所示:图2、RMCP帧封装结构由于IPMI必须适应异构软硬件结构上的差异,所以IPMI采用了基于消息的信息传递机制实现各个子系统之间的通信。采用消息式的通信机制能够有效的屏蔽不同硬件之间通信的差异,IPMI消息通过BMC的转换变换为对应的物理信号发送给各个子系统,同时BMC又
11、将收集到的不同的物理信号变换为结构相同的IPMI消息发送给不同管理软件或其它的BMC,从而有效的实现了异构软硬件平台上的信息传递。IPMI中所有的消息都采用相同的格式,一组典型IPMI请求/响应如下图3所示:图3、IPMI请求/响应消息结构其中,IPMI消息帧中各个域所包含的内容如表2所示:表2、IPMI消息帧中各个域对应的内容rsAddrrqAddrrsAddr/rqAddr域表示请求/响应的地址。长度为1Byte。当该字节的最低位为0时表示请求/回复响应的组件的地址码,当最低位为1时表示请求/回复响应的软件ID。该字节的高7位表示具体的地址码和软件ID。当BMC作为请求/响应者时该字节为2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 IPMI 智能 集中 监控 系统 设计 实现
限制150内