项目基本情况介绍.doc
第 1 页 共 29 页 1 项目项目基本情况介绍基本情况介绍 1.1 项目名称项目名称 天津滨海农商银行股份有限公司一体化运维项目(一期)。 1.2 项目背景项目背景 随着天津滨海农商银行(以下简称我行)信息系统建设的不断深化、业 务系统数量不断增加, 同城两地数据中心及其相关的 IT 基础设施软硬件资源运 维压力持续增大。为切实推进我行一体化运维体系的建设与落地,降低系统运行 维护面临的风险、提升运维工作效率,现筹建一套行之有效的一体化运维管理系 统。建立健全我行运维监控信息化管理体系,并将我行现有及未来筹划建设的一 体化运维相关系统有效整合,促进一体化运维管理水平的持续提升,达到风险提 前预防、故障及时发现,最终提升我行系统运维能力、降低运维成本的目的。 2 项目采购范围项目采购范围 项目采购内容:一体化运维平台管理软件,一套。 系统功能包括: 1、统一巡检标准 通过项目建设,规划巡检实现方式,统一巡检的作业规范,为现有巡检的运 维提供标准和依据,为未来新建应用系统提供巡检的开发规范指导,为快速发展 的业务规模奠定坚实的技术基础。 2、资源监控 通过项目建设,建立物理设备资源的集中实时监控,可以从根本上提高监控 的实效性和及时性,为快速定位故障提供标准和依据。 3、自动巡检 运用自动化巡检工具替代人工检查操作,从根本上解决人为误操作和遗漏操 作的风险,排除因人为失误可能引发的系统故障风险。同时,通过一个集中管理 平台进行巡检操作管理,将用户、密码进行有效隔离,提高系统安全性;解决因 人工参与带来的系统安全隐患。 4、集中监管 通过项目建设,建立集中监控、统一管理的平台,对分布在不同环境中的各 相关监控系统进行整合实现集中管理。操作人员不再需要 Telnet 到不同的 IP 地 址处理业务,仅需要在一个平台里监控巡检执行情况,管理人员也可以通过一个 统一的监控界面了解所有巡检的运行情况,实现真正意义上的集中操作管理。 5、电子化工单 建立运维日常事件工单管理流程与运维知识库,提升运维管理工作信息化与 科学化的管理手段。 6、报表与审计 通过项目建设,巡检执行信息全面真实记载,统计报表实时丰富呈现,充分 满足管理和审计要求。 3 技术要求技术要求 3.1 业务范围业务范围 3.1.13.1.1涉及部门涉及部门 本项目所涉及的范围为信息科技部。信息科技部运维人员通过使用一体化监 控运维平台实时掌握我行业务与 IT 系统运行情况,及时响应事件、解决问题并出 具故障报告。系统开发人员通过运维管理驾驶舱分析监控报告,掌握业务及 IT 系 统健康状况,进行针对性的改造、优化。 3.1.23.1.2主要用户主要用户 主要用户:总行信息技术部人员。 3.1.33.1.3用户类型用户类型 本系统设以下用户类型: 1. 应用系统管理员:主要负责通过一体化运维平台对巡检进行监控和处理, 保障信息系统的稳定运作。 2. 一体化运维平台管理员:主要负责一体化运维平台的配置管理、参数管 理、用户管理、日志审计等工作。 3. 操作维护员:主要负责通过一体化运维平台进行各信息系统的巡检监控。 4. 高级管理人员:主要通过一体化运维平台查看巡检完成情况,获取统计 分析报表进行管理决策等工作。 3.1.43.1.4项目实施范围项目实施范围 一体化监控运维平台须集成或补充开发的范围包括:运维中心管理驾驶舱、 应用级监控、网络监控、硬件监控、灾备监控、一键式巡检管理、批量自动化 管理、审计平台、数据中心动环监控、数据分析统计、知识库管理和操作事件 管理模块等。以及对整合后系统界面的布局建设、全面的信息展示、美观简洁 的界面与易用性的提升。 3.2 功能需求功能需求 3.2.13.2.1平台功能需求简述平台功能需求简述 需求名称需求名称需求内容简述需求内容简述功能名称功能名称 支持现阶段使用的各监控系统单点登录,统一登录入口。 一体化运维整合各接入平台的子系统 整合后界面美观、布局合理、展示全面。 支持图形化巡检流程设计,提供简单的拖拉拽的方式实现基本的 流程绘制。 巡检流程设计支持复杂逻辑结构功能,如顺序执行、分支执行、 循环执行等,以适应不同场景的巡检需求。 巡检流程设 计 支持根据巡检需求对不同 场景的巡检进行规划、设 计并形成标准巡检流程。 巡检流程设计支持函数调用功能,具备扩展能力。 巡检需支持主流平台,包括 Windows、AIX、Solaris、HP- UNIX、Linux 及虚拟设备等。 支持对操作系统、信息系统、网络、数据库、中间件的巡检。 支持一键式巡检功能。 支持个性化巡检定制。 支持多级别报警。 支持自定义巡检频率,并可定制特殊巡检时间。 巡检 实现主流操作系统的巡检、 兼容其他巡检平台。 支持巡检脚本的自动下发与更新。 支持执行以 shell 命令为基础的巡检操作。 具备 B/S 类作业接口,支持 B/S 模式模拟登录、模拟请求巡检。 提供 Ftp 的各项操作。 提供操作文件的各项操作。 提供 ssh、telnet 的各项操作。 调度接口 具备丰富接口,以满足对 各种类型的巡检操作 提供解析和格式化文本的各项操作。 提供巡检集中展示监控页面,以图形化方式显示巡检状况,所有 业务系统的巡检情况一目了然。 提供多种方式的巡检异常报警方式,包括弹出报错信息、调用集 中监控平台发送报警信息等方式。 支持多平台巡检结果集中展示。 巡检监控管 理 支持巡检集中监控管理功 能 支持高级管理人员按照多种分类,总览巡检情况。 电子工单、 运维知识库 具备电子工单流程和运维 知识库功能 提供运维日常事件工单管理流程与运维知识库,提升运维管理工 作信息化与科学化的管理手段。 报表统计功 能 具备巡检报表功能 提供巡检日报,月报功能,统计分析巡检结果形成曲线图、柱状 图等。 提供用户登录记录,操作记录。 系统需支持以日志的形式记录系统的运行情况。 系统需支持以日志形式记录巡检的执行情况。 支持应用日志配置功能,设置哪些操作需要记录日志。 安全性管理 具备系统安全机制,满足 审计要求 支持用户管理、角色管理和权限管理,用户敏感信息需加密处理。 支持主流厂家硬件设备监控,如:小型机、X86 服务器、存储设 备、光纤交换机及磁带库等。 平台基于 JAVA 开发,采用标准 J2EE 体系结构。 支持 B/S 架构 支持部署在主流操作系统,包括但不限于 Linux、Windows 等系 统。 支持主流数据库,例如:Oracle、SQL Server、Mysql 等。 平台应采用分布式架构搭建,具有良好的扩展性。 总体技术要求 支持标准的 SSO 及 portal 门户技术,方便实现系统间集成。 可视化管理门户 服务器监控 文件系统监控 数据库监控 中间件监控 存储阵列监控 光纤交换机监控 磁带库监控 拓扑管理 告警管理 报表管理 资源(软件 和硬件)监 控 监控功能 用户管理 3.2.23.2.2具体功能描述具体功能描述 1、一体化运维一体化运维 业务需求 1:支持兼容其他巡检、监控系统 1 目标:能够兼容其他巡检监控系统,统一管理形成标准规范。 关键要求: 详细的描述 在已有实施案例中,成功通过接口与其他巡检监控系统(如集中监控平台、审计平台、网络监控平 台等)实现兼容,并且可对已有巡检脚本进行调度,形成标准化、规范化的巡检范本。支持我行现 有监控系统统一单点登录功能。 影响要素 业务需求 2:整合后界面美观、布局合理、展示全面 2 目标: 整合后界面需美观、布局合理、展示全面,具有美观性与易用性。 关键要求: 详细的描述 平台采用主流的前端页面框架,结合美观、简洁的页面样式,使整体界面布局整洁、全面,方便用 户操作与查看。 影响要素 2、巡检流程设计巡检流程设计 业务需求 3:图形化流程设计 3 目标:提供流程设计组对巡检要求进行分析和设计。 功能包括新建、打开、应用、保存、另存为、关闭、删除、退出、引入工程、语法检验、上载、下 载、打包、解包等功能。 关键要求: 详细的描述 1、提供巡检流程模板定制功能,可根据操作系统或巡检特点进行分类,针对不同操作系统进行具体 流程框架的设计并形成范本。对该定制的工程进行打包存储形成流程的基本模板。 2、提供巡检流程模板应用功能。 3、提供巡检流程图形化设计功能,通过拖拽方式可完成作业流程设计。 4、提供巡检流程版本控制,同一巡检流程在改造时产生不同的版本,需要对每一工程版本进行管理。 影响要素:无 业务需求 4: 流程设计提供复杂逻辑结构功能 4 目标:提供复杂结构功能模拟现实巡检操作。功能包括顺序结构、循环结构、并发结构、分支条件、 前置条件、后置条件、监控活动等功能。 关键要求: 详细的描述 1、作业执行有前后继关系:后继作业的执行需要前继作业的输出结果, 利用顺序结构对作业的执行 先后顺序进行排序。 2、作业执行需要并行关系:多个作业可以在同一时间运行,利用并行结构控制几个批量作业并发执 行。 3、作业执行需要循环执行:相同的作业需要执行多次,利用循化结构控制批量作业能执行多次。 4、作业执行需要触发条件:需要在满足特定条件下才执行作业,利用分支条件、前置条件、后置条 件对特定条件进行判断。 5、作业执行需要其它并行活动做支撑:一个作业的执行需要在监控到其它关键活动执行到某一阶段 后才可以运行。利用监控活动对并行中关键活动的运行状态进行监视以判断本分支活动是否执行。 6、支持复杂条件判断。 影响要素 业务需求 5:巡检流程设计支持函数调用功能 5 目标:提供复杂的函数调用功能以满足本系统的扩展需要。功能包括内部函数、外部函数等功能。 关键要求: 详细的描述 1、巡检流程中可能涉及到复杂的逻辑计算。利用系统提供的内部函数功能,可以对特定的复杂逻辑 进行定制封装成内部函数以供重用。 2、外部系统通信:利用系统提供的外部函数功能,可以对其它系统平台提供的标准接口进行调用以 实现系统间的通信,支持与集中监控平台等系统通信。 影响要素 3、巡检功能、巡检功能 业务需求 6:支持主流平台 6 目标: 实现对各种平台信息系统的巡检,以及虚拟化设备。 关键要求: 详细的描述 可以在主流平台上如 Windows、AIX、Solaris、HP-UNIX、Linux、中标麒麟等实现自动化操作。 影响要素 业务需求 7:支持操作系统、应用系统、网络、数据库、中间件的巡检 7 目标: 实现多样化巡检需求,支持对操作系统、应用系统、网络、数据库、中间件的巡检。 关键要求: 详细的描述 1、实现对操作系统巡检、应用系统、中间件巡检、数据库巡检、网络设备巡检等巡检。 2、提供操作系统类的巡检,如 CPU、内存、磁盘空间、进程、网络通断性、端口、系统日志分析 等常规巡检以及个性化巡检需求。 3、提供应用系统个性化巡检,如业务交易量统计、应用系统日志分析、应用系统进程健康度、文件 到达检查等巡检。 4、提供网络设备、防火墙的巡检,如交换机 CPU 使用率、内存使用率、日志分析、板卡状态等常 规巡检和个性化巡检需求。 5、提供常用数据库(DB2、Oracle、mysql、Informix 等)的巡检,如数据库日志、表空间检查、 数据库连接数检查、表状态检查等常规巡检和个性化巡检。 6、提供中间件(WAS、MQ、CICS、Weblogic 等 )的巡检,如进程、队列深度、队列通道、队列 管理检查等常规巡检和个性化巡检需求。 影响要素 业务需求 8:支持一键式巡检功能。 8 目标:能够一键式巡检,自动化执行巡检、形成巡检结果。 关键要求: 详细的描述 巡检流程可按一定周期执行或者触发执行,执行完成后,自动生成巡检结果报表。一次性完成操作 系统巡检、应用系统巡检、数据库巡检和中间件巡检。 影响要素 业务需求 9:支持个性化巡检定制。 9 目标:能够实现客户提出的个性化巡检需求。 关键要求: 详细的描述 可根据需求增加个性化巡检项,功能灵活。 影响要素 业务需求 10:支持多级别报警。 10 目标:出现问题时可根据报警级别,采取相应的处理方案。 关键要求: 详细的描述 提供检查点的多级报警配置,每个检查点可自定义多个基线和报警级别,巡检时根据基线对应的报 警级别发送报警。管理人员可根据报警级别选择处理方案。 影响要素 业务需求 11:支持自定义巡检频率,并可定制特殊巡检时间。 11 目标:能够根据巡检内容的不同,配置较高的巡检频率和特殊时间点的巡检。 关键要求: 详细的描述 1、提供检查点巡检频率的配置,巡检流程按照执行频率自动触发巡检,完成系统例行检查,应用系 统巡检等操作,减少管理人员重复性操作,提高工作效率。 2、提供对每个检查点巡检频率设置,配置后下次巡检立即生效,无需重启巡检流程。 3、提供每个检查点例行巡检时间的设置,可配置按每日、按指定星期、按指定日期、按指定时间点 的特殊时点巡检要求。 影响要素 业务需求 12:支持巡检脚本的自动下发与更新。 12 目标:能够自动化管理巡检脚本,无需人工部署更新脚本。 关键要求: 详细的描述 1、提供巡检脚本自动下载功能,巡检流程在每次巡检前会判断本次巡检所需的巡检脚本,若当前服 务器缺少某巡检脚本,巡检流程会主动到指定的文件管理服务器下载相应的脚本。 2、提供巡检脚本自动更新功能,巡检流程在每次巡检前会判断本次巡检中是否有高版本的脚本,若 发现有高版本的脚本,巡检流程会主动到指定的文件管理服务器下载最新版的脚本进行更新。 影响要素 业务需求 13:调度服务器具备集群功能 13 目标: 调度服务器支持集群,能实现作业的负载均衡。 关键要求: 详细的描述 1、调度服务器可组建集群模式。 2、集群内服务器自动均衡负载所有投产作业的运行。 3、集群内服务器故障时,其它服务器可自动无缝接管故障服务器上的作业。 影响要素 4、调度接口、调度接口 业务需求 14:调度接口丰富性 14 目标:调度接口丰富,可以支持各类设备的巡检:包括网络设备、存储设备、小型机、虚拟机等。 关键要求: 详细的描述 平台提供以下接口: 1、 ShellCmd 接口:执行以 shell 命令为基础的巡检脚本。 2、 Http 接口:支持 B/S 模式模拟登录,模拟请求的巡检。 3、 Ftp 接口:提供 Ftp 的各项操作。 4、 File 接口:提供对文件系统的各项操作。 5、 SSH 接口:提供以 ssh 方式连接访问的方式,执行指令进行巡检。 6、 Telnet 接口:提供以 telnet 方式连接访问的方式,执行指令进行巡检。 影响要素 5、巡检监控功能、巡检监控功能 业务需求 15:提供巡检集中监控展示页面,显示巡检结果。 15 目标:方便查看巡检情况,所有巡检结果一目了然,对于异常巡检点,能及时报警。 关键要求: 详细的描述 1、能够通过报表和图形化方式显示巡检执行情况,对于异常情况能够及时报警,实现巡检实时监控。 2、能够通过列表查看所有业务系统的巡检状态,对业务系统巡检情况一目了然。 3、通过二维表的方式,查看某业务系统内的全部巡检项与各设备的对应关系。能够快速定位异常巡 检项所处的设备 IP。 4、对于中大型集群应用系统,可以总览某巡检项在所有设备的巡检结果,能够快速定位集群内存在 异常的服务器,减少排查工作量。 5、提供直观的图形化展示方式,对巡检结果进行统计分析形成柱状图或曲线图,直观的查看变化趋 势。 影响要素 业务需求 16:提供多种方式的巡检异常报警方式,包括弹出报错信息、调用集中监控平台发送报警信息 等方式。 16 目标:实现巡检异常的多种报警方式。 关键要求: 详细的描述 提供具有多种方式的异常报警方式,包括平台自身弹出报错信息,同时通过标准 API 接口、格式文 件、数据库访问等方式,实现与各种外部系统,可以以短信、微信、邮件等多种方式报送错误信息。 影响要素 业务需求 17:支持多平台巡检结果集中展示 17 目标: 实现对多监控平台巡检结果的集中展示。 关键要求: 详细的描述 根据我行巡检实际需要定制巡检报告,满足将巡检结果转换成统一的标准化、规范化的巡检结果进 行集中展示的要求。 影响要素 业务需求 18:支持高级管理人员按照多种分类,总览巡检情况。 18目标: 能够按照应用系统类别、报警级别统计总览巡检情况。 关键要求: 详细的描述 通过对历史巡检信息的统计分析,可以按照系统类别对行内所有业务系统的巡检结果进行统计,形 成统计报表。高级管理人员能够直观的查看到总体巡检情况,以及各业务系统的详细巡检情况。同 时可以对业务系统的报警次数、报警级别进行统计,查看报警的总体分布情况和详细情况。 影响要素 6、运维工单与知识库、运维工单与知识库 业务需求 19:提供运维电子工单管理流程 19 目标:建立运维日常事件电子工单管理流程,满足事件跟踪与管理要求。 关键要求: 详细的描述 1、提供运维日常事件发起、指派、处理、反馈、监督一系列规范化电子流程。 2、满足事件管理不同维度的监管需要。 影响要素 业务需求 20:提供运维知识库功能 20 目标: 逐步建立起知识库,为一体化运维平台提供标准化、规范化、可复用的技术支持。 关键要求: 详细的描述 1、支持知识库管理功能。 2、支持知识库关键字索引功能,可以实现事件处理过程中对现有知识库的检索。 影响要素 7、报表统计功能、报表统计功能 业务需求 21:提供巡检日报,月报功能,统计分析巡检结果形成曲线图、柱状图等。 21 目标:实现各种作业报表统计分析功能,为管理提供决策依据。 关键要求: 详细的描述 1、支持巡检的历史数据查询。 1)所有巡检结果信息都存储在数据库或数据文件中,包含巡检时间、检查点信息、巡检结果、检查 对象等,并汇总各个检查点的异常情况,显示到查询页面。 2)可以选择某个业务系统下指定设备的检查项,根据历史时间条件,查询时间段内各检查点巡检情 况,包括检查点明细、执行时间、巡检时间、结束时间、报警等级、并根据检查结果汇总统计平均 值、最大值、最小值等历史数据查询信息。 2、提供常见业务类报表,主要包括: 1)健康巡检日报,提供每日多时点的巡检报表,用于掌握服务器和业务系统健康情况。主要包括系 统名称、报表时间、设备 IP、检查项、检查点、巡检结果、检查对象等信息。并对不同报警级别的 巡检结果使用不同颜色进行标记。 2)巡检月报汇总统计报告,提供按系统、按时间、按检查点对巡检情况的统计分析报表,用于分析 系统健康曲线。主要包括巡检结果、平均值、最大值、最小值等信息。 3、提供报告导出功能,格式为 Excel,并提供二次报表开发能力。 影响要素 8、安全审计功能、安全审计功能 业务需求 22:提供用户登录记录,操作记录。 22 目标:提供用户登记功能和用户操作记录功能,为安全审计提供参考依据。 关键要求: 详细的描述 1、支持用户登记功能。 系统记录了每个用户 ID 的登录时间与退出时间,并计算每次登录后的在线时长,并可导出成 Excel 格式文件,为安全审计提供参考依据。 2、提供用户操作日志功能 系统记录了每个用户 ID 的操作轨迹,当用户处理报警时,系统记录了用户处理报警的时间,以及用 户的处理意见或处理方法,为事件排查、安全审计提供参考依据。 影响要素 业务需求 23:系统需支持以日志的形式记录系统的运行情况。 23 目标:系统日志支持安全审计 关键要求: 详细的描述 1、系统日志详细记载巡检流程、巡检任务的执行情况,人工参与情况及异常处理信息。 2、系统日志详细记载了每个资源(工程和接口)的上传、下载、启用过程以及操作用户。 3、系统日志还包含系统平台本身执行情况,包括版本、补丁发布升级信息、平台故障、网络故障等 详细信息。 4、系统日志记载的信息可以查询、导出并作为详细的分析记录,支持安全审计功能。 影响要素 业务需求 24:支持应用日志配置功能。 24 目标: 设置哪些操作需要记录日志。 关键要求: 详细的描述 1、提供设置界面,根据用户选择生成日志产生规则,当批量作业正常执行、用户操作、异常处理等 产生必要的日志信息。 2、应用日志包括: 1)流程启动、暂停、继续、终止、完成等。 2)任务开始、结束、异常、人工参与等。 3)资源(工程、接口)上传、下载、删除等操作。 4)用户登录、退出,系统日志等其它辅助日志设置。 影响要素 业务需求 25:支持用户管理、角色管理和权限管理 25 目标:管理系统所有用户、角色,实现权限分配 关键要求: 详细的描述 1、添加用户或角色。即填写用户或角色相关信息,登陆 ID、密码等。 2、为用户或角色分配操作权限,例如:上载、下载、删除工程的权限,工作流的启动、暂停、终止。 当许多用户具有相同操作权限的时候,用户管理员可以将用户添加到角色下面,这个用户就继承了 该角色的权限。 影响要素 9、资源(软件及硬件)监控、资源(软件及硬件)监控 业务需求 26:总体技术要求 26 目标: 全面覆盖(不仅限于)本行各数据中心环境中操作系统、数据库、中间件及小型机、X86 服 务器、存储、光纤交换机、一体机、磁带库等设备,并且监控平台拥有自主知识产权。 关键要求: 详细的描述 1、小型机、X86 服务器、存储、光纤交换机及磁带库等设备 7*24 小时监控。 2、平台基于 JAVA 开发,采用标准 J2EE 体系结构。 3、支持 B/S 架构。 4、支持部署在主流操作系统,包括 Linux、Windows 等。 5、支持主流数据库,如 Oracle、SQL Server、Mysql 等。 6、平台应采用分布式架构搭建,具有良好的扩展性。 7、支持标准的 SSO 及 portal 门户技术,方便实现系统间集成。 影响要素 业务需求 27:可视化管理门户 27 目标: 自定义管理页面 关键要求: 详细的描述 1、支持不同用户能够按照自己的工作内容、使用习惯进行门户的排版展现。 2、界面排版支持手工布局。 3、门户系统支持 B/S 方式访问,即,在浏览器中输入相应地址就能打开门户系统。 4、提供开放接口,支持与第三方系统进行 portal 集成。 影响要素 业务需求 28:服务器监控 28 目标: 服务器监控 关键要求: 详细的描述 1、操作系统:支持 windows、Linux、IBM AIX 系列、Free/Open BSD、SCO UNIX 等各版本操作 系统; 2、服务器硬件:支持 IBM、浪潮、华为、HP 等厂家 X86 服务器、IBM、HP 等厂家小型机; 3、主机视图管理: 提供主机、机柜的逻辑与物理视图,集中监控全部主机,能直观看到各点是否存在故障及报 警; 单台提供一个管理界面,方便的监控和管理服务器的性能、告警、配置信息; 对于有负载均衡的机器,提供负载均衡的链路逻辑视图及各节点的配置信息、物理主机信息 等; 最好能支持主机面板远端图形显示。 4、主机连通性管理: 提供直观的图形,显示主机各部分是否存在连通性方面的故障。 5、主机运行状况监视管理: 提供监视主机的状态、网卡状态、机器温度和性能指标越界等故障告警 监测多平台上运行的系统进程和服务的运行状况 提供硬件报警故障管理(硬盘、电源、电池等信息) 负载均衡状态监控 本地高可用状态监控。 6、主机性能管理: CPU 监控:CPU 利用率,显示系统/用户/空闲时间百分比;支持多 CPU 和多核情况下的汇 总显示和分 CPU/核显示等。 进程监控:监控进程的运行情况,如进程、多个实例、子进程等,系统状态:CPU、内存、 网络等系统资源的占用情况等,提供对相关事件发出告警。 磁盘监控:被监控系统上配置的磁盘(包括物理磁盘、逻辑磁盘、虚拟磁盘、卷组、 远程磁 盘等)的相关属性,监控内容包括:磁盘的配置属性、磁盘空间使用率、数据传输率、平均 等待时间及繁忙程度等参数,当某项或某些项的组合指标超过特定阀值时报警。 文件系统监控:存储空间和文件系统的占用率,超过限定阀值及时报警。 特定文件:监控系统中文件和目录的相关属性,包括名称、文件大小、拥有者、访问权限、 修改日期、文件包含的特定字符以及链接等。如发现文件被修改或其他异常时(包括非法 访问、大小异常等)产生报警。同时监控特定目录下的文件个数。 服务器网络接口监控:监控服务器网络端口的输入、输出、错包及各种可用统计参数,端口 是否被停用或者删除等。 日志监控:日志文件的变化情况,可根据监控系统及用户应用系统的日志文件大小属性,并 根据日志中出现的特定的关键字信息进行报警。 内存:内存大小、内存的使用率、内存可用空间、交换进内存的页数、交换出内存的页数等。 交换空间:交换空间的大小、交换空间使用率等。 提供主机各容量指标增长性的分析,及时预警各容量可能达 95%的时间推算;支持对单个指 标进行阈值设定。 7、可以对主机的配置信息改变进行监控和管理,包括主机名、IP 地址、接口数量、设备厂商、操 作系统版本、CPU 个数、内存大小等配置信息。 8、可以监测系统日志变化情况,而且对监测结果支持匹配查询、设置过滤条件等方式进行更深层次 的分析,通过服务器系统日志监测功能,可以帮助管理员更为准确地掌握重要进程或操作系统的 运行状况。 影响要素 业务需求 29:数据库监控 29 目标:对 IBM DB2、Oracle、MySQL、Microsoft SQL Server、Sybase 等主流数据库的监控及告警 管理。 关键要求: 详细的描述 1、支持对 IBM DB2、Oracle、MySQL、Microsoft SQL Server、Sybase 等主流数据库的监控及告 警管理。 2、 IBM DB2 监测项目包括但不限于: 数据库性能监控 DB2 实例性能参数监控 DB2 数据库性能参数的监控 归档日志目录使用情况 日志文件目录使用情况 数据库可用性监控 检查db2diag.log日志文件里是否有异常错误 db2 核心进程是否处于运行状态 数据库表空间使用状况 数据库备份的情况 锁等待、锁超时、平均锁等待时间、死锁状况 事务状况 应用连接状况 数据库CPU利用状况 缓冲池命中率及各种活动(如数据逻辑读、数据物理读、索引逻辑读、索引物理读、 缓冲池总计;异步和同步I/O活动属性,如缓冲池异步数据读、缓冲池异步数据写、缓冲池同步 数据读、缓冲池同步数据写) 数据库排序连接益出状况 3、Oracle 应支持 9i、10g、11g、12C 等主流版本的监测,监视指标包括但不限于: 版本、可用性、启动时间、连接时间、用户数、数据库生成时间、数据库打开方式、 数据库日志方式、数据库大小、数据库平均执行次数、数据库读写次数、块大小、表空间分配 字节数、数据文件数、表空间状态、SGA 明细、缓冲缓存大小、共享池大小、重做日志缓冲大 小、库缓冲大小、数据字典缓存大小、SQL 区大小、固定区大小、缓存命中率、数据字典命中 率、库命中率、空闲内存、数据文件性能、平均读写时间、会话明细、连接时间、回退段明细、 HWMSize、压缩次数、跨段次数、扩展次数等常用指标。 4、MySQL 监测应包括但不限于: 数据库名、数据库大小、健康状态、版本、端口、基本目录和数据目录、可用性、 连接时间、请求统计、连接统计、线程数、线程缓冲大小、表锁统计、键效率、请求缓存命中 等。 5、Microsoft SQL Server 监测应包括但不限于: 健康状态、版本、端口、ODBC 驱动版本、可用性、内存使用率、缓冲管理器统计、 连接统计、缓存命中率、锁明细、SQL统计、Latch明细、访问方法明细、数据文件大小、日志 文件大小、事务明细等。 6、 影响要素 业务需求 30:中间件监控 30 目标:主流应用服务器和中间件的监控:IBM CICS、Mq、Webphere、WebLogic、WebLogic Integration 、Microsoft .NET、JBoss、Tomcat 等 关键要求: 详细的描述 1、提供对主流应用服务器和中间件的监控:IBM CICS、Mq、Webphere、WebLogic、WebLogic Integration 、Microsoft .NET、JBoss、Tomcat 等。 2、 提供对 IBM CICS 的性能、可用性等情况进行监控,监控内容包括但不限于:版本、监听端口、 活动时间、连接状态、自动诊断、进程数、线程数、可用性、日志信息、配置信息、活动会话服 务状态、最大进程数等。 3、提供对 WebLogic、WebSphere 应用服务器的性能、可用性和利用率的监控、数据统计。监控 的内容包括但不限于:版本、监听端口、活动时间、JVM 堆大小、服务相应时间、Web 应用明 细、活动会话数、最大会话数、EJBs、用户会话及相关信息、Servlet 明细、企业 JavaBean 明 细、事务回退数、事务提交数、数据库连接池明细、Thread pool 、JDBC 等,应提供 WebLogic 服务器的自定义参数监视。支持对 WebLogic 6.x,7.x,8.x,9.x,10.x 多个版本的监控。 4、提供监控 Microsoft .NET 服务器的性能、可用性和利用率等统计数据。监控的内容包括但不限 于:内存使用、线程池、锁、连接、安全、网络流量,能够进行自动诊断、 通知 Microsoft .NET 服务器中的问题。 5、提供监控 JBoss 服务器的性能、可用性和利用率等统计数据,并提供 JBoss 上部署的每个组件 和服务的详细信息。可监控的内容包括:VM 内存使用率、服务器应答时间、EJBs、线程池及 JDBC。支持对 JBoss 3.2, 4.0.1, 4.0.2 等各个版本的监控。 6、提供监控 Tomcat 的性能包括提供全面的故障管理和主动的告警通知。监控的内容包括但不限于: 可用性、内存使用率、线程明细、响应概要、每分钟对于 Tomcat 服务器的请求、每分钟每 JSP 的请求及应答时间等。支持对 Tomcat 3.x,4.x,5.x 等多个版本的监控。 影响要素 业务需求 31:存储阵列监控存储阵列监控 31 目标: 存储阵列监控 关键要求:需从需从 IBM TPC、同创永益、同创永益 IStorM Storage、BMC TrueSight for Storage 三款产品中三款产品中 选取选取 详细的描述 1、支持对 IBM、华为、EMC、Hitachi、浪潮、HP、NetApp、Fujistu、DELL、LSI、SUN 等厂家 的磁盘阵列进行集中监控。 2、支持监控 4 台台 IBM 8K 高端存储、高端存储、4 台华为高端存储台华为高端存储 OceanStor 18500 V3。 3、支持通过告警策略和告警模板的方式对磁盘阵列的性能、容量参数设置阈值,当发现超过设定阈 值的异常性能数据时,主动发送告警。 4、支持对磁盘阵列发出告警的重定义,并可对磁盘阵列告警事件按策略归并、过滤处理。 5、存储阵列的配置信息包含: 基本信息:名称、序列号、设备型号、微码、IP 地址、状态 存储子系统信息:已使用容量、可使用容量、RAID 分布情况 存储控制器信息:名称、端口用途、状态 存储端口信息:名称、端口速率、端口号、对端设备名称、对端端口名称、运行状态 存储卷信息:名称、容量、Raid 级别、是否映射、映射次数,状态 磁盘信息:名称、容量、供应商型号、序列号、Raid 级别、插槽、转速、是否热备盘、状态 RaidGroup 信息:Raid 级别、磁盘数量、卷数量、状态 卷映射信息:名称、容量、前端口、映射主机、状态 6、存储阵列的性能信息包含但不限于: 读 I/O 速率(Read I/O Rate):采样周期内每秒钟读 I/O 的平均操作数量 写 I/O 速率(Write I/O Rate):采样周期内每秒钟写 I/O 的平均操作数量 读 I/O 数据率(Read Data Rate):采样周期内每秒钟读 I/O 的平均数据量(以 MB 为单位) 写 I/O 数据率(Write Data Rate):采样周期内每秒钟写 I/O 的平均数据量(以 MB 为单位) 读缓存命中率(Read Cache Hits Percentage):采样周期内每秒钟读 I/O 在缓存中命中的 百分比 写缓存命中率(Write Cache Hits Percentage):采样周期内每秒钟写 I/O 在缓存中命中的 百分比 读操作响应时间(Read Response Time):采样周期内每秒钟读操作的平均响应时间(以 MS 为单位) 写操作响应时间(Write Response Time):采样周期内每秒钟写操作的平均响应时间(以 MS 为单位) 写缓存延迟率(Write-cache Delay Percentage):采样周期内所有 I/O 操作中由于写缓存 限制或者其他意外情况造成的操作延迟率 热点盘或热点卷:存储阵列中一直处于繁忙的盘或者卷 其中 I/O 速率、I/O 数据率、操作响应时间参数分为前端和后端两种类别 7、支持存储硬件告警、状态告警、性能预警信息的统一展现。 8、支持灵活定制报告和报表,可按需要定制资产、配置、性能、容量、告警等维度的运维周报、月 报、季报和年报;报表能按时间计划执行,并将报表结果以文件、或邮件等方式发送至指定用户。 9、原厂实施并提供现场定制开发服务。 影响要素 业务需求 32:光纤交换机监控光纤交换机监控 32 目标: 光纤交换机监控 关键要求:需从需从 IBM TPC、同创永益、同创永益 IStorM Storage、BMC TrueSight for Storage 三款产品中三款产品中 选取选取 详细的描述 1、支持对 Brocade、Cisco、Mcdata 等厂家的光纤交换机进行集中监控。 2、 支持自动生成 SAN 网络拓扑视图,拓扑图上需叠加展示所选设备容量、性能信息和告警信息,且支持 通过拖拽方式调整拓扑图,支持按业务系统视角和磁盘阵列视角进行 SAN 网络设备连接关系的拓扑展 现,同时支持主机、光纤交换机、存储阵列端口连接关系的拓扑展现。 3、 支持监控 2 2 台台 IBMIBM F96F96、2 2 台台 IBMIBM F48F48、4 4 台华为台华为 4848 口光纤交换机(口光纤交换机(SNS2248SNS2248)。 4、 支持通过告警策略和告警模板的方式对光纤交换机的性能、容量参数设置阈值,当发现超过设定阈值 的异常性能数据时,主动发送告警。 5、 支持对光纤交换机发出告警的重定义,并可对光纤交换机告警事件按策略归并、过滤处理。 6、光纤交换机配置信息包含: 光纤交换机模拟背板图 光纤交换机端口:名称、端口速率、端口号、对端设备名称、对端设备端口、状态 ZONE 信息 7、光纤交换机性能信息包含但不限于: 端口发送包速率(Port Send Packet Rate):选定端口在采样周期内每秒钟发送数据包的平均数目 端口接收包速率(Port Receive Packet Rate):选定端口在采样周期内每秒钟接收数据包的平均数 目 端口发送数据速率(Port Send Data Rate):选定端口在采样周期内每秒钟发送平均数据量大小 (以 MB 为单位) 端口接收数据速率(Port Send Data Rate):选定端口在采样周期内每秒钟接收平均数据量大小 (以 MB 为单位) 8、 支持光纤交换机的容错指标性能分析,至少包含但不限于以下指标:CRC、Loss of Signal 等容错指 标,并且支持光纤交换机的容错多指标直方展现。 9、 光纤交换机硬件告警信息、性能预警信息的统一展现。 影响要素 业务需求 33:磁带库监控 33 目标: 磁带库监控 关键要求: 详细的描述 1、磁带库监控指标包括但不仅限于: 带库整体状态、机械臂状态、驱动器状态、磁带状态、光纤通道状态; 磁带库配置信息:序列号、微码、IP、容量使用情况、文件压缩大小等; 性能信息:CPU 利用率、内存利用率、传输流量、传输频率、复制流量等。 影