酒钢数据中心智能运维管理系统平台建设零固项目采购技术协议.docx
《酒钢数据中心智能运维管理系统平台建设零固项目采购技术协议.docx》由会员分享,可在线阅读,更多相关《酒钢数据中心智能运维管理系统平台建设零固项目采购技术协议.docx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、酒钢数据中心智能运维管理系统平台建设零固项目采购技术协议甲方:酒泉钢铁(集团)有限责任公司信息自动化分公司代表(签字盖章):乙方:XXX代表(签字盖章):监控内容包括但不限于:国提供对所支持数据库数据的采集。团提供对所支持数据库的状态和性能告警,如缓存命中率,表空间利用率, 查询的速率、数据库状态等。国支持对所支持数据库的运行情况、服务提供情况、性能情况进行实时监控。 主要包括数据库实例基本信息、连接信息、Sga/Pga区配置、锁、缓冲区命中率、 联机日志、表空间&数据库文件、回滚段、Schema Objects等。各运行指标同时 提供历史性能的中长期趋势挖掘分析。团支持对数据库实时性能监控,
2、支持配置信息列表展示。支持数据库性能信 息列表展示,如缓存命中率,表空间利用率,SQL语句执行时长、数据库状态、 锁、会话数等。团支持对历史数据库数据进行统计,综合评估数据库在一段时间内的运行趋 势。回监控信息包括监视器信息、内存使用、数据库页使用、连接统计、缓存统 计、闭锁统计信息、访问方法明细、等待任务、数据库连接数、按时间排序TOP1O、 按逻辑读排序TOP1O、按物理排序TOP1O、按CPU统计TPO1O等。3. 1.6中间件监控要求运维监控平台要求对各类应用服务器、Web服务器等中间件,可检测应用服 务器的会话性能、虚拟机内存、线程池、事务状态、JMS,队列、负载度量、运行 模式等,
3、可检测Web服务器的可用性、响应时间、访问性能统计、页面传输性能、 当前状态、告警日志等。支持的中间件包括:应用服务器包括:. Net、JBoss、Tomcat、WebLogic WebSphere、GIassFish Lync2013 TongWeb 等。Web服务器包括:Apache独由*、1代等。消息队列中间件包括:RabbitMQ、TongLINK/Q、Tuxedo、WebSphere MQ 等。邮件服务器包括:Exchange2010等。监控的各类中间件指标明细会根据版本发布定时更新,也可以在帮助中了解 监控指标的详细信息。监控内容包括但不限于:队列、通道、会话、WEB应用、线程池、
4、连接池、线程、JVM信息、JMS消 息等。团基本属性监控:如中间件类型、版本、驻留服务器,支持应用模型中应用 支撑关系的发现和定制。团运行状态监控:监控中间件运行状态、WEB应用状态、进程状态及主要消 息的状态,及时识别异常情况并给予告警提示。回主要性能指标监控,支持关键指标的动态阀值管理。回监控中间件连接池的情况:连接池的状态、连接池名称、当前使用的连接 数量、等待池中连接的最大客户数、丢失的连接数、连接池最大连接数。团监控J2EE各部件(如JSP、Servlet. Java Bean、EJB)的性能和资源消 耗情况,包括Servlet、Java Bean EJB中每个部件的平均执行时间、提
5、交的交 易请求情况等。0EJBs Servlet的多种统计数据,包括被分配的Beans、在使用的Beans、 空闲的Beans、超时的Beans数、等待的Beans、Serv I et响应时间;TOPN Serv I et 和JSP的详细信息;TOPN EJB的详细信息;TOPN EJB方法的详细信息。团监控中间件JMS情况:JMS的连接总数、川S当前的连接总数、JMS的最高 连接数、JMS Server总数、当前JMS Server总数、JMS Server历史中最高总数、 JMS Sess ion的总数、当前的JMS Sess ion数、最高的JMS Sess ion数、已接收 的JMS消
6、息数、未处理的JMS消息数、JMS发送的消息数。团监控JMX的运行情况。团监控中间件执行队列的情况:执行线程的总数、当前空闲的执行线程数、 队列中未处理的请求数、队列已经处理的请求数。回监控中间件WEB应用:当前打开的Session数、打开的Session最高数、 打开的Session的总数、状态、名称。0JVM: JVM堆栈大小、JVM堆栈利用率等。团可以对过去任意时间段内的中间件运行状况进行查询和分析,实现对 Weblogic、Websphere等中间件的JVM内存堆使用情况、Servlet执行情况、JMS 消息处理情况、WEB应用会话情况、Weblogic事务处理情况、JDBC连接池等内
7、 容进行集中监控管理。团支持监控应用中间件服务器的Java进程的内存占用情况和垃圾回收情 况,包括 Java heap、Java thread、Java stack、GC 等监控。团支持中间件服务器上所部署的应用(功能模块)的运行状态的监控,能及 时发现状态异常的情况。团支持监测中间件服务器队列中消息数量的监控,尤其是队列中Pending消 息数超过一定数量时,代表应用系统的运行性能已经严重下降。并且支持对 pending消息数量设置阀值,实现性能预警功能。3. 1.7容器监控要求运维监控平台要求通过多种方式对容器以及容器平台进行监控,可对 Kubernetes容器平台集群、节点以及POD的基
8、本信息以及状态进行监控,可通 过命令行或者RESTful接口调用的方式对Docker容器进行监控,满足客户实际 的需求。包括容器基本信息、磁盘信息、镜像信息以及使用的资源信息、性能信 息、告警日志等。监控内容包括但不限于:包容器CPU使用率团容器用户态CPU使用率团容器内核态CPU使用率团容器内存使用量团容器网络发送速率团容器网络接收速率团容器磁盘读速率回容器磁盘写速率回容器运行状态团容器日志3. 1.8自定义监控要求运维监控平台要求支持自定义监控模板,包括采集的具体指标、采集间隔、 阈值、告警级别、触发次数,实现灵活高效的个性化监控需求。运维人员可以通过图形化配置界面,通过SHELL、SMI
9、-S、SNMP协议对监控 系统预置资源类型的监控指标进行扩展、新增未适配的资源对象:运维人员可以通过Linux/Unix下的shel I脚本采集自定义指标。自定义采 集输入参数、资源图标、访问参数,使用Perl脚本扩展shell能力,支持密码、 密码+super密码、密码+秘钥、秘钥等各种SSH认证配置。运维人员可以编辑系统预置监控概览视图,设计全新监控概览视图,实现对 重点关注的监控指标重点展示。自定义支持包括:支持画布拖拉拽,所见即所得,多种布局方式;支持字体样式、大小、颜色自定义支持柱状图、趋势图、面积图、饼图、南丁格尔饼图等多种图表样式自定义;支持指标筛选、指标排序、TOPno3. 2
10、告警管理功能运维监控平台要求具备告警中心功能,告警中心可以接收各类告警源的告警 事件,包括设备告警、资源性能监视告警、网络流量异常监视告警、日志告警等; 同时通过支持对设备以及资源的定时轮询,实现通断告警、可用性告警、性能阈 值、配置变更告警等。设备告警包括电源电压、设备温度、风扇等告警事件,设备冷启动、热启动、 接口 Down等重要告警事件,路由信息事件(OSPF, BGP)变化,热备份路由(HSRP) 状态变化等告警事件,支持对H3C、CISCO,华为等多厂商设备告警的识别和解 析。资源性能监视包括CPU利用率,内存使用率,以及RMON告警的故障管理。支持定期轮询告警,通过对设备性能、接口
11、、链路、操作系统、数据库、中 间件等各类应用等运行状态和性能定时进行轮循,并及时上报通断告警、响应时 间告警等告警事件。支持多种提醒方式,如告警实时提醒(告警板)、告警提示音、微信告警, 短信告警等,可支持定制开发同即时通讯软件进行对接。运维监控平台要求提供多种进程告警规则设置;通过各种规则的设置支持进 程重启、进程消失、进程数量减少等多种告警,同时支持自定义别名功能,通过 设置与应用相关的别名,告警产生时“告警信息”将自动关联进程别名,从而协 助运维人员及时发现以及定位到问题,提升运维效率;同时通过对远程端口、被 连接端口、监听端口的全方位监控,及时发现端口通断异常,确保应用的正常运 行。3
12、. 3流程管理功能运维监控平台要求具备流程管理功能,流程管理为用户提供重要信息预览的页面,帮助运维流程系统用户快速了解工作相关信息。用户登录管理平台首页,该页面缺省显示与当前登录用户相关的个人信息, 包括任务信息、待办事项、已办事项、公告和我的消息等内容。待办事项可以直 接点击处理,公告信息可以点击查看。提供灵活表单设计器,支持自由布局页面结构,支持用户自定义个人首页展 示内容,支持组件拖拽式布局,快熟搭建和部署基于企业应用需要的表单内容。自定义表单结构和数据格式,提供丰富的表单设计组件,如单行文本、多行 文本、复选框、单选框、树、日期、数字、人员组件、配置项查看、配置项修改、 配置项删除等;
13、流程平台提供图形化流程设计器,支持自定义流程定义设计,通过可视化的 流程设计器,快速实现流程的在线设计及发布管理。主要涉及应用的流程执行步 骤信息,包含开始、流程流转过程中每个环节的执行内容(活动任务)、网关关 系、子流程和结束。3.4应用系统服务管理功能运维监控平台要求具备应用系统运行总览的功能,通过应用系统数据窗、应 用系统监视列表等形式,方便快速查看应用系统整体运行情况,运维人员能够对 所有应用系统进行建模、设置,并可以初步判断应用故障点。平台可通过360度应用视图的形式对单个应用进行详细分析,分析按IT基 础架构层、应用应用层、用户体验层3个层次进行运行状态监控与分析,并通过 把3个层
14、次数据拉通进行端到端智能分析,帮助运维人员完成对某个应用故障发 现、故障定位分析、故障预防相关工作。应用系统数据窗通过应用状态分布图直观呈现应用系统健康度、繁忙度分布 运行情况,三位一体核心应用卡片实时展示各个应用系统当前的用户体验层状 态、应用程序运行状态、IT基础架构层运行状态。应用体验层指标包括:体验度、访问量、用户量;应用程序层指标包括:应用性能指数、平均响应时间、错误率;IT架构层指标包括:健康状态、繁忙程度、可用状态。为IT管理者提供综合运维管理的总体视图,可以全面整体了解应用系统运 行情况。运维监控平台能够对应用系统相关的告警进行趋势分析、时序分析,分层次 查看告警详情、告警可以
15、和应用拓扑联动,查看告警和其他的关联影响关系。运维监控平台能够分层次对应用体验指标、应用性能指标、IT基础架构状 态指标进行同时间轴分析,找到引起应用总分降低的关键指标;可以对异常指标 下钻分析,找出具体KPI。运维监控平台能够关联分析应用性能、应用告警、IT资源配置管理数据变 更、IT服务管理工单数据,帮助用户分析变更和应用系统性能变化之间的关系。3. 5资源配置管理功能运维监控平台要求具备资源配置管理功能,资源配置管理功能可基于集团公 司目前的IT运维成熟度,进行针对性的IT成熟度评估,对当前环境中的物理资 源和逻辑资源进行梳理,构建结构成熟、信息可消费的CMDB (配置管理数据库)。 通
16、过CMDB融合完成网络、主机、应用部分数据的自动化收集,通过人工处理和 功能对接等工作完成其他系统信息的统一管理。通过收集多种来源资源信息与整 合,建设集中、完整、统一、实时的资源管理数据库;记录、存储资源的应用系 统信息、关联信息、软硬件基本信息、维护信息;为事件管理、问题管理、变更 管理提供查询、诊断的基础;同时也为IT资产管理提供记录、查询、汇总、统 计、分析基础。3.6 自动化管理功能运维监控平台要求具备自动化管理功能,自动化管理功能具备智能巡检功 能,可根据用户灵活定制的各种应用运行指标,对应用进行全面运行状态自动化 检测分析,深度感知应用基础架构运行状态。同时,实时输出准确、详实的
17、分析 报告及改进建议,预防应用运行中可能出现的各种风险,发现应用潜在的性能瓶 颈,为用户应用提供专业、深入、智能的管家式服务。3.7 报表管理功能运维监控平台要求具备报表管理功能,报表管理功能应实现对报表模板管 理、周期性报表管理和报表模板的发布,同时提供实时报表和周期性报表的查看。提供基于实时监控指标的巡检报表,对设备的状态全面检测,深度感知设备 运行状态,对于异常项高亮展示。统计时间、统计时段可自定义。统计页面内容可自定义配置,支持按照权限生成不同的管理报表,并按角色 分配报表查看人员;周期性报表机制:支持天报表、周报表、月报表、季度报表、半年报表、年 报表。可以设定周期性报表的开始时间、
18、失效时间。可以将自身的组织名称和 Logo融入到发布的报表中,可以定时生成后Email到指定邮箱。支持报表导出,导出格式可支持Microsoft式rd (RTF) Microsoft Exce I PDF、 XML、 CSV、 DOCX、 PPTX 等;提供定制化开发功能,根据用户实际报表需求和设计进行定制化开发。3. 8知识库管理功能运维监控平台要求具备知识库管理功能,知识库管理功能能够规范知识库条 目的支持知识入库、审核、发布的生命周期。包括:支持知识入库、审批、更新、废止的生命周期管理,支持知识有效期管理。支持知识核心内容图文编辑,支持知识分类检索和关键词全文检索方式。支持对知识访问进行
19、权限控制,将知识授权给所有人员、部分具体的人员和 群组。支持事件、问题管理与知识库的关联。支持最新知识、推荐知识、最佳知识的推荐。支持将知识共享给其他人员,被共享的人员可以在“推荐知识”栏目中查看 被共享的知识。支持用户订阅自己关注的知识类型,并在“关注知识”中查看订阅类型的相 关知识。支持提供知识汇总、知识好评数、知识引用次数的排行。支持对知识分类进行权限控制,设置某个知识分类的查看权限,授权方式支 持按工作组、组织机构和个人。3.9 大屏展示功能运维监控平台要求具备大屏展示功能,按照指标化要求进行设计配置,要求 提供1个以上定制大屏页面首页(首页下包含多级下钻页面)的定制开发服务, 按需定
20、制URL页面分辨率、展示功能模块内容、展示信息、展示UI风格等,实 现用户的个性化集中展示需求。3.10 系统用户权限功能运维监控平台要求具备严格及丰富的权限控制功能,支持功能授权和数据授 权。通过资源和人员的归属机构映射,自动过滤数据和以树型结构的层次展示, 以满足多层级组织结构的集中统一运维要求。通过人员所属机构与资源所属机构关联,以做到每个机构的人员内只能处理 相应机构的资源对象。在每个机构内,通过对资源进行分组,以做到同一机构内 不同人员管理不同的资源对象。通过功能权限和数据权限组合,即可实现分级分权管理。如需进行更加细化 的权限划分,用户可按需自定义。通过将平台的功能菜单及操作按钮进
21、行组合,以形成不同的权限。不同的权 限包又可以组合为不同的角色。将不同的角色与不同的账户关联,即可控制不同 人员操作不同的菜单及功能项。3.11 APP 功能运维监控平台要求提供移动APP,查看平台告警、性能、资源等运行数据。支持运维人员及业务人员通过移动端创建工单、处理待办、查看已办、知识 库和公告;支持与第三方app进行嵌入集成;在移动端能够处理哪些流程可以在 后台进行配置;支持同一流程节点在移动端和web端使用不同的表单页面,移动 端的表单界面展示字段可以在后台进行配置,灵活调整。3.12 其他功能运维监控平台要求具备系统(设备)运行故障处置记录功能,包括系统(设 备)运行故障处置记录的
22、新增、编辑、删除、查询、分析报告导入、运行故障处 置记录节点跟踪维护等功能。3.13 功能或点数授权要求3.13.1 运维监控平台如按功能授权的,本协议要求的所有功能在酒钢集团 公司范围内使用不受限制,可以接入酒钢集团公司范围内所有的机房、网络、计 算、存储、虚拟化、容器、云资源、操作系统、数据库、中间件等软硬件设备。3.13.2 运维监控平台如按点数授权的,点数应满足本协议建设内容的要求, 并承诺后续接入点数授权费用不能高于本次采购费用。四、运维监控平台技术要求为了满足系统功能的正常使用,避免系统在高负荷运转时出错与故障,系统 在技术性能方面也必须具备以下要求:4.1架构要求(1)为保证系统
23、高可用性,运维监控平台以集群方式最少3节点部署运行, 任何1个节点故障不能影响平台运行,且必须基于Linux虚拟化微服务架构,容 器底座,具有良好的扩容兼容性,当系统资源不足时,可增加主机节点到集群中, 系统将迁移部分容器或服务到新的主机节点,完成扩容,参考网络架构图如下。2023年 月曰集群节点1集群节点2集群节点3(2)运维监控平台架构设计方面,分为展示层、应用层、处理层、运行层、 采集层、资源层,或在此基础上拆分出更细化的架构设计,参考模型示意图如下。展示层售理员视图杳百员视图租户视图统一运维门户桌面Portal移动APP场景化定制Javascript、Css% Vue、SpringBo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 智能 管理 系统 平台 建设 项目 采购 技术 协议
限制150内