2022年2022年华夏人寿保险计算机系统重大突发性事件应急预案.doc .pdf
《2022年2022年华夏人寿保险计算机系统重大突发性事件应急预案.doc .pdf》由会员分享,可在线阅读,更多相关《2022年2022年华夏人寿保险计算机系统重大突发性事件应急预案.doc .pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、华夏人寿保险 计算机系统重大突发性事件应急预案第一章计算机系统重大突发性事件应急预案1.说明华夏人寿保险股份有限公司信息系统应急方案是为了确保当华夏人寿关键系统发生故障或供应链因以外中断时,关键业务仍可继续运作,而预先制定和准备的一系列操作方案。本应急方案并不能代替解决问题的工作,它只提供一个最低可接受的服务水平,以便有充足的时间去修复出现故障的系统。其价值在于,计划和方案在危机出现前就已经制定好,能最大限度地争取时间。通过应急方案主动的有预见性的,而不是被动地仓促地对紧急情况做出反应。2.应急方案的目标/范围2.1 目标与范围(1)业务连续:确保华夏人寿的日常业务能够连续运行,不出现中断。在
2、某些系统或子系统功能失效的情况下,关键系统不至于瘫痪,主要功能不会丧失。(2)降低风险:应急方案必须采取各种措施,把由于问题而产生的风险降到最低。(3)减少损失:对于可能产生的风险,采取技术和管理方面的补救措施,尽量将各种损失减少到最低。(4)避免灾害:尽量避免因为系统故障而产生灾害的高危系统造成的直接或间接影响,确保人民生命财产安全和社会稳定。目前,华夏人寿保险公司基于计算机和网络的业务处理系统主要包括核心业务系统、财务系统和办公系统。2.2 关键业务系统描述核心业务系统业务生产系统配置1 台 HP rp8420 服务器和 1 台 rp7420,rp8420和 rp7420 分别划分两个硬件
3、分区,一个硬件分区配置是4CPU、8G内存作为业务系统的数据库服务器,另一个硬件分区是4CPU、4G内存名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 14 页 -作为业务系统的应用服务器。一套磁盘阵列EMC CX500,作为核心业务系统和财务系统的硬件支撑平台。另外配置一台HP rp3410 作为核心业务系统及财务系统的测试服务器,运行非关键的开发和测试工作。财务系统财务系统安装在1 台 HP rp4440 服务器上,同时与核心业务系统共用一套磁盘阵列EMC CX500。Rp4440也划分两个硬件分区,一个硬件分区配置是2CPU、4G内存,运行财务系统的数据库,另一个硬件分区配
4、置是 2Cpu、2G内存,运行财务系统的应用程序。核心业务系统的服务器与财务系统的服务器做双机互备,平时业务系统运行在rp8420 上,财务系统运行在rp4440 上,当一台服务器的一个分区发生故障时系统切换到另一台服务器的相应分区上运行。3.应急团队组织结构应急方案都是在发生灾害的非常时期进行。因此,充足的人力资源配备和明确的责任分工显得尤为重要。如果没有一个组织有序的团队,很难保证灾难发生时能够在既定时间内完整、成功地实现灾难处理和业务恢复。从华夏自身来看,其实施应急的团队组成不仅要横跨各个部门,还要纵向包含省分和市分等多级机构。因此,合理地组织华夏各级机构的各个业务部门的人力资源,根据灾
5、难恢复方案的需要明确各个团队成员分工,是保证应急方案顺利实施的基础。更重要的一点是,将各个组织部门的管理层纳入应急实施团队或至少得到他们的充分承诺是整个应急系统成功的关键因素之一。这里需要说明的是:由于灾难的偶然性和突发性,应急团队并不需要全职地投入到应急工作中。实际上,整个团队中除了应急实施负责人和协调人之外,其他成员在日常工作中都是兼职地加入应急团队,其担负的任务和责任也只是其日常工作地一部分而不是全部。但是,整个应急团队需要在建立和修订应急方案时全职地投入应急工作,这些工作至少持续到整个方案测试结束,以保证团队对应急方案的实施能力。3.1 团队负责人名师资料总结-精品资料欢迎下载-名师精
6、心整理-第 2 页,共 14 页 -根据华夏的组织结构情况,设立应急负责人组成整个应急系统的最高管理层。应急负责人是整个应急系统的最高负责人,是具体实施应急的领导者。3.1.1 作用应急负责人全面负责整个华夏的业务持续和灾难恢复工作,包括方案制定、人员组织沟通、方案演练、文档和测试工作。应急负责人的主要作用就是保证华夏能够在发生灾难的情况下保持关键业务的持续运行,将灾难损失降低到最小程度。3.1.2 职责保持和本级高级管理层的联络;具体负责应急方案的制定和实施;保证所负责的区域内的灾难恢复和业务持续;共同保持整个华夏范围内的应急知识普及;协同华夏各部门的应急工作。3.2 应急协调人3.2.1
7、作用具体联络相关小组实施应急负责人下达的各项任务,协调上下级之间和各部门之间的联络和协同,并且他们还要作为制定和实施应急方案的联络人。3.2.2 职责组织和协调所负责区域的应急相关的各项工作;对本区域的人员进行相应的应急知识培训;组织各部门的应急演习和评审;联络和沟通本区域的各个部门以及外部供应商和服务商。3.3 灾难恢复小组灾难恢复小组是应急方案的具体执行者,负责执行和灾难恢复相关的具体职能。根据各项职能的要求,每个小组大约包括3 到 5 名成员,由组长负责本组的工作,并且在每个组中还要有一个候补的小组负责人。各个小组都需要由应急中心和所支持的省公司的相关人员共同组成,在灾难发生时共同利用应
8、急中心的资源完成灾难恢复和业务延续。名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 14 页 -各个小组在应急负责人的领导下进行工作,通过应急协调人和各级部门之间进行沟通。根据实际工作的需要,可以对小组的工作进行具体的详细划分,或者增加新的职能小组。应急负责人、协调人和各小组的组长一起构成整个应急团队的管理层,由他们负责指导华夏应急方案的制定和实施。以下具体描述各小组的职能和组成。3.3.1 设施恢复组设施恢复组负责监控本区域内所有的物理设施,包括平时的预防工作和灾难发生时的损失评估、保护、维修和转移,以及在应急管理层的指导下,进行灾难地和应急中心之间地物理设备切换。根据其职能,
9、设施恢复组主要包括以下人员:设施规划和运行维护人员;资产管理和审计人员供应商和服务商联络人员设施相关的技术专家安全管理人员法律和保险管理人员3.3.2 行政管理组行政管理组负责为其他职能部门作好所需的后期保障工作,包括运输、安全保卫、资金、人员调配和公共关系等。行政管理组主要包括以下人员:具有足够资源调度授权的经理;运输、财务、人事、安全保卫、公共关系相关人员;外部服务商、供应商联络人员;行政助理3.3.3 系统恢复组系统恢复组负责保证支撑关键业务应用的平台系统的恢复,并及时提供给相关的业务部门。系统恢复组主要由以下人员组成:系统管理员供应商联络人员名师资料总结-精品资料欢迎下载-名师精心整理
10、-第 4 页,共 14 页 -3.3.4 通讯恢复组通讯恢复组负责维护和保障应急方案中的通讯需要,包括语音通讯和数据通讯,尤其是灾难恢复所需的指挥通讯和恢复关键业务应用所需的数据通讯。通常通讯恢复组需要借助第三方的网络供应商来完成所需的通讯保障工作。因此,通讯恢复组包括:网络及通讯系统维护人员网络服务供应商联络人员;设备供应商联络人员;3.3.5 用户联络组用户联络组负责应急团队和各业务部门的沟通和联络,以使应急团队及时了解详细的灾难影响以及来自业务部门的需求,同时,也是业务部门了解应急团队的灾难恢复工作进展情况,帮助双方更准确地进行相应的决策。用户联络组人员组成:各业务部门代表应用系统专家3
11、.3.6 数据控制组数据控制组负责应急的数据备份和恢复工作,包括制定相应的备份计划、恢复优先级的评估以及恢复方式,并在灾难发生时负责实施相应的数据恢复工作。数据控制组由以下人员组成:数据控制经理;数据备份管理人员;备份介质管理人员;原始单据管理人员;数据录入组织人员;3.3.7 应用恢复组应用恢复组负责业务应用系统的恢复,这个小组和系统恢复组、数据控制组一起完成业务支撑应用系统的恢复工作,实现业务的延续运行。名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 14 页 -应用恢复组的成员主要有:应用系统管理员;应用系统开发商维护人员;3.3.8 配合协作组配合协作组负责应用系统发生问
12、题时,和其它恢复小组一起完成业务支撑系统的恢复工作。主要成员根据业务系统影响的范围而定,例如在与分公司、支公司或者营销部的某些业务受到影响时,则需要当地技术人员的配合,一同完成业务系统的恢复工作。4.关键业务监控技术平台针对华夏人寿业务系统技术新、规模大、可用性要求高、管理任务重的特点,华夏人寿除了配备了高素质的技术支持团队,而且采用了完整的数据库管理解决方案,能够完全满足寿险核心业务系统管理需求。5.应急处理流程应急处理流程分为事件级别判定、事件处理及升级程序。5.1 事件级别判定事件级别定义:序号事件级别颜色标识故障现象描述1 一级故障红色系统运行中断,对用户业务的运行有严重影响。2 二级
13、故障橙色系统中重要功能受损、主要性能指标严重下降,影响和限制了部分业务运营。3 三级故障黄色在系统主要功能及性能指标运行正常的情况下,系统部分功能与性能受损。对于华夏人寿重要的核心业务系统、财务系统,主机、数据库、网络系统有着至关重要的作用,根据事件级别的定义,主机、数据库、网络系统的事件级别判定标准如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 14 页 -事 件级别颜 色标示故障现象描述主机系统数据库网络一 级故障红色 系统运行中断,对用户业务的运行有严重影响。核心业务主机瘫痪。业 务 数 据 库挂 起 或 者 无法正常使用。核心交换机、骨干网络线路不能使用。二 级故障
14、橙色 系统中重要功能受损、主要性能指标严重下降,影响和限制了部分业务运营。核心业务主机 运 行 缓慢、出现严重报警信息或 硬 件 错误。核 心 数 据 库响应缓慢,部分 应 用 出 现数 据 不 一 致性等错误。交换机或路由器性能下降,或者网络带宽使用率超出承载能力。三 级故障黄色 在系统主要功能及性能指标运行正常的情况下,系统部分 功 能 与 性 能 受损。核心主机基本上正常工作,但存在硬件或系统级错误,使得主机系统性能有所下降。数 据 库 工 作基本正常,但是 某 些 非 重要 数 据 存 在问 题 或 者 运行不够稳定。网 络 基 本 正常,但是出现网络数据偶尔停顿等现象。四 级故障蓝色
15、 在系统无故障或不影响用户业务运行的情况下,用户对系统的功能、安装、配置、性能优化或使用方面提出技术咨询服务要求。主机系统运行正常,但是在主机系统 参 数 配置、或性能优化方面需要改进。数 据 库 系 统运行正常,需要 对 数 据 库系 统 配 置 参数进行调整。网 络 运 行 正常,对网络链路使用或设计方 面 有 待 改进。名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 14 页 -5.2 事件处理程序类型事件事 件级别预防措施紧急处理程序机 房环境机房强电停电,停电时间超过 UPS备援时间二级定期对 UPS运行状 况 和 电 池 进行 检 测,增 加UPS待机时间关闭非关键业
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年2022年华夏人寿保险计算机系统重大突发性事件应急预案.doc 2022 年华 人寿保险 计算机系统 重大 突发性 事件 应急 预案 doc
限制150内