《业务连续性(服务器设备故障)应急预案+演练评估+演练报告.docx》由会员分享,可在线阅读,更多相关《业务连续性(服务器设备故障)应急预案+演练评估+演练报告.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、服务器设备故障应急预案二、业务连续性服务器设备演练评估三、业务连续性服务器设备演练报告服务器故障应急预案1目的为提高处理公司服务器故障的能力,形成科学、有效、反应迅速的应急工作机制,确保公 司各系统的安全和高效,最大限度地减小服务器故障对生产的影响,确保业务持续性,保 护公司利益,特制定本预案。2适用范围本预案适用于XXX有限公司局域网中提供公共服务的服务器发生和可能发生的故障。3预防机制服务器故障预防措施包括分析风险,建立检测体系,准备应急处理措施,控制影响扩大。3.1 服务器故障分类服务器硬件或软件的故障;自然灾害(水、火、电等)造成的物理破坏;电脑病毒等恶意 代码危害等。3.2 具体
2、措施(1 )建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静电、防尘;建立备份电源系统。(2)服务器采用可靠、稳定硬件,落实数据备份机制,遵守安全操作规范;安装有效的防 病毒软件,及时更新升级扫描引擎。4有关应急预案4.1 机房漏水应急预案(1 )发生机房漏水时,第一目击者应立即通知相关人员,相关人员接报后应立即前往事发地。(2 )若空调系统出现渗漏水,相关人员立即通知企管部进行处理,并及时清除机房积水。(3)若墙体或窗户渗漏水,相关人员立即采取有效措施确保机房安全,同时通知企管部, 及时清除积水,维修墙体或窗户,消除渗漏水隐患。4.2 机房长时间停电应急预案接到长时间停电通知后,
3、相关人员应及时部署应对具体措施,启动备用电源保证服务器正 常运行。4.3 服务器硬件故障应急预案(1 )核心服务器双机配置,配置好备用服务器,随时待命。(2 )发生服务器硬件故障后,相关人员应及时查找、确定故障原因,进行先期处置。若故 障服务器在短时间内无法修复,相关人员应启动备用服务器,保持局域网系统的正常运行; 故障服务器脱离网络,进行故障排除工作。(3 )服务器硬件故障预防与排除参考附件4.4 服务器软件系统故障应急预案(1 )做好服务器软件系统的定时备份,系统崩溃后,能够及时恢复系统。(2)发生服务器软件系统故障后,相关人员应检查出现故障的原因并尽快排除。(3 )如遇服务器系统崩溃,应
4、启用备份系统进行恢复。(4 )服务器软件故障预防与排除服务器硬件故障预防与排除1故障预防公司主要应用系统服务器进行双机配置。公司主要系统服务器担任了供应系统,销售、系 统,0A系统等服务器角色,机器需要24小时运行,使用率极高,老化快。为了安全,建议配 置相同硬件的服务器为备用控服务器。当使用的服务器出现不可恢复的硬件故障时,马上 启动备用服务器,从而减小服务器硬件故障风险。2故障排除当服务器出现硬件故障,通过以下步骤排除:(1 )确定故障原因。依次查看电源、硬盘、内存、主板、处理器等,如条件许可,可使用 替换法检测各硬件。(2 )恢复固件缺省配置。比如去除第三方厂商备件和非标配备件;清除CM
5、OS,恢复资源初始配置。服务器软件故障预防与排除1故障预防1.1服务器初始状态备份安装配置好服务器软件系统,经测试能够正常投入生产使用后,用GHOST软件备份好服务 系统。备份文件本机一份,光盘或移动。XXX2020年11月23日服务器设备故障演练实施评估一、服务器设备故障演习实施情况:于2020年11月23日上午公司对信息安全进行了培训I和演习。演习应变总指挥:汪倩、现场指挥人:严玉成、专职安全员:曹飞 澎等负责。演习前由总经理对公司全体人员进行了信息安全培训, 演习后总经理组织全体人员对这次演习进行了总结。二、演习达到预期目标这次服务器设备故障演习虽是公司建立以来的第一次演习,但取得 了巨
6、大的成功。通过演习公司员工提高了信息安全防护意识,明确 了平时应以预防备份为主,一旦发生设备损坏情况不要慌张,责任 到人立即按照应急预案实施,如何相互帮助。总之这次演习达到了预期的目的,增强了员工维护公司信息安 全的自我意识,以及恢复公司业务连续性的能力,能按照服务器设 备故障预案步骤实施,迅速有效的控制了服务器设备故障,并及时 的回岗,确保了公司业务连续性,本次演习是成功的。评价人;汪倩日期:2020年U月23日业务连续性服务器设备故障演练报告三、演练目的测试BCP计划的可用性,以便在黑客、服务器设备故障等突发 情况发生时,公司可以在短时间内恢复软件开发测试工作。保证业务的连续性,实现公司业
7、务持续发展的实施的管理四、演练过程2020年11月23日上午9 : 00 ,公司组织了一次全范围的服务器设备故障演练。整个演练分为及时组织和恢复中断信息的演练。一、演习过程描述:1 . 09 : 00网络管理人员发现服务器出现故障,并立即通知相关 技术人员处理;2 . 20秒后技术人员立即检查服务器并调试是否可自己行恢复。3技术人员对主机进行发现硬盘损坏,立即进行跟换硬盘;4技术人员维修后重启服务器,并对服务器数据进行恢复;5 .确定服务器恢复工作后将此次事件,及时上报,并做好相关记6 . 09 : 30总经理发表演习总结讲话,对此次演练进行评估;本次服务器设备故障应急演练,从发现服务器故障到组织恢复服 务器数据共用时20分钟,及时性、和有效是非常满意的。技术人 员有效的确保了公司业务持续性的恢复,减少了公司的损失,专业 性值得表扬。三.总结减少服务器设备故障给公司带来的损失是每个员工义务和责任。 在灾情发生的第一时间。每个人要知道应该做什么,如何正确应 对,如何将损失减少到最小。所有人员都要沉着冷静,一旦接到处 理突发事件的指令,义不容辞的快速执行。每个人都有义务保护本 部门使用的信息系统及业务数据,并在重大事故之后及时恢复中断 的业务活动,保持业务连续性。
限制150内