运维故障应急预案.pdf
《运维故障应急预案.pdf》由会员分享,可在线阅读,更多相关《运维故障应急预案.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运运维维故故障障应应急急预预案案文件编码(GHTU-UITID-GGBKT-POIU-WUUI-8968)运维故障应急预案运维故障应急预案V1.0深圳市 XX 科技有限公司修订记录版本编号1.01.11.2版本日期2014-5-13修订人CC说明初稿1 1 机房失火,断电,断网机房失火,断电,断网1.11.1 紧急预案紧急预案1)全国各区域陆续反馈访问网站出现无法访问。2)运维人员通过监控状态,无法远程登录服务器,ping 不通服务器。并紧急联系机房人员,询问初步情况,则可判断是否出现机房失火,断电,断网。3)技术部给业务部门、市场部门以及相关领导发出网站异常的通告,通告分为两部分。一部分是对
2、公司内的通告,包括事故的影响、恢复的时间;一部分是对公司外,描述因为系统升级,而导致网站不能访问。4)再次紧急联系机房供应商,询问故障的发生原因,故障的严重性,是否后续能正常恢复服务。5)如故障严重,先能否挽救服务器,以存储服务器为优先。若存储服务器受损,则想办法恢复数据;若无法恢复数据,则修改通告内容,告知业务部门要重新导入全部数据。6)视故障影响范围,统计出未受影响的服务器。7)如果是机房失火,断电,断网导致机房不可用,则尽快联系新的机房,开始重新搭建服务。8)评估网站恢复的时间点,修改通告内容。1.21.2 风险预防风险预防杭州和深圳均实施数据跨机房备份。2.2.区域性网络故障问题区域性
3、网络故障问题1.11.1 紧急预案紧急预案1)全国某个区域短时间内有多个客户反映无法访问网站,其他区域访问正常。2)运维人员通过监控状态,远程登录服务器查看机房服务器服务状态,判断是否存在服务异常。3)如机房服务正常,运维人员测试出现故障区域的网络连接与 dns 解析是否正常。4)如果网络连接或者 dns 解析不正常,则可认为出现了区域性网络故障问题。5)给业务部门、市场部门以及相关领导发出网站异常的通告,通告分为两部分。一部分是对公司内的通告,包括事故的影响、恢复的时间;一部分是对公司外受影响的区域客户,描述因为客户所在区域网站故障,而导致网站不能访问。6)尽快联系当地运营商,询问网络故障的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 故障 应急 预案
限制150内