数据中心机房综合重点工程运维管理实施专业方案.docx
《数据中心机房综合重点工程运维管理实施专业方案.docx》由会员分享,可在线阅读,更多相关《数据中心机房综合重点工程运维管理实施专业方案.docx(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据中心机房工程运维管理制度要求处理方案目录第1章机房工程管理技术制度和要求31.1机房管理科长和管理人员岗位职责31.1.1机房管理科长岗位职责31.1.2机房管理科长“三心”51.1.3管理人员岗位职责71.2机房内管理内容81.2.1制订机房管理规章制度81.2.2大、中型机房日常维护工作管理内容91.2.3大、中型机房日常安全管理内容111.3机房巡检要求261.4机房巡检具体内容271.4.1供配电巡检具体内容271.4.2给排水巡检具体内容291.4.3空调系统巡检具体内容301.4.4消防巡检具体内容311.4.5网络设备巡检具体内容321.4.6机房环境巡检具体内容351.4.
2、7照明巡检具体内容361.4.8防雷巡检具体内容361.5机房巡检台账内容371.6机房参观管理37第1章机房工程管理技术制度和要求管理是为了实现预期目标进行协调活动。为确保机房安全运转、工作有序开展、设备正常使用,机房需要制订管理规章制度。机房管理就是对制订规章制度实施、检验和改善。实施就是根据制订规章制度去实施;检验就是将实施过程或结果和规章制度进行对比,总结出经验,找出差距;改善是经过检验总结出经验,将经验转变为长久有效机制或新要求,针对检验发觉问题进行纠正,制订纠正、预防方法。伴随云计算发展,机房规模急剧扩大(大、中型机房通常是指面积数千至数万平方米)、机房数量不停增加,由小规模、封闭
3、式、单一功效向大规模、开放式、多功效方向发展,机房管理更为关键。机房管理水平高低也直接影响着机房使用率和使用寿命,机房管理应引发机房管理人员高度重视。1.1机房管理科长和管理人员岗位职责1.1.1机房管理科长岗位职责机房管理科长(组长、主管领导或经理)是中心领导管理好机房日常运维工作得力助手和参谋。机房管理是管理科长日常工作全职岗位,对于机房管理科长来说,机房管理是为了使机房设备正常运转,保障机房有良好运行环境和工作环境。机房管理科长岗位职责要关键注意以下内容:1)严格制度。机房管理是一项看得见、摸得着实际工作,面对很多原因和关系,必需“严”字当头。机房日常管理应依据实际需要,抓常规管理。建立
4、、健全计算机机房各项规章制度是机房管理工作前提。制订对应机房管理制度,使日常管理工作做到有章可循,有据可依。2)严格管理。作为部门领导一定要有从严管理指导思想,要严格管理、严格要求,并使这种严格思想落实落实到管理工作全过程,在实际工作中要常讲、常查,要不怕得罪人,必需时还要制订多种奖惩方法。3)做好日常运维和巡检工作,包含配电、空调、消防等设施检验工作。4)不停学习。机房管理牵涉面广,事务又多,是一项专业性强、“繁”、“杂”、“难”、“累”工作,含有一定不可预见性,且不一样程度地存在技术难度。现在中国很多报刊杂志包含互联网络中,相关机房管理介绍层出不穷,机房管理科长需要有责任心和不停学习进取心
5、。机房管理科长除了要掌握丰富计算机软硬件知识和含有较强动手能力外,还需要掌握一定设备管理技巧,学习多种设备如配电系统、地线系统、空调、防火设备、UPS等正确操作方法,从而杜绝因操作不妥造成人为事故。不停学习,总结经验,取长补短,才能做好机房管理工作。5)做好机房防火、防盗及供电系统、空调系统、通风系统安全和日常养护工作,提升安全意识。定时检验安全设施情况,并做好统计,发觉问题立即整改。6)定时检修,重视完善。机房和相关设备也有老化、更新、修复等问题,除进行日常检修外,还应对机房建设时存在缺点,机件磨损、老化,紧固件松动,装修变形等问题定时检修、更改或完善。坚持每十二个月定时对机房整修一次,即检
6、测安全防火设备、检修空调设备、除尘、玻璃隔断调整加固、照明设备检修、安全防盗、协调相关设备维修人员进行维修,安排好相关维修工作。7)对于发生故障和事故立即逐层上报,并做协调工作,做好故障和事故统计工作,做好问题分析和跟进处理工作。8)完善电气系统设备技术档案和资料,建立相关管理制度、操作规程、应急预案等。9)在制度化管理上下功夫,组织、指导、制订年度工作计划和多种操作规程、管理要求、岗位职责和安全责任制等,并监督落实,以实现科学、有序、安全管理。10)机房不能出现事故,加强巡视巡检。要管理好机房不是一件轻易事情在条件许可情况下,应建立经济合理易损件、易耗件备用库,确保立即更换,定时更换。对设备
7、运行情况进行分析,制订预防和常见处理方案,从而确保机房正常运转。11)严格机房钥匙管理,机房钥匙只许可管理人员配带。1.1.2机房管理科长“三心”机房管理科长三心即责任心、学习心、宽容心。1.责任心责任心关键有以下内容:(1)安全管理机房安全是第一位,能够说是机房管理体系灵魂。威胁机房安全原因关键有火灾、设备故障、病毒。机房安全管理就是告诉大家,在进行机房管理同时,经过采取计划、组织、技术等手段,依据机房、环境原因运动规律,采取控制方法,预防事故发生。(2)六个坚持六个坚持是指:1)坚持管机房同时管安全;2)坚持按操作规程管理机房;3)坚持预防为主;4)坚持全员管理;5)坚持设备维护;6)坚持
8、日常巡检工作。(3)四不放过四不放过是指在调查处理机房事故时:1)必需坚持事故原因分析不清不放过;2)职员及事故责任人受不到教育不放过;3)事故隐患不整改不放过;4)事故责任人不处理不放过。(4)文明管理文明管理是指在管理时:1)含有文明方法(机房各项规章制度);2)建立管理组织,明确岗位职责,健全管理制度(培训教育、检验、奖惩、卫生等专题管理制度);3)进行现场管理。2.学习心科长大部分时间是做机房管理实际工作。她要不停地学习多种设备正确操作方法和管理方法,管理思维方法和知识结构要紧跟时代步伐,并在技术上和项目一起成长。只有这么才能让科长提升领导能力,在管理工作中伸展自如、张弛有度。3.宽容
9、心科长要有宽容心态,尤其是对比较年轻职员。现在职员全部比较年轻,没有社会阅历,自我为中心意识强、自尊心强,有时候会做出部分过分行为。当职员做了错事或工作中出现差错时,不要训斥,不要去追究责任。作为科长,应该多花部分精力去关心职员,多给了解,做到“宰相肚里能撑船”,了解事情起因,避免未来再犯错。年轻职员有自己优点和短处,要常常表彰她优点,求同存异,含有一颗宽容心。1.1.3管理人员岗位职责机房日常运行、维护是管理人员全职员作岗位。管理人员岗位职责需要关键注意以下内容:1)负责机房电气系统运行、维护、保养、管理工作。2)认真落实落实岗位责任制,遵守各项规章制度,严格实施操作规程和职员守则。严格实施
10、机房值班制度,做好值班统计;严格实施机房设备使用登记制度,做好设备登记工作。3)熟悉设备操作规程,熟悉仪器仪表使用方法。熟悉、掌握设备原理、部署、控制、设备性能、使用情况及运维操作。维护工作应遵照设备故障和维修操作步骤、基础标准和维修方法进行。机房应备有设备所用多种零配件,供维修使用。4)服从领导调度和工作安排,按时、按质、按量地完成任务,不私自离岗和串岗,严禁在上班时间炒股、浏览无关新闻、网上游戏、看在线电影、听音乐等。5)努力学习,不停提升思想素质和业务技术水平,全方面熟悉管辖范围内多种操作规程,提升工作效率、质量。6)认真填写原始统计,分析设备运行情况,并掌握其规律,发觉问题立即处理,正
11、确无误地填制多种报表和表格。7)勤巡查,发觉问题立即向管理科长汇报,听取指示。8)参与并帮助设备维护和保养工作。设备发生故障立即组织检修,发觉隐患立即组织处理,做好技术把关工作,确保所管辖系统设备处于优良技术状态。做到“三洁净”(设备洁净、机房洁净、工作场地洁净)、“四不漏”(不漏电、不漏油、不漏气、不漏水)、“五良好”(使用性能良好、密封良好、润滑良好、紧固良好、调整良好)。9)发扬主人翁精神,开动脑筋,大胆提出合理化提议。10)做好本班设备年月检修保养计划和备品备件计划,报主管审核。1.2机房内管理内容1.2.1制订机房管理规章制度建立健全计算机机房各项规章制度是做好机房管理关键。在机房日
12、常管理工作中应依据系统具体情况、工作性质,制订出一套完善机房管理规章制度,以确保机房正常运行。规章制度用来规范机房管理,是机房管理标准。规章制度要经过日常工作中对它实施来表现和完善。机房管理制度通常包含:管理科长岗位负责制、技术管理岗位职责、中心机房管理制度、安全运行管理制度、计算机病毒防范管理制度、安全管理制度、故障机维修登记制度、机房违章处理制度、机房巡检制度等。有了章法,机房管理就有了依据,严格管理指导思想也能落在实处。1.2.2大、中型机房日常维护工作管理内容大、中型机房日常维护工作管理要关键注意以下内容:1)保持机房整齐卫生,管理人员负责日常维护及机房卫生工作,做到一天一小扫,一周一
13、大扫,保持机房清洁洁净,防尘防潮,预防鼠虫进入。2)不准在机房内会客,拒绝外单位人员进入机房,严禁聊天、喧哗、吃零食、抽烟、乱扔杂物等,保持机房整齐平静。3)严禁携带易燃、易爆及强磁性物品进入机房。4)设备通常不得用于私事,严禁在设备计算机终端上玩游戏,严禁装入其它无关软件或将计算机挪作她用。5)日常检测,包含对设备运作情况及系统应用情况检测。设备运行情况检测:每日分8次(每3小时)定时进行关键网络设备检测。做好每日网络巡查和服务器运行情况统计。每日对外网服务器日志进行分析,对长时间扫描IP做好统计,并采取跟踪,一旦发觉问题立即处理,把隐患消亡在萌芽状态。定时利用系统网络监视器、网管软件,对网
14、络漏洞进行自我扫描检测,进行分析,做好对应统计。系统应用情况检测:对应用软件要天天进行检测,立即升级,尤其是防毒软件升级。多种应用功效配置参数进行修改时必需和值班人员一同进行,并登记统计。新增加功效必需经过主管领导签字同意。6)如发觉机器故障应立即向主管及上级领导汇报,并负责计算机及外设日常维护和排除故障,处理不了问题应立即向相关单位联络处理。碰到紧急情况不要慌张,切忌手忙脚乱。在碰到三包范围内故障时,应立即催促企业上门或将机器送企业维修。7)机房计算机只供机房工作人员使用。未经组长同意,任何人不准随意删改和增加系统文件,不得将机房内资料、工具等物品带出机房。8)机房内一切公用物品(包含低值易
15、耗品、软件及资料)未经许可一律不得私自挪用和外借。外单位需借出设备及物品,应有单位证实和经手人署名借条,经主管领导同意后,机房工作责任人才能开具放行条。未经主管领导同意,不准自行复制系统内全部软件和数据或将其赠予、转借给外单位人员。9)常常检验网络和各设备运行情况,发觉问题立即处理,并向主管领导汇报。10)其它人员需使用机房内设备应取得管理人员许可,并报经主管同意后方可进入机房。11)对机房内网络和设备运行、应用、维护、查看等情况,建立档案,做好系统日志。要对发生故障(隐患)和排除故障情况做好具体统计;值班人员必需认真、如实、具体填写机房日志等多种登记簿,具体统计来人、事件、处理经过等,以备后
16、查。定时做好中心服务器日志和存档工作,任何人不得删除运行统计文档,不然追究责任。如机房发觉意外和紧急情况要立即汇报,对重大事故要注意保护好现场。12)要统一管理机房内设备,计算机及其相关设备驱动程序、保修卡等随机文件和资料要保留完整。要明确专员负责计算机文档、信息化等资料保管,要做到资料齐全,存放安全。13)机房内交换机和服务器是企业办公自动化关键设备,任何人不得自行配置或更改系统参数。14)各用户机应立即做好本身数据保留工作,不得私自更改系统及网络设置。如确有工作需要应报至办公室,由办公室指派专员进行,并统计在案。15)要做好机房安全工作,对服务器多种账号、密码严格保密。对网络运行做好监控、
17、做好统计。16)要立即做好各服务器系统补丁修正和升级工作。17)管理人员要有较强病毒防范意识,要定时对病毒库进行检测,并做好病毒库系统定时升级工作。发觉病毒应立即处理,并做好统计。18)未经许可,不得在各服务器上安装新软件。如确实工作需要安装,要经过相关领导同意。19)应立即做好数据备份工作,确保在系统发生故障时,数据能够快速、安全地恢复。全部备份数据不得更改,并要求做到当地和异地双备份保留。20)机房内全部设备应妥善保管,任何人不得私自开关、移动或使用机房中任何设备,如有此方面需要,需有主管领导指示。1.2.3大、中型机房日常安全管理内容大、中型机房日常安全管理,要关键注意以下10点内容:1
18、.出入机房管理内容1)严禁非机房工作人员进入机房,特殊情况需经中心责任人同意,并认真填写记录表后方可进入。严禁非工作人员上机操作。进入机房人员应遵守机房管理制度。2)进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行组成威胁物品。严禁将其它和机房工作无关物品带入机房。3)若管理人员申请调走,汇报经单位同意前,重大管理工作提前交接,把密码、钥匙、注意问题等交接给单位指定人员。2.机房防火管理内容机房是关键防火单位,应做好防火工作。机房工作人员必需严格遵守各项操作规程。拆装设备时必需断电,不许可带电作业;维修设备时必需先切断设备电源,再行维修;严禁使用汽油、酒精等
19、易燃易爆品清洗带电设备;严禁在机房内吸烟和使用加热器具。防火管理关键是气体灭火系统能否发挥正常作用。对气体灭火系统维护管理要注意以下4点内容:1)气体灭火系统应由经过专门培训,并经考评合格人负责定时检验和维护。2)应做好对气体灭火系统定时检验,并做好统计。检验中发觉问题应立即处理。3)每个月应对系统进行一次检验,发觉问题应立即处理,检验内容及要求以下:对全部系统组件进行外观检验,系统组件应无碰撞变形及其它机械性损伤,表面应无锈蚀,保护漆层应完好,铭牌应清楚,手动操作装置保护罩、铅封和安全标志应完整。全部系统组件安装位置不得有其它物件阻挡或妨碍其正常工作。驱动控制盘面板上指示灯应正常,各开关位置
20、应正确,各接线应无松动现象。火灾探测器表面应保持清洁,应无任何会干扰或影响火灾探测器探测性能擦伤、油渍及油漆。储存容器上压力表,其指针应在正常范围内。设备可否移位。设备工作是否正常。4)每十二个月应对系统进行两次全方面检验,检验内容和要求除按月检验内容外,还应符合以下要求:防护区开口情况、防护区用途及可燃物种类、数量、分布情况,应符合设计要求。防护区外疏散通道应保持通畅。储存容器固定支架,应无松动现象。灭火剂输送管路和喷嘴连接、灭火剂输送管路本身连接应安装牢靠。灭火剂输送管路及电气管路固定支架应无松动现象。高压软管应无变形、裂纹及老化。各喷嘴孔口,应无杂物堵塞。对每个防护区进行一次模拟自动开启
21、试验。手动控制、手动/自动切换、紧急停止操作、备用灭火剂储存容器切换操作应正常。探测设备运行情况检验:关键检验连接线路及探测器灵敏性。控制设备运行情况检验:控制器接收火灾信号情况(包含探测、急启、急停、反馈)。控制器接收故障信号情况(包含探测、急启、急停、反馈、主备电、阀线)。控制器联动性能及各个被联动器件性能。统计并分析控制器储存信息。11建立灭火系统使用档案,对使用、检验、维修和试验做具体统计。3.机房用电安全管理内容1)机房人员应学习常规用电安全操作和知识,了解机房内部供电、用电设施操作规程,注意用电安全,无触电隐患,注意节省用电。2)机房应安排有专业资质电工定时检验供电、用电设备、设施
22、。3)机房内不得乱拉乱接电线、电源,应选择安全、有确保供电、用电器材。4)在真正接通设备电源之前必需先检验线路、接头是否安全连接和设备是否已经就绪、人员是否已经含有安全保护。5)严禁随意对设备断电、更改设备供电线路;严禁随意串接、并接、搭接多种供电线路。6)如发觉用电安全隐患,应立即采取方法处理,不能处理必需立即向相关责任人员提出处理。7)严禁在无人看管下在机房中使用高温、炽热、产生火花用电设备。8)在使用功率超出特定瓦数用电设备前,必需得到机房管理人员同意,并在确保线路保险基础上使用。9)在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。4.设备安全管理内容机房设备要保持清洁、卫
23、生,定时打扫,不定时对机房内设备进行检验,发觉故障立即检修,并要登记、汇报。因违章作业造成事故损失,要按责任事故处理。设备安全管理具体内容以下:1)机房人员必需熟知机房内设备基础安全操作和规则。2)定时检验、整理硬件物理连接线路,定时检验硬件运作状态(如设备指示灯、仪表),从而立即了解硬件运作状态。3)严禁随意搬动设备、随意在设备上进行安装、拆卸硬件或随意更改设备连线,严禁随意进行硬件复位。4)路由器、交换机和服务器和通信设备是网络关键设备,不得自行配置或更换,更不能挪作她用。要定时检验是否规范,经相关领导同意后再变更。5)网管人员应做好网络安全工作,服务器、多种关键设备等多种关键账号严格保密
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 机房 综合 重点工程 管理 实施 专业 方案
限制150内