数据中心运维服务技术方案.docx
数据中心机房及信息化终端设备维护方案一、简况xxx客户数据中心机房于XX年投入使用,目前马上过保和需要续保运维的设备清单如下:序号设备材料名称规格型号品牌数量单位1.2345678910111213141516171819202122另外,全院网络交换机设备使用年限较长,已全部过保,存在肯定的安全隐患。二、维保的意义通过机房设备维护保养可以提高设备的使用寿命,降低设备消灭故障的概 率,避开重特大事故发生,避开不必要的经济损失。设备故障时,可供给快速的10 / 15备件供给,技术支持,故障处理等效劳。通过系统的维护可以提前觉察问题,并解决问题。将故障消灭在萌芽状态, 提高系统的安全性,做到为客户排忧解难,削减客户人力、物力投入的本钱。为机房内各系统及设备的正常运行供给安全保障。可延迟客户设备的淘汰时间,使可用价值最大化。通过引入专业的维护公司,可以将客户治理人员从日常需要完成专业性很强的维护保养工作中解放出来,提升客户的工作效率,更好的发挥信息或科技部门的自身职能。通过专业的维护,将机房内各设备的运行数据进展整理,进展数据分析,给客户的机房根底设施建设、治理和投入供给依据。三、维护范围1、数据中心供配电系统2、数据中心信息化系统3、全院信息化终端设备4、数据库及虚拟化系统四、供给的效劳为更好的效劳好客户,确实按质按量的对设备进展维护;我公司依据国家相关标准及厂商维护标准,结合自身多年阅历积存和客户需求,制定了一套自有的效劳内容:1、 我公司在本地储藏相应设备的备品备件,确保在系统消灭故障时,准时免费更换的器件,保障设备使用安全。2. 我公司和客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都牢靠联系到工程技术人员,全部节日都照此标准执行。3. 快速进展故障抢修:故障效劳响应时间不多于30分钟,2小时内至少2人以上携带相关工具、仪器到达故障现场,直到设备恢复正常运行。4. 我公司对修理维护的设施设备的使用性能负责,在修理维护过程中严格执行技术标准,保证设施设备的性能符合相关技术标准要求。在修理维护间,我方应对设施设备可能存在的故障隐患做出评估,并进展恰当的预防性处理,以保证设施设备的安全运行。假设故障隐患超出修理维护范围的,准时书面通知客户,并提出消退隐患建议。5. 维护巡检中我公司供给设备系统图或使用说明书:将机房内设备的整个系统等汇编成资料,由维护人员进展统一放置,便于应急查询。6. 巡检次数每年不少于四次,每次巡检后,由修理维护方供给巡检报告,并由使用方签字确认。每月由我公司客户效劳人员定期进展回访,听取客户意见反响,搭建起双方的沟通渠道。7. 供给系统应急方案:设备在12小时内还无法修复的应有备份应急处理方案。如供给适合负载功率的备机、备用空调等。8. 培训:供给专业理论学问培训和操作培训,修理维护培训,简洁故障处理培训,培训文档由我公司整理。9. 人员配置:全年包括全部的节假日期间供给不少于2名工程师在常住昆明本地,确保满足响应时间要求;到现场的维护修理工程师至少一名是能完全解决故障并有丰富从业阅历的。10. 我公司每次巡检完毕后供给维护报告,同进还供给全年维护报告、每次修理事故报告等资料,依据事故提出相应的整体解决方案等治理规划层面的内容。11、数据分析:我公司将每次巡检、修理等数据进展整理,对设备运行的数据变化量进展测数,给客户供给一份报告,系统性的介绍机房发生的变化,给客户后期系统建设、投资供给参考依据。12、供给系统相关的技术效劳:设备搬迁、系统现场保障、突发或特别应急处置。13. 我公司对客户的效劳承受自有的软件进展治理,实现包括资产治理、数据治理、合同执行治理等内容;全部大事有迹可查,治理流程化。此软件中的数据对客户开放。五、效劳内容一UPS供配电系统:全包备件1、供配电:(1) 输入输出配电柜及线缆:测量输入输出开关、线缆载流量的实际值和UPS显示值的区分。线缆外观有无破损,线缆穿插的状况,连接点的温度是否正常。(2) 线缆是否存在局部过热, 通风是否良好。2、UPS主机:全包备件(1) 全包备件保修方式保修期内设备的维护保养、故障修理所需的备件均免费修理更换。(2) 每3个月进展一次保养维护检查,内容如下:1) 外观检查:面板显示、案件、指示灯、风扇运行是否正常;2) 设备内部电感、电解电容和功率线的外观检查;3) 设备内部各功率部件及电路板信号线的物理连接检查;4) 检查模块、电路板、轨导、连接端子的键是否消灭氧化;5) 检查设备清洁程度,特别是设备内部的积尘及其他物质;6) 设备绝缘检查;7) 设备运行环境检查:设备通风及散热是否良好、环境温度、设备有无水患可能;8) UPS运行参数的检查:整流器、逆变器、静态旁路、负载运行参数是否正常、检测值与实际测量值是否有偏差不超过5%。9) 检查全部的电源保险丝、隔离开关的完好程度及是否安装结实。10) 每季度定期检测UPS输入线电压、输入频率、输入电流谐波成分、输入功率因数、 效率、输出相电压、输出频率、输出火线-零线波形、蓄电池充电电流等参数,应符合相关国家要求。11) 对每台UPS电池组进展不低于电池容量50%的放电测试,并对每台UPS电池组电池内阻进展检测,查看直流熔断器和蓄电池连接条的压降或温升是否有特别变化。(4) 每年定期用真空吸尘器清扫UPS主机内的各部件或用供给低压空气流吹风机来去除外来的残渣和灰尘。(5) 对UPS主机风扇定期进展逐步更换,每年更换量不少于总量的20%。运行5年以后逐步更换滤波电容。定期巡检尽量以观看、测量为主,削减停机。(6) 供给客户现场效劳报告,报告需要客户签字认可。 3、蓄电池维护不包配件:(1) 电池目检工程电池外观检查:外观是否变形、渗漏,安全阀四周有无液体; 电池端柱是否有腐蚀、爬酸现象或有过热痕迹;电池槽和盖的损坏; 电池绝缘检查;电池寿命:当电池到达使用年限时,提前通知用户; 电池电压测量:检查充电电压是否和电池数量相匹配; 电池端子连接是否稳固。视状况进展电池表灰尘处理。(2) 仪器测量测量和记录电池系统的直流浮充电压,此时也可选择测量和记录沟通皱波电压测量每一个电池端柱与接地间的直流电压以觉察不正常的接地测量和记录用样电池的温度测量和记录每个电池的浮充电压测量和记录系统均衡充电电压(3) UPS主机内部进展电池自检电池接触器闭合;电池处于浮充状态; 整流、逆变通讯正常; 电池状态正常;整流器工作正常; 市电电压正常; 逆变器正供电;负载功率大于指定的电池曲线设定的电池自检功率; UPS不处于联合供电状态。以上条件都满足时方可进展电池自检。假设在自检过程中,消灭上述允许条件任意一条不满足,系统将退出自检,转入均充状态。按停顿手动自检,可以中止自检过程,电池转均充。电池自检完毕转均充。二机房空调系统:全包备件(1) 全包备件保修方式保修期内设备的维护保养、故障修理所需的备件均免费修理更换。包含免费更换过滤网、皮带、风机、压缩机、电路板、室外电机、室外调速器、氟利昂 等。过滤网视状况进展更换,但每年供给不少于更换四次。皮带每年进展一次更换。(2) 每3个月进展一次保养维护检查,巡检内容如下: 1、制冷系统:Ø 检查压缩机工作声音是否正常;油镜油位是否正常;Ø 检查压缩机吸气排气压力是否正常:Ø 制冷管路阀门液管、气管、压缩机吸入及排出口阀门是否翻开;Ø 热力膨胀阀开启是否正常;Ø 压缩机转向;供电相序是否反相;Ø 检查吸气管路、排气管路、回液管路和压缩机机体温度是否正常;Ø 枯燥过滤器前后端有无温差;Ø 管路含储液罐有否漏油痕迹;Ø 视液镜水分指示是否正常;Ø 蒸发器盘管是否脏污;Ø 冷凝器翅片是否脏污;Ø 检查冷凝器风机工作是否正常;Ø 检查冷凝器压力开关/风机调速设置是否正确;2) 、送风系统:Ø 检查风机皮带轮和电机皮带轮的平面度;Ø 检查室内风机皮带张紧度;Ø 检查室内风机轴承工作是否正常;声音有无特别;Ø 检查室内风机叶轮转动是否正常;Ø 检查室内风压开关、过滤网压差开关设定值是否正确;Ø 清洁风机;Ø 检查空气过滤网是否脏污;Ø 检查全部门板是否牢靠;3) 、电气系统Ø 每半年紧全部接线端子;Ø 检查各沟通接触器吸合、分断是否正常;Ø 检查全部过流保护是否正常;整定值是否正常;Ø 检查主电源线电压、相电压、各相电流;Ø 手动启动制冷/除湿、加热、加湿功能,检查电流是否正常;4) 、掌握系统:Ø 检查掌握器初始设置是否正常;Ø 检查温湿度探头是否偏差;Ø 检查显示器工作是否正常;Ø 检查全部数据及模拟输入、输出是否正常;5) 、加湿系统Ø 检查加湿器进水电磁阀和排水电磁阀动作;Ø 检查加湿器的蒸气排出管是否畅通;Ø 检查蒸汽分散水排水是否正常;Ø 检查加湿罐结垢状况,清洗或更换;Ø 检查加湿器的进水过滤器;Ø 检查加湿器的溢水、排水盘;Ø 检查加湿器排水是否泄漏;Ø 检查冷凝排水是否泄漏;6) 、管路系统Ø 检查制冷管道保温顺包扎是否完好;Ø 检查全部管路定位是否完好;Ø 检查室内外机连接电缆老化状况是否满足空调运行需要;Ø 检查空调送风和回风管路/通道是否通畅;7) 、给水、排水系统Ø 检查给水系统是否正常;加湿进水电磁阀的进水过滤网是否脏堵;Ø 检查排水是否通畅。最终出具维护报告,记录各项技术数据,并提出意见和建议,供给运行数据分析报告。报告需要客户签字认可。三效劳器运维全包备件效劳内容包括:我公司供给主动效劳模式,做好效劳规划,提前觉察和解决问题,确保系统 24*7 运行,具体l系统故障定位和排错lWindows、Linux 操作系统安装、升级l操作系统补丁的更l效劳器微码升级l系统备份和系统恢复l数据备份和数据恢复lCPU、内存升级扩容l替换故障硬盘、RAID 重建l更换电源、风扇等易损件l更换主板和其他故障板卡l更换小型机和磁盘阵列中的各类到期电池l系统参数的调整优化l系统日志的检查和去除l系统盘的镜像检查l双机软件的状态检测l系统名目空间状态使用的监测l系统运行状态的监测l安装版本Linux 系统l在版本Linux 系统上调试系统配置l对已安装的版本Linux 系统进展测l维保设备软件范围内其它软件的升级效劳供给效劳器年度维护效劳,供给一年 24 次定期上门设备巡检,提前觉察故障隐患,削减故障造成的宕机时间。在效劳期间,机器硬件的损坏由我公司供给免费更换,客户不再支付任何其它费用。我公司供给主动效劳模式,做好效劳规划,提前觉察和解决问题,确保系统 24*7 运行,具体效劳内容包括:l帮助客户进展受支持的软件产品的根本的日常维护和治理。l帮助客户对所报告的问题进展定义及指导客户相关技术人员完成解决问题所需要的相关信息的收集工作。l我公司将帮助客户对所报告的问题进展问题根源的分析和诊断。l对于软件本身的问题,我公司将依据需要向客户免费供给相关的修正性软件。l对客户所报告的有关受支持软件产品的问题,我公司将依据需要使用标准系统进展记录和跟踪,并依据实际情形对问题的严峻程度和优先级别进展设定和更。我公司将在应用软件安装完毕后应进展根本系统测试四存储系统运维全包备件针对上述的中心数据机房存储系统相关设备维保效劳,我公司供给主动效劳模式,做好效劳规划,提前觉察和解决问题,确保系统 24*7 运行,具体效劳内容包括:l 设备故障定位和排错l 设备软件版本升级l 配置状态检测l 更换电源、风扇等易损构件l 系统使用状态检测l 系统日志分析和监控l 为信息中心的存储设备产品供给日常修理、维护效劳。l 应急保障方案。综合分析xxx 客户数据中心效劳器的软硬件配置,应用状况,在第一次巡检后向局方供给安全、牢靠、切实可行的应急方案。l 为 xxx 客户的存储治理软件配置、备份策略审核等供给技术支持效劳。l 帮助 xxx 客户对存储系统进展性能分析:磁盘读写性能、数据存储藏份安全性、I/O 性能、解决数据存储性能故障、提高存储系统性能、提升xxx 客户IT 系统整体性能。l 依据 xxx 客户信息系统进展需求,规划的存储藏份系统、容灾系统等,解决用户IT数据安全、高速增长需要。l 为 xxx 客户供给存储信息生命周期整体规划,保障用户数据的生命力。主机存储系统根本效劳内容:序号 效劳模块内容描述供给方1现场备件安装2补丁效劳协作用户进展。按备件到达现场时间工程师到达现金隆伟业场消退软件漏洞给系统带来的安全隐患,并对安装补设备厂商丁所引起的系统连锁反响进展合理的平衡。3 升级效劳4 现场故障诊断对系统进展软件或硬件的升级,以改进、完善现有设备厂商系统或消退现有系统的漏洞。金隆伟业按效劳级别:7×24 小时5 远程技术支持7×24 小时金隆伟业6问题治理系统对遇到的问题进展汇总和公布设备厂商7系统优化对客户系统的括主机、存储设备、操作系统、供给金隆伟业优化效劳。五虚拟化平台运维主要的内容如下:系统效劳备注效劳掩盖范围Fusion Sphere 软件系统根本维护Fusion Sphere 系统调优、升级、数据迁移虚拟机操作系统的病毒防护、调优与根本维护不包含杀毒软件费用效劳器、存储阵列硬件维护不包含配件更换产生的费用包含效劳器及存储阵列的软件升级、效劳器、存储阵列软件维护配置、调试、优化等包括网络的规划、调优、配置等,不网络系统维护包含配件更换产生的费用。硬件微码升级效劳响应 掩盖时间7×24 小时 响应时间10 分钟到达客户现场时间2 小时内重要时刻到达客户现场的紧急时间系统崩溃、业务停机等严峻故障时问题诊断时间30 分钟问题解决时间1-8 小时效劳报告提交效劳完毕次日定期巡检与预防性维护系统定期巡检维护2 次/月安康性检查2 次/月专家巡检1 次/月免费供给Fusion Sphere 备份软件及系统及应用备份安装部署系统软件恢复系统检查及效劳报告远程诊断系统分析依据客户要求确定是否开启远程效劳远程故障解决依据客户要求确定是否开启远程效劳远程系统性能监控依据客户要求确定是否开启远程效劳六数据库系统运维1、Oracle 数据库维保效劳u 安康巡检:供给每季度一次的安康巡检,包括:系统和数据库的可用性、完整性的检查;系统、数据库和应用性能的检查;系统的构造、恢复步骤、安装、安全扫描等相关问题的检查;对系统错误日志检查与分析,依据操作系统及 Oracle 的报错信息,觉察系统潜在问题,尽早实行措施,排解故障隐患和安全漏洞。要求巡检后提交完整的检查报告和相关的改进建议报告。u 备份恢复:依据选购人数据库系统实际状况,规划实施符合选购人工作要求的完善的备份恢复方案,以确保选购人数据库系统的安全牢靠运行。在 进展数据库备份恢复的规划实施过程中,效劳方技术人员应对选购人的技 术人员进展现场培训,确保选购人的技术人员可以独立完成相关备份工作; 在数据库消灭故障时,效劳方应尽快安排技术人员到选购人现场,恢复客 户系统,削减选购人停机时间。u 故障处理:在数据库消灭故障,导致数据库不能正常工作时,效劳方安排技术人员 2 小时内到现场解决问题并保证问题完全解决。假设不能解决问题,效劳方需自行请专家或其他高级技术人员对选购人系统状况进展分析,直至解决问题。u 远程技术支持:效劳方在接到选购人通知后的 30 分钟内响应,确认相关状况,进展 、拨号等技术支持,如需现场协调现场进展处理。u 性能调优:依据客户的需求和操作系统数据库系统的实际状况,定期分析用户的应用类型和用户行为、评价客户数据库的参数设置、数据分布、硬件和系统资源的使用状况等,并提出相关调整建议,必要时可以随时在规定的时间内派技术专家到达客户现场,处理客户系统性能问题,确保客户系统的高效运转。u 紧急故障处理:因硬件、软件或人为操作等各种不同缘由,引起的选购人数据库系统完全不能正常工作、严峻影响业务系统正常运作的故障时。能提够全年 7×24 小时365*7*24技术支持,在接到选购人恳求后,0.5 小时内安排技术人员给选购人技术人员回电,并在 1 小时内向用户供给处理方法。假设远程不能处理的紧急故障,效劳方技术人员应在 3 小时内赶赴客户现场,搜集各种故障信息,诊断故障发生的缘由,在 4 小时之内排解故障。u 需求响应:当客户有主机及数据库部署、调整、优化等需求时,准时响应客户需求,给出客户最正确解决方案,经客户认可同意后,实施方案2、Oracle 透亮网关效劳异构模式下实现 Oracle 数据库与 SQL Server 数据库联通,在 SQL Server 数据库下可以正常查询 Oracle 数据库数据七全院网络交换设备运维全包备件网络巡检效劳在维护效劳期间,与主机和存储严密协作,每个月一次现场巡检效劳。网络环境与设备物理状况巡检1) 环境检查巡检UPS 电源、地线、空调、散热、物理安全性2物理状况巡检包括:设备机体、外观、及风扇、风道及过滤器、状态指示灯、电源、VIP 模块、广域网端口、局域网端口等。硬件局部巡检检查Ø 设备连接状况检查;Ø 设备物理安全电源冗余、机房环境、线缆;Ø 设备本身冗余性检查,包括引擎的冗余、电源的冗余;Ø 设备系统及板卡指示灯状态检查分析;Ø 端口描述,端口安全性,不使用的端口建议关闭,端口性能检查;Ø 电源稳定性和线路检查;Ø 设备有关的软件、硬件和BUG 信息收集;Ø 系统运行状态、性能检查和优化,包括CPU 利用率、Mem 使用率、Buffer 安排、Crash 分析;Ø 设备扩容效劳检查分析与支持;Ø 设备物理检查(包括机体、风扇、风道及过滤器等)与清洁;Ø 检查如觉察损坏的或有隐患的部件将准时更换;Ø 系统硬件运行状况综合分析。软件局部巡检检查Ø 网络架构标准化、可扩展性、可用性、牢靠性、高性能性、安全性及可治理性等检查;Ø 系统的使用治理支持及相关升级效劳;Ø 检查系统日志分析报告(show Log) 以及其他的记录文件;Ø 安全性配置分析;Ø 治理性配置分析:设备上SNMP、LOGGING 设置,NTP 配置;Ø 网络层:路由分发配置、静态路由配置;Ø 网络系统通讯状态检查;Ø 路由协议学习治理、质量效劳QOS;Ø 检查网络流量、通讯流量掌握、网络访问安全、通讯数据类型的转发、VLAN 划分等。Ø 当前系统配置采集及系统更改信息归档;Ø 将觉察有隐患的系统问题准时排解;Ø 重要大事现场支持效劳(例如割接、设备搬迁、现网测试、组网方案等);Ø 结合系统软硬件的系统运行状况,进展网络整体拓扑构造化分析。网络设备维护效劳在系统维护期间,依据中心网络设备的状况与需求,与小型机严密结合,供给7*24小时技术维护效劳,效劳内容如下:Ø 7*24 小时远程或现场故障诊断和排解效劳;Ø 系统在线连接信息询问效劳;Ø 系统微码的使用治理支持效劳 ;Ø 软件补丁升级效劳(操作系统);Ø 配置文档备份与恢复效劳;Ø 7*24 热线效劳;Ø 重要大事现场支持效劳(例如割接、设备搬迁、现网测试、组网方案等);Ø 定期的预防性维护;Ø 现场备件更换效劳;Ø 技术培训效劳;Ø 帮助网络构造优化方案设计效劳;Ø 帮助网络安全设计及优化系统效劳;Ø 协作中心网络地址空间规划与优化设计效劳;Ø 协作网络系统性能优化设计效劳等。六、维护报价名称内容效劳级别数量报价