《数据中心运维服务投标方案.docx》由会员分享,可在线阅读,更多相关《数据中心运维服务投标方案.docx(363页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据中心运维服务投标方案目录第一章项目背景及需求分析13第一节项目背景13一、大数据时代数据中心运维管理的现状13二、解决数据中心运维管理困境的策略13三、技术层面面临的挑战16四、数据中心运维的三大趋势18五、数据中心运维的重要意义20第二节项目需求分析22一、项目概况22二、项目内容22三、服务方式28四、项目重难点29五、合理化建议31第二章项目整体整体概述36第一节项目运维总体思路36一、运维服务体建设原则36二、运维服务体系总体架构36三、运维服务体系建设内容38四、运维服务项目框架50第二节运维服务目标与原则50一、总体目标50二、项目目标51三、工作原则52第三节项目服务内容53
2、一、内容概述53二、运维分类54三、工作任务64四、服务策略88第四节项目现状分析90一、基础设施90二、统一管理平台91三、应用系统92第五节运维服务承诺93一、运维工作人员93二、巡检排故工作93三、用户信息反馈及持续改进工作94四、服务响应要求94第三章项目管理组织机构98第一节服务组织设计98一、组织架构98二、组织原则99三、人员配备100四、岗位职责IOl第二节服务组织保障108一、服务体系保障108二、人员素质能力113三、人员考核制度116四、人员离岗审批117五、保险福利待遇117第四章服务管理体系建设方案118第一节IT服务管理概述118第二节运维服务管理流程体系120一、
3、服务支持120二、服务提供128第三节服务流程设计132一、服务流程之间的关系132二、服务台管理134三、事件管理流程138四、问题管理流程139五、IT资产和配置管理140六、变更发布管理142第五章运维服务内容设计方案143第一节运维服务准备143一、签订必要的协议和约定143二、人员准备143三、工具准备143第二节核心设备维保方案144一、原厂维保设备144二、第三方维保设备144第三节数据中心运维整体概述146一、基础环境运维管理146二、网络环境运维管理148三、服务器和存储运维157四、基础软件运维管理169第四节机房基础设施运维管理172一、概述172二、维护职能划分172三
4、、供配电系统172四、UPS系统175五、精密空调系统178六、新风系统179七、应急发电系统180八、安防系统185九、消防灭火系统187十、相关表格189第五节网络安全运维管理方案192一、安全运维管理要求192二、安全运维管理措施197第六节服务器和存储运维管理222一、小型机系统巡检222二、存储系统设备巡检226三、PC服务器巡检228第七节基础软件运维管理方案234一、操作系统234二、数据库235三、中间件236四、备份系统237五、应用系统237第八节应急处理服务238一、服务目的238二、服务内容239三、服务流程246第六章信息系统运行保障方案249第一节统一服务台建设24
5、9第二节建立文档管理制度250一、文档资料管理概述250二、文档资料管理流程图251三、文档资源管理的工作程序251第三节一般信息化设备及相关软件运维管理256一、一般信息化设备服务范围256二、一般信息化设备运维256三、设备例行维护流程图258四、一般设备服务方案259第四节防(杀)病毒服务267一、防病毒服务需求267二、合理的防病毒策略和安全管理制度268三、客户端防病毒升级软件269四、防毒组件及时更新269五、每周防毒系统部署情况统计269六、每周对产生的病毒事件进行评估270第五节信息资产巡检及普查服务270一、主动巡检270二、信息资产普查272第六节其他有关说明及要求272第
6、七章服务管理及服务质量承诺274第一节服务水平体系274一、报告服务274二、管理类服务274三、主动式服务275四、响应式服务275第二节服务承诺277一、服务级别承诺277二、服务质量承诺278三、服务保密承诺279第三节服务管理282一、服务管理概述282二、服务流程管理283三、服务台支持管理284四、事件管理287五、问题管理289六、知识库管理290七、配置管理290八、服务记录管理291第四节服务管理规范291一、服务时间规范291二、服务行为规范293三、服务支持规范293四、问题记录规范294五、服务流程规范296第八章项目服务保障措施297第一节项目过程管理297一、项目管
7、理297二、服务管理298第二节服务方式管理300一、现场服务301二、远程技术支持服务301三、技术培训服务301第三节项目质量管理302一、项目质量保证302二、项目质量控制303第四节项目沟通管理306一、正式沟通307二、非正式沟通307第五节项目报告管理308一、项目主要报告文件308二、项目报告管理流程312第六节项目风险管理314一、风险识别314二、风险描述315三、风险分析315四、风险计划315五、风险跟踪316六、风险控制316第七节备品备件管理317一、目的317二、适用范围317三、工作职责317四、备件采购318五、备件申请319六、备件领用319七、备件借用320
8、八、备件维修320九、备件入库320十、备件出库321H一、备件库盘点321十二、备件处置322第九章培训服务方案323第一节培训需求与目标323一、培训需求323二、培训目标324第二节培训策略324一、培训过程全程跟踪与监控324二、针对性培训325三、与项目实施紧密结合325四、采用授课结合练习的方式325五、提供多种形式的培训教材325六、利用考核验收加强学习效果326七、培训效果评估与改进326第三节项目培训计划326一、培训目的327二、培训对象327三、培训内容327四、培训资料329五、培训组织与人员保障330六、培训方式332七、培训安排332第四节其它333第十章应急服务方
9、案334第一节突发灾难应急措施334一、应急措施体制图与总则334二、突发事件应急流程335三、预防措施及处理办法336四、大型灾难紧急行动方案337第二节运行服务应急方案342一、启动应急流程342二、成立应急小组345三、应急处理过程345四、应急处理结果评估347五、统计和报告348第三节网络安全事件应急预案349、总则349二、组织体系与职责353三、应急响应357四、信息管理362五、后期处置363六、保障措施364七、预防工作366八、附则36698简介本方案为数据中心运维服务项目,全文采用宋体四号字体,共337页。本文档为WORD格式,清晰无水印,可直接编辑。第一章项目背景及需求
10、分析:涵盖项目背景、项目现状分析、项目需求分析等内容。第二章项目整体服务设想:涵盖项目运维总思路、运维服务目标与原则、项目服务内容、运维服务承诺等内容。第三章项目服务管理体系建设方案:涵盖IT服务管理概述、服务水平体系、服务管理体系、服务流程设计、服务管理措施、服务管理规范等内容。第四章项目运维服务方案:涵盖运维服务准备、核心设备维保方案、数据运维整体概述、机房基础设施运维管理、网络安全运维管理方案、服务器和存储运维管理、基础软件运维管理方案、应急处理服务等内容。第五章信息系统运行保障方案:涵盖统一服务台建设、建立文档管理制度、一般信息化设备及相关软件运维管理、防(杀)病毒服务、信息资产巡检及
11、普查服务等内容。第六至八章:涵盖项目服务保障措施、项目应急服务方案、项目管理组织机构等内容。特别提醒:请在编制时依据项目实际情况,调整内容。第一章项目背景及需求分析第一节项目背景一、大数据时代数据中心运维管理的现状大数据时代作为时代发展的机遇出现在大众视野,但是也是作为挑战逐步渗透在行业的数据中心运维管理中。以计算机技术为依托的数据中心运维管理的显著特点就是大规模的数据流量,正在不断与原有的数据中心架构产生冲突。目前,大数据时代的数据中心运维管理的先进意识已经深入人心,但是实际项目操作过程中会有众多的问题出现。因为在磨合期,所以现有设备不能满足大数据时代的数据中心管理要求;运维管理人员的没有经
12、过大数据时代新的运维管理思路的熏陶,技术水平与之不匹配;还有就是数据中心的运维管理制度不都完善,相应的管理水平不高。二、解决数据中心运维管理困境的策略针对目前数据中心运维管理的困境,主要解决策略如下:(-)提升运维管理人员的整体能力基于目前数据中心运维管理工作人员的实际能力,通过采取以下积极的措施来提升运维管理工作人员的综合能力水平。1 大数据背景下,强化数据中心运维管理人员的技术应用水平:通过多维度的检验途径,比如定期检查该技术的理论与实践水平确定工作人员的当前能力,在制定符合目前技术短板的相关培训,从而保证运维管理工作的顺利进行。2 .加强管理方面的知识渗透:在加强数据中心运维管理人员的技
13、术应用水平的前提下,可以加强管理学知识的渗透,为技术团队的整体语言表达能力的提升以及为管理层储备后续力量,既懂技术又懂管理的新世纪人才,有助于数据中心运维管理工作更加高质量地完成。3 加强工作人员执行力,更高效地完成工作:在数据中心运维管理的众多评价标准中,执行力是影响一个团队整体运作能力很重要的一个指标,良好的执行力可以保证时间段内的工作目标提前完成或者超量完成。(二)强化业务管理工作和业务培训工作现如今,科学技术的更新速度往往超出人们的接受速度,在数据中心运维管理这个领域也同样适用。所以使得运维管理人员刚刚熟练掌握新的运维既能并熟练应用,新的技术又刷新了行业应用领域。所以设立专门的培训机构
14、,强化管理人员终身学习的意识,紧跟时代发展的脚步。1 .制定合理的业务培训和业务管理培训计划:科学合理的方案总能给予人们正确的指导,并保证在规定期限内达到既定目标。运维管理培训和业务培训的内容要与时俱进,不断为管理人员灌输新的知识,为运维管理的工作融入新鲜的血液。2 .合理安排培训时间:运维工作人员在企业内是员工,男性员工在家庭里是儿子,是丈夫,是爸爸,所以要协调好培训的时间,保证员工能充分解决员工之外的各种事情,全身心地投入工作。3 使业务管理和业务培训的形式呈现多元化:公司管理层应加强与行业内部各组织间的联系,比如同专业的大学、同行业资深专家、专业讲座等等。通过多元形式的学习加深对行业发展
15、的了解,并积极促进管理人员的专业素养。4 .定期进行培训效果的考核:(1)在定期进行学习之余,为检验学习效果是否达到预期目标,应适时进行检验,进一步促进运维工作人员的学习质量的提升,提升其主观学习的动力。(2)强化对运维工作人员的业务培训,能够有效地对运维工作者的维修技术进行与时俱进的培训,能够有利于运维管理工作人员进行数据中心运维管理工作的开展,最终有利于信息技术飞速发展下的运维工作的稳定进行。(三)加强了解整体行业环境的意识有些企业的运维管理的硬件设施和软件配备欠缺,造成整体的管理水平低,是因为企业没有采取相应的举措保障。以下将详细讲述如何提升整体行业环境的了解。L在企业内订阅与本行业相关
16、的杂志和报纸,并且做到人手一份,从而能够为运维人员了解本行业的发展状况提供便利的条件。2定期组织团队中的成员进行行业发展前景的探讨,在探讨交流的过程中了解当下运维管理工作的总趋势,从而能够为运维工作的有效进行提供有价值的参考意见。3鼓励运维员工在各种级别的刊物上发表论文,并且将其发表论文的质量和所发杂志的权威性进行评估,与其的个人职业发展紧密联系起来,从而能够对其关注数据中心运维管理工作的关注起到积极的促进作用。强化了解和分析业务环境的意识,能够有利于运维管理工作人员有行业的危机意识和行业的发展意识以及个人职业规划意识的提升,最终有利于大数据时代数据中心运维管理工作的顺利开展。三、技术层面面临
17、的挑战1、数据中心运维管理面临的挑战虽然当前企业数据中心得到了完善与优化,但在大数据时代下运维管理工作中仍然面临着较多的挑战。首先,在上层业务方面,数据中心的主要工作是进行数据计算,这就需要适当调整性能参数与业务流量,以此来保证服务器、数据库和呢b等能够稳定运行。其次,从数据中心的基础设施方面来看,必须要应用相关的整个管理工具,并且通过一个平台对所有基础设备进行管理,如路由器、交换机、服务器等,确保数据中心可视化的管理需求能够得到满足。最后,企业数据中心运维管理的水平与效率与各部门中的业务质量将会产生直接影响,所以必须要管理好数据中心的硬件与软件,积极引进先进的管理方法与管理制度,做好各设备之
18、间的协调工作,提高数据中心运维管理水平。2、数据中心运维管理存在的问题大数据时代的正式到来,为企业数据中心的发展带来了更多的发展机遇,数据中心处理的方式方法与之前相比大不相同,并且运维管理工作的整体目标也发生了极大的转变。首先,传统的数据中心工作的主要方向是解决当前的问题,也就是如何才能保证不出现问题,若是出现问题时应如何处理。其次,大数据时代导致数据中心运维管理的中心与工作对象发生了调整,再加上大量虚拟化技术设备的出现,导致数据中心运维管理工作更加复杂,虚拟化和自动化逐渐成为数据中心运维管理人员的重点工作。随着社会经济不断发展,各行各业在科学技术的帮助下都取得了较大的发展成果,并经过努力取得
19、了显著的成就。但从当前数据中心运维管理整体现状来看,依然存在信息资源配置滞后的问题,直接影响数据中心信息系统的正常运行,为后续运维管理工作带来了较多难题。除此之外,各行业的业务数量与业务种类繁多,数据中心信息系统也变得更加复杂。经调研发现,数据中心出现的事故大多是因为流程不恰当或人为操作失误而造成,再加上数据中心的软件与硬件发展更加趋向集成化,这种落后的数据中心运维管理方法已经与实际需求产生脱节现象,因此只有不断提高数据中心运维管理水平,才能够跟随时代发展的脚步,促使企业得到更加良好的发展。四、数据中心运维的三大趋势AI技术及超级计算机在医疗领域的应用,在武汉新型冠状病毒基因测试系列和药品筛查
20、方面,发挥了非常重要的作用。作为这些前沿技术和设备的支撑中心,数据中心基础设施的安全、有序、可控的运维和管理工作至关重要。在行业资深人士看来,要巩固数据中心这个大堡垒,包括外包运维公司、集成商、承建商和直接业主,会继续在三个方面加强运维的管理工作。1、整体的运维自动化全面升级在整体的运维领域,数据中心的兴起,标志着IT应用的规范化和组织化进入新时代。在海量IT基础设施前,人工作业模式难以支撑新型数据中心的正常运转。从用户角度看,当IT基础设施建立齐全,并提供给客户大规模使用之后,数据中心的持续运行是保障其业务连续性的前提。为此,对于IT资产全生命周期的管理,例如资产寿命预警和故障快速定位,都将
21、提升数据中心的可用性。数据中心运维转型升级到利用自动化、智能化手段节支增效,将是行业变革的重要标志,当前,包括3D可视化管理平台、环境动力监控系统等自动化运维方案,正帮助用户摆脱耗时耗力的工作,以提高数据中心运维和管理的整体效率。2、关键的U位资产将加强数字化管控在更细分的关键运维领域,作为数据中心的灵魂,U位资产是承载了计算、存储、网络等功能的服务器,为了将规模庞大的服务器通过数字化手段,自动有序管理起来,数据中心运营管理者们,需要继续探讨以最新的物联网MC-RFID技术为主的数字化管控方案,结合2D/3D可视化技术,温湿度传感技术等,在RFID资产管理平台上提高U位资产的追踪定位能力,最终
22、目标是实现U位资产运维管控效率的提升,提高资产的可用性和投资回报率。3、运维团队的建设和转型除了大型数据中心,会配备专业的运营团队,一般的数据中心,基础设施的运维和管理工作,业主要么外包给第三方的运维公司,要么由其他IT人员兼职,这样非可控和非专业运维的机制,导致的结果是运维效率低下,运维工作不细致,瑕疵多,成本高,设备闲置和浪费现象严重。而随着数据中心重要性的提高,业主们梦想着完善基础设施的运维和管理工作,包括专业人员的培训,招聘更专业的技术运维人员,以及引进成熟稳定的运维管理体制和系统平台,运维人员及团队也面临着职业重新规划、定位和转型的机遇。2018中国数据中心行业发展调研报告的数据显示
23、,包括数据中心在内的信息通信技术(ICT)基础设施投资对国家经济起着重要的拉动作用。报告显示,2016年每新增1美元的ICT基础设施投资能拉动3美元的GDP增长,2020年将提高到3.7美元,预计2025年将提高至5美元。可以推断,数据中心产业将继续保持高速增长的趋势,各种规模的数据中心运维和管理工作将迎来新的挑战和机遇,这是一个巨大的市场,精准把握其发展趋势,可以让我们掌握发展的主动权。五、数据中心运维的重要意义L通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。设备故障时,可提供快速的备件供应,技术支持,故障处理等服务。2通过系统
24、的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提高系统的安全性,做到为XX单位排忧解难,减少XX单位人力、物力投入的成本。为机房内各系统及设备的正常运行提供安全保障。可延迟XX单位设备的淘汰时间,使可用价值最大化。3 .通过引入专业的维护公司,可以将XX单位管理人员从日常需要完成专业性很强的维护保养工作中解放出来,提升XX单位的工作效率,更好地发挥信息或科技部门的自身职能。4通过专业的维护,将机房内各设备的运行数据进行整理,进行数据分析,给XX单位的机房基础设施建设、管理和投入提供依据。5 .随着信息化的不断发展,IT基础设施规模也越来越庞大、结构变得相对复杂,而数据中心对IT基础
25、设施的管理主要以手工为主,对基础设施故障的管理处于被动救火的状态,故障分析速度慢,根源定位难度大,基础设施更新换代、扩容建设缺乏科学性能评估依据,难以应对业务系统安全运行保障要求。第二节项目需求分析(各单位根据项目实际情况进行描述)一、项目概况本次采购的主要目的是解决XX单位XX数据中心的需要,以便于XX单位更好地从事日常工作。其主要目标是为了XX能够满足其需求的数据运维服务,解决其现实的需要;提高XX单位分析和运用数据的能力,最终是为了XX单位自身能够解决其实际需要,并能够更好地服务于XX单位的工作生活。二、项目内容(-)核心设备维保服务方须应严格按要求做好核心数据相关设备的维保维护服务(服
26、务期为XX年)。对要求原厂维保设备,服务方应及时协调设备原厂商予以维修,并监督维修时效和质量。对第三方维保设备,应设置备件库,如需更换配件,应及时联系提供维保服务的第三方维保服务商,严格按照响应时间要求提供相关配件。所需配件购置费用由服务方承担。如设备需要整机维修,服务方须在响应时间内提供同等性能的备机,并及时恢复运行。机柜名称数量品牌型号质保年限备注(二)数据中心运维服务1.服务器运维服务:定期对服务器运行状态进行检查和分析,完成巡检报告;对服务器故障提供远程支持,修复故障,提供故障报告。(1)日常维护:标签制作、粘贴;线路整理;磁盘检查;逻辑卷空间调整;设备日志检查;周期性日志清理;日常维
27、护报告。(2)设备巡检:设备性能分析;完善、改善性建议;巡检报告;(3)故障处理:故障的排查、分析;故障的排除、恢复;确认排除、恢复的结果;设备硬件报修及跟踪处理;故障处理报告;故障硬件或模块更换。(4)升级:主板BIOS版本检查与更新;设备操作系统版本检查与更新;设备驱动检查与更新;设备硬件升级改造方案制定;设备硬件升级改造方案执行。(5)性能优化:分析性能瓶颈;优化措施制定;优化措施执行。(6)日志分析:1)设备错误日志分析。2)提供XX单位虚拟化架构,虚拟化备份资源划分、使用率情况说明。2 .存储运维服务:对磁盘阵列、光纤交换机、备份存储设备等,定期进行运行状态检查和分析,完成巡检报告,
28、对存储故障提供远程支持,修复故障,提供故障报告。(1)日常维护:设备告警检查;存储介质可用性检查;存储设备线路整理;日常保养报告。(2)定期巡检:设备可用性检查;性能检查;巡检报告。(3)故障处理:故障的排查、分析;故障的排除、恢复;确认排除、恢复的结果;设备硬件报修及跟踪处理;故障处理报告;故障硬件或模块更换。(4)监视监控:存储设备状态检查;存储设备连通状态检查;存储阵列状态;硬盘物理状态;硬盘逻辑状态;热备盘接管状态;磁盘通道状态;主机通道卡状态;电源模块状态。3 .虚拟化运维服务对VMware超融合、虚拟化平台软件运行状态进行检查和分析,完成巡检报告;对平台软件故障提供远程支持,尽快修
29、复故障,提供报告;针对平台软件运行情况,给出优化建议并实施,提升性能;根据业务发展趋势,评估应用当前性能,提出性能建议。(1)日常维护:虚拟机的架设;虚拟机的回收;虚拟机相关资源配置。(2)系统巡检:平台软件运行状态进行检查和分析;平台逻辑链路进行检查和分析;根据平台运行情况给出优化建议;对虚拟机运行过程中产生的临时文件进行处理;完成巡检报告。(3)故障处理:平台软件故障提供远程支持;虚拟机系统故障和问题进行分析和排除;虚拟机网络故障和问题进行分析和排除;平台底层问题排查处理。(4)升级:虚拟机底层固件版本升级;虚拟化平台管理工具升级。(5)数据迁移:D基于虚拟系统应用数据迁移;虚拟资源规划调
30、整跨数据分区数据迁移;基于虚拟化平台不同设备之间的数据迁移。2)为保证与其他软硬件设备维保服务的时间的一致性,本次为虚拟化软件采购原厂商一年7X24基本支持和订购服务。服务内容包括免费的版本升级和专业的售后服务专线支持,其中关键问题响应时间不超过XX小时,主要问题响应时间不超过XX小时。3)虚拟化软件包含用户己采购的VMware虚拟化软件,当前采购授权数量为VCenterI套,vsan28CPU。需提供VMWare原厂商一年续保服务承诺函。4 .数据备份与检查:(1)服务方为XX单位核心业务系统制订备份管理策略,部署和实时数据备份工作。(2)服务方应定期对核心数据备份情况进行检查确认,确保所有
31、备份任务正常运行,对发现未正常完成的任务应及时排查解决并做好登记。(3)根据XX单位现有的虚拟化备份系统,每年至少进行XX次抽取XX台虚拟机进行恢复测试验证。5核心业务系统梳理:(1)建立XX单位核心信息系统档案,包含系统名称、上线时间、开发厂商、主要功能、负责人、服务对象等信息。(2)服务方负责整理XX单位核心业务系统梳理表,定期更新表上包括应用服务器IP、用途、数据库服务器IP、主管部门、安全保护等级、业务联系人、系统状态(在用/停用)、运维公司等信息。(3)服务期结束后应提供最新的XX单位核心业务系统梳理表。(4)服务方需提供重要系统业务逻辑相关梳理分析工具,工具需支持主流的window
32、s及Iinux系统,能够通过相关配置文件设置数据采购频率及周期(提供配置截图),自动监控记录重要系统业务访问情况,并将采集结果汇总报告输出到文件(提供输出报告样本);同时结果可作为访问控制策略优化的参考,工具采集内容包括:系统进程名称、源IP地址、目标IP地址、系统访问协议、业务连接状态等(提供工具运行界面截图包含进程名称、源IP地址、目标IP地址、系统访问协议、业务连接状态)。6 .安全通告服务:定期为XX单位推送最新的安全漏洞和趋势发展,通告内容包括但不限于:(1)主机系统漏洞安全通告。(2)中间件、应用漏洞安全通告。(3)安全设备漏洞安全通告。(4)病毒安全预警通告(最新流行、严重病毒发
33、展趋势及应对措施)(5)其他安全威胁通告(最新严重的安全威胁分析及预防措施)安全通告服务技术人员要求具有个人CNVD原创漏洞证明,投标时提供技术人员姓名、联系电话、照片、身份证复印件及证明复印。为保证服务连续性,服务方未经用户同意不得擅自变更服务技术人员。7 .数据咨询服务:对XX单位核心数据生命周期的安全规划、设计、实施、运维等各个阶段提供网络安全咨询服务,提供风险规避建议及根据客户需求提供解决方案。咨询内容包括但不限于:(1)系统安全漏洞咨询。(2)安全体系建设咨询。(3)安全设备策略配置咨询。(4)安全项目规划及建设咨询。(5)日常安全体系管理咨询。(6)XX单位反病毒事件安全问题咨询。
34、安全咨询服务技术人员要求具备CISP和CISSP证书,投标时提供技术人员姓名、联系电话、照片、身份证复印件及证书复印。为保证服务连续性,服务方未经用户同意不得擅自变更服务技术人员。三、服务方式为保证XX单位各系统的稳定可靠的运行,要求提供三种方式的技术支持服务,分别为:现场服务、远程技术支持服务、技术培训服务。(-)现场服务对XX单位信息系统进行现场维护和巡检,运维工程师对各个系统(服务器、存储、虚拟化及备份等系统)完成定期巡检,每个月输出XX次巡检报告提交给XX单位。(二)远程技术支持服务远程技术服务主要是通过电话或其他方式受理客户和运维工程师的疑难问题,通过沟通来指导XX单位解决问题,同时
35、远程技术服务工程师还通过电话或者其他方式与XX单位主动沟通来提高XX单位管理和运维能力。(三)技术培训服务为提高XX单位运维人员的技术水平及运维管理能力,提供丰富实施经验的技术专家定期对用户进行相关专业(虚拟化、主机存储等)培训。四、项目重难点(根据项目实际情况修改)随着XX单位IT架构的不断扩展,网络设备、安全设备、服务器等数量增多,加之虚拟化云架构的出现和普及,数据中心的复杂程度越来越高,运维管理的复杂程度急剧攀升,一个稳定且高效的数据中心运维管理软件可以为政企的管理和发展提供强大的支持。(-)数据中心运维监控故障难定位、流程混乱无统一规范数据中心中设备需要长时间,不间断,低能耗,安全可靠
36、的运行,一旦发生故障,需要快速定位,及时准确处理,通知业务相关部门,这一切对于运维人员都是巨大的压力。本公司的运维监控管理平台集成了从故障发现、到工单处理、处理反馈等为运维系统提供了一个完整的不管提升的流程处理机制。(二)网络和数据中心管理IT运维成本高,如何高效可控?一边是XX单位信息化需求下不断增长的IT支出,一边是不断缩减的IT预算。IT系统越来越庞大,人员却没有增加,人力资源投入导致运作成本的增加。对于设备产业管理不到位,导致资源没有得到合理地使用。如何高效、有序、可靠地管理整个计算机网络系统,对信息中心的正常运作尤为重要。(三)对运维监控管理平台人员能力要求高,如何保障业务稳健?随着
37、经济的发展,IT设备也随之更新和增加,如果用传统的维护方式就会浪费大量的人力物力,同时,如果IT运维人员没有系统的知识体系,就会导致XX单位的IT相关工作面临极大的危机和隐患。在日常的运维工作中,IT运维人员多在被动地处理己发生的故障,这会影响XX单位整体的运行,如果稍有不慎,甚至会集中爆发出一系列问题。如何在有限的投入下尽快建立高效、规范的统一运维管理平台,实现以业务为核心的监控管理系统,从而提高信息部门的运维管理水平,改善单位IT系统的运行质量,为单位打造核心竞争力提供助力,已经成为当前信息部门面临的重要问题。五、合理化建议(-)集成化整体本公司数据中心运维监控管理平台的开发使用户通过运维
38、监控管理平台能很方便地了解到当前整个网络和数据中心管理情况和当前用户所关注的网络设备、服务器、存储、数据库、中间件、网页服务、链路、业务系统的当天信息和历史信息,以便从多方面了解网络的历史和实时运行情况。对于用户管理比较复杂的网络环境与服务系统提供了方便,在运维监控管理平台的展示中就可以看日常工作时关注的网络对象的情况,而且操作步骤简单,易于用户接受的整体监控。(二)多元化一览数据中心运维监控管理平台支持对多种网络设备集中管理,可跨厂商、跨平台,有良好的扩展能力,同时管理大量网元数,支持灵活的分布式部署。运维监控管理平台对符合SNMP标准协议的设备支持全网自动发现。一览监控提供对IT设备的资源
39、管理、性能监控、故障定位、数据分析、产业管理、可视化展现等做到实时监控,将运维监控管理平台设备运行情况一览无余,构建网络和数据中心管理,全面提高用户管理水平。(三)动态化视图本公司统一运维管理平台动态可视化拓扑图,系统自动生成网络拓扑,直观掌控全局。实时掌握运维监控管理平台环境中各种资源的当前分布与设备运行情况,提供丰富的图形化视图和便捷的布局模式,满足用户各种场景的拓扑展示,将复杂的网络关系以最简明、直观的方式呈现。并能通过颜色策略、动态流量、告警提示变化来表示每个资源的异常等级,做到故障快速定位,帮忙IT运维管理人员快速掌握全局网络和数据中心管理状况。(四)智能告警监控数据中心运维监控管理
40、平台可以满足运维人员不同时间段不同监控的需要。故障管理将违反阈值的指标,通过客户端,邮件,短信,微信,声光等多种方式,告知运维人员进行及时响应,并在网管故障中进行统一展现,将触发的告警信息按照告警的类型、级别、地域、时间等多维度进行智能分类,并提供知识库,方便用户对所有的异常信息进行受理和诊断。同时结合ITIL流程理念,可与本公司ITSM流程进行实时联动,故障产生后可快速在ITSM流程中生成请求工单,方便用户建立规范,IT服务。(五)详细化报表管理统一运维管理平台集中展示当前系统中已订阅的报表,自动定时发布所形成的日报、周报、月报、年报以及指定时间段的业务报表,可以对具体内容进行查看与配置,运
41、维监控管理平台支持自定义报表类型,以及报表的查看权限,方便共享使用,且支持excel、PDF格式的导出便于发布和提交,供领导查看。(五)三维机房管理数据中心运维监控管理平台通过3D立体化模拟机房,以直观、交互易用的实时数据对接方式,运维监控管理平台将机房动力环境的温度、湿度、烟雾、漏水、电源、气体浓度、红外、门禁、摄像头监控系统、空调及UPS等机房动力环境监控与管理。统一运维管理平台与网络环境的IT资源机柜拓扑联动,完整集成到机房管理中进行全面监控、打造网络和数据中心管理信息。(七)IT流程管理系统数据中心运维监控管理平台以ITIL/ITSM为核心实现工单管理规范和自动化统一运维管理平台,将运
42、维监控管理规范化为一系列标准流程,包括服务台、告警管理、问题管理、变更管理服务进行规范定义,简化告警处理流程,提高运维监控管理水平。对工单类型、状态、申告人进行展示管理,实现工单派发,直接在工单列表进行工单处理、工单扭转、工单关闭等过程的规范和自动化,以图形的形式,实时记录全部的操作流程,展示工作的流向顺序,明确流程管理责任,提高网络和数据中心管理工作效率。(八)实用与便捷的知识库数据中心运维监控管理平台提供内建的知识库,同时支持用户多分级多分类的知识体系建立,在系统上快速构建自己的知识库,知识库是为了逐步建立和完善告警处理和性能分析的知识,记载对不同告警情况的不同处理手段以及对异常的能指标所
43、采取的优化措施,以供查询、共享经验,为维护人员处理告警、性能分析提供辅助分析决策,可进行快速查看知识,自动解决问题,减少运维人员的工作压力。(九)全生命周期管理数据中心运维监控管理平台统计企业所有设备硬件及软件产业,将众多IT设备信息整合,高效统一运维管理企业设备资源,展现硬件、软件以IT服务之间的逻辑关系。清晰查看其相互之间的父子依赖关系。统一运维管理平台记录设备产业上线、维修、申领、报废、借出、报废、合同信息、维护商等产业数据管理进行系统化管理,并详细记录每个设备的使用情况和各种状态变更记录,如维修的次数、借出、使用人员变更等,掌握产业走向,避免产业走向不明。(十)摄像头运维监控管理平台本
44、公司的智能摄像头管理是业界首创的真正以运维人员的需求和设备运行维护保障的视角出发,统一运维管理平台将整合跨厂商跨平台的管理模式,将分级下属的摄像头设备进行统一展现和管理,摄像头设备的运行情况,统计概括,根源分析,以全局管理帮助用户进行网络和数据中心管理和分析。运维监控管理平台做好事前预防、事中根源分析找到问题源头、事后统计分析。运维监控管理平台确保摄像头设备正常使用和运行维护状况,对网络和数据中心管理进行有效管理,保障摄像头监控业务的可靠连续和高质量运行。第二章项目整体整体概述第一节项目运维总体思路一、运维服务体建设原则本项目运维服务体系建设的原则有以下几个方面:1 .以完善的运维服务制度、流
45、程为基础。为保障运行维护工作的质量和效率,制定相对完善、切实可行的运行维护管理制度和规范,确定各项运维活动的标准流程和相关岗位设置等,使参与本项目服务的运维人员在制度和流程的规范和约束下协同操作。2 .以先进、成熟的运维管理平台为手段。通过建立统一、集成、开放并可扩展的运维管理平台,实现对各类运维事件的全面采集、及时处理与合理分析,实现运行维护工作的智能化和高效率。3 .以高素质的运维服务队伍为保障。运维服务的顺利实施离不开高素质的运维服务人员,我公司将不断提高运维服务队伍的专业化水平,有效利用技术手段和工具,做好各项运维工作。二、运维服务体系总体架构运维服务体系由运维服务制度、运维服务流程、运维服务组织、运维服务队伍、运维技术服务平台以及运行维护对象六部分组成,涉及制度、人、技术、对象四类因素。制度是规范运维管理工作的基本保障,也是流程建立的基础。运维服务组织中的相关人员遵照制度要求和标准化的流程,采用先进的运维管理平台对各类运维对象进行规范化的运行管理和技术操作。1 .运维服务制度和流程:为确保运维服务工作正常、有序、高效、协调的进行,需要根据管理内容和要求制定一系列管理制度,覆盖各类运维对象,包括从投产管理、日常运维管理到下线管理以及应急处理的各个方面。此外,为实现运维服务工作流程的规范化和标准化,还需要制定流程规范,确定各流程中的岗位设置、职责分工以及流
限制150内