XXX系统运维投标文件(含运维方案).pdf
目录一、法定代表人授权书.2二、法定代表人或其授权代表身份证复印件.3三、投标申请及声明.4四、报价表.5五、报价明细表.65.1 企业简介 .85.1.1 公司概况 .85.1.2 公司资质 .85.1.3 管理与运作.85.1.4 发展目标 .85.2 同类业绩情况:.8六、投标单位资质证明文件(见下附件).9七、运维方案 .107.1 运维服务目标及服务范围.107.2 服务内容 .117.3 运维人员组织架构.137.3.1运维组织结构介绍.137.3.2运维成员职责.137.3.3运维成员组织结构.147.4 运维质量保证措施.157.4.1 质量控制管理.157.4.2 进度控制管理.157.5 运维流程及服务方式.157.5.1 服务方式 .157.5.2 运维流程 .167.6 具体服务项目及输出文档.197.6.1 小型机、pc服务器、网络设备及存储系统.197.6.2 机房空调、UPS设备运维服务.267.6.3 数据库系统运维服务.297.6.4 中间件系统运维服务.367.7 应急服务响应措施.447.7.1 突发事件应急流程.447.7.2 预防措施及处理办法.46一、法定代表人授权书xxx:本授权书声明:xxx 科技有限公司(投标单位)的xxx 董事长(法定代表人姓名、职务)授权xxx 销售经理(被授权人的姓名、职务)为本公司的合法代理人,就xxxxxx 项目投标及合同的签订,以本公司名义处理一切与之有关的事务。本授权书于年月日签字生效,有效期天,特此声明。法人授权代表签字:法人授权代表身份证号码:投标单位:xxx 科技有限公司(公章)法定代表人:(印鉴)年月日二、法定代表人或其授权代表身份证复印件三、投标申请及声明致:xxx 投资咨询有限公司根据贵方号招标文件,正式授权下述签字人销售经理(姓名和职务)代表申报人xxx 有限公司(招标投标单位名称),提交下述文件正本一式壹份,副本一式叁份。据此函,签字人兹宣布同意如下:1)承认和愿意按照招标文件中的各项规定和要求,提供相应服务(服务期一年)。总报价为(大写):元整(¥元),接招标单位中标通知书后10 天内进场提供相关服务。2)愿意按照合同法和中华人民共和国招标投标法履行自己的责任和义务。3)如果我们申请书被接受,我们将履行招标文件中规定的每一项要求,按期、按质、按量完成任务。4)我们愿意提供招标人在招标文件中要求的所有资料。5)我们理解,最低报价不是中标的唯一条件。6)我们同意按招标文件规定,交纳投标保证金。遵守xxx 投资咨询有限公司有关招标的各项规定。7)我方的申请书在开标后60 天内有效。申报投标单位名称:xxx 有限公司(盖章)法定代表人:(印鉴)年月日四、报价表招标单位:项目名称:总报价(小写):(大写):其他说明:我公司将于签订合同7 日后进场,提供优质维保服务投标单位:xxxx 有限公司(盖章)法定代表人:xxxxxxx(盖章)编 制 时 间:年月日五、报价明细表单位:元人民币序号名称数量单价合价品牌、规格备注1 维保费1 2 维保费10 3 维保费6 4 维保费2 5 维保费1 6 维保费2 7 维保费1 8 维保费2 9 维保费1 10 维保费1 11 维保费2 12 维保费6 13 维保费4 14 维保费15 15 维保费4 16 维保费1 17 维保费1 18 维保费1 19 维保费2 20 维保费2 21 维保费20 22 维保费3 23 维保费3 24 维保费2 25 维保费1 26 维保费2 27 维保费2 28 维保费4 29 维保费20 总价¥(元)投标单位:(公章)法定代表人(印鉴)年月 日5.1 企业简介5.1.1公司概况5.1.2公司资质5.1.3管理与运作5.1.4发展目标5.2 同类业绩情况:招标方名称合同金额联系人联系电话详细地址附下页:六、投标单位资质证明文件(附下页)1)企业法人营业执照复印件加盖投标单位公章;2)税务登记证复印件七、运维方案7.1 运维服务目标及服务范围通过购买专业运维服务,进一步加强 xxx 数据中心运行维护,对数据中心运行维护流程提供先进的管理理念与流程,并通过专业的技术支持为数据中心运行维护工作提供专业的技术平台,满足xxx 大数据量安全存储的要求,可以满足多种应用运行环境稳定的要求,可以满足系统及数据高效、可靠和安全运行的要求,可以满足运行设备统一管理、及时的故障恢复的要求,可以保证在数据中心构建的应用系统和数据集中运行的设备平台正常运行,满足省本级数据库和应用系统的建设需要,达到高效、稳定、安全和高扩展性的要求,为实现省本级信息化建设的可持续发展奠定集中统一的设施基础。设备及软件清单:序号名称数量质保情况1 1 在保2 10 在保3 6 出保4 2)5 1 在保6 2 在保7 1 出保8 2 出保9 1 出保10 1 出保11 2 在保12 6 出保13 4 在保14 IBM X3650 15 出保15 IBM X3850M2 4 出保16 IBM X3850M3 1 出保17 IBM X3250 1 出保18 1 在保19 HUAWEI USG5500 2 在保20 HUAWEI S9312 2 在保21 20 在保22 H3C S5100 3 出保23 3 出保24 2 出保25 1 在保26 2 在保27 2 在保28 4 出保29 中间件 WEB Sphere 6.1和 7.0 20 出保7.2 服务内容依据客户提供的设备及软件清单,我公司对xxxxxx 提供如下服务内容:业务系统服务项保证措施办法小型机、pc 服务器网络设备、存储系统现场驻点服务58 小时到达客户现场时间30 分钟内电话后响应时间60 分钟内备件到达现场时间24 小时高级工程师现场支持提供检查设备各部件的状态灯;提供检查并处理设备的错误日志;提供硬件设备的全面检查;提供网络配置的检查及测试;提供操作系统性能分析;提供小型机配置信息,根据需要调整配置;提供设备的微码版本检查;提供存储设备运行情况检查;提供提交详细的预防性维护报告和总结;提供对检查结果综合分析,并形成分析报告;提供每季度全面巡检提供系统运行环境检查:包括机房温度、湿度和零地电压、零火电压等提供机房空调运维设备故障恢复时间48 小时内全面巡检次数2 次/年坏件更换提供日常清理及更换过滤网和加湿罐等耗材提供定期清理机房空调的室外机;检修机房内各供水管路及排水管路,杜绝漏水,保证管路畅通。提供配备机房专业知识的人员对机房实行5X8 小时值班。提供UPS设备运维故障恢复时间72 小时内全面巡检,巡检时检查蓄电池使用情况,并且进行充放电;1 次/年坏件更换提供配备机房专业知识的人员对机房实行5X8 小时值班。提供数据库要求完整、详细、真实的维护记录文档,按月、季、年度提交规范的维护报告。提供维护文档提供日常运行状态监控提供BUG管理提供数据库安装、配置管理提供存储管理提供对数据库进行优化提供按季度进行巡检提供解决数据库运行中出现的各类故障提供文档提交提供中间件规范的维护制度提供维护文档提供日常运行状态监控提供BUG管理提供按季度进行巡检提供安装维护7*24 小时解决中间件运行中出现的各类故障立即响应备件保证备件库提供备件更换现场更换技术服务驻点服务:1.提供 724 小时免费故障检测与维修换件现场服务 2.预防性维护服务提供远程技术支持服务:1.提供 724 小时的故障响应电话支持 2.每周一次与客户沟通交流提供培训服务:1.专业知识培训 2.日常运维管理提供远程诊断远程拨入系统分析提供远程故障解决提供远程系统性能监控提供7.3 运维人员组织架构7.3.1 运维组织结构介绍我公司将在此运维项目中投入业务水平高、技术能力强的运维人员和质量控制人员,采用 xxx 公司严格规范的运维管理模式,进行全方位管理。为了进一步确保运维项目的进度与质量,xxx 公司在项目运维阶段、质量管理、技术文档等方面进行严密规范的部署。xxx 公司的运维队伍组成包括:运维项目总负责人(常务总经理兼任);运维管理委员会(项目经理、甲方代表、监理代表);运维驻点服务小组;技术支持专家组;备品备件供应小组;文档管理小组7.3.2 运维成员职责项目经理职责:项目经理受公司总经理任命和委托,全权负责运维项目合同的各项条款的履行。对运维项目的优质、高效、安全负全责。驻点工程师职责:1、负责对小型机、服务器、存储设备相关的申报事件进行处理和解决。2、负责对小型机、服务器、存储设备提供日常性能和运行状况监控,对故障进行分析处理及建立完善预警机制。3、负责保障机房服务器正常运行,遵循用户的安全保障管理要求。4、接受用户对服务器维护事件的督办、检查,协助服务台完成对用户意见进行回访和事件统计、分析。对服务过程和反馈的意见进行改进,同时接受服务台的绩效考评工作。5、及时提供服务器运行和问题处理情况,并向用户负责,并按周、月、季、年提交运维运维服务工作进度总结和计划。6、负责整理和归纳服务器日常维护知识库,提交至运维服务平台。7、负责整理和提交服务器运维过程资料和相关配套维护文档。技术支持专家职责:1.为客户提供 724 小时的故障响应电话支持。2.接听客户服务热线电话和接收(电话/Email/Fax 等)客户服务请求;3.通过网络或电话为客户提供即时的远程技术支持,包括软硬件故障的诊断和排除,客户端软件的安装和设置。4.协调多方服务团队,及时跟进未完成的服务请求并及时更新系统信息和状态;备品备件管理员职责:1.组织实施备品备件的订购、运输及入库工作2.负责汇总待料备件,及时采购或调拨,并主动向项目经理说明待料原因、追踪处理。7.3.3 运维成员组织结构针对本次维保项目我公司配备了5 名专职人员具体如下表:序号分派职位数量(人)姓名获得证书1 项目经理1 项目管理师资格证2 驻点工程师1 3 技术支持专家1 OCP 证书 IBM 认证证书4 备件管理员1 5 文档管理员1 备注:人员证书附下页:7.4 运维质量保证措施7.4.1 质量控制管理按照相应的 ISO9001:2000国际质量体系标准及国家规定进行质量控制,还以相应的规范要求对设计质量,施工质量、材料和设备质量进行管理、要求、控制。公司的施工阶段性内部验收制度,是质量控制管理的有利保证。工程的每一个阶段完成时,公司技术支持部门都要按有关部门规范和要求进行严格的内部验收。验收标准整体上高于用户验收标准。7.4.2 进度控制管理针对本次项目我公司结合客户要求做出如下运维计划:序号名称人员周期1 小型机、存储系统巡检报告驻点工程师/技术支持专家每周2 pc 服务器驻点工程师每周3 网络设备驻点工程师/技术支持专家每周4 机房空调巡检报告驻点工程师每周5 UPS巡检报告驻点工程师每季6 数据库系统运维驻点工程师/技术支持专家每周7 中间件系统运维驻点工程师/技术支持专家每周8 问题报告驻点工程师/技术支持专家问题解决后9 月总结报告驻点工程师每月10 季度总结报告驻点工程师/技术支持专家每季度11 年总结报告驻点工程师/技术支持专家/项目经理每半年12 定期培训技术支持专家每季度具体输出见本投标文件7.6 具体服务项目及输出文档7.5 运维流程及服务方式7.5.1服务方式针对本次项目我公司为保证各系统的稳定可靠的运行我公司根据该项目的具体要求提供三种方式的技术支持服务,分别为:现场服务、远程技术支持服务、针对甲方运维人员的技术培训服务。现场服务对客户的系统进行现场维护和巡检,驻点工程师对各个应用系统完成定期巡检,同时输出巡检报告提交给客户,驻点工程是还应对客户的故障设备进行维修和更换备件服务。为了让客户得到更及时和更快的服务,驻点工程师还提供724 小时的故障响应电话支持。远程技术支持服务远程技术服务主要是通过电话或其他方式受理客户和驻点工程师的疑难问题,通过沟通来指导客户或驻点工程师解决问题,同时远程技术服务工程师还通过电话或者其他方式与客户主动沟通来提高客户管理和运维能力。技术培训服务为提高客户的运维人员的技术水平及运维管理能力,我公司将派遣具有丰富实施经验的技术专家定期对客户进行相关专业(主机、存储、数通、网络、安全、机房环境等)的培训。培训可以采用灵活多样的方式如面对面交流、课堂授课、邮件沟通等。7.5.2 运维流程我公司除培训服务外,为本项目提供两种服务方式:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。1、技术人员现场值守运行维护服务的基本操作流程如下图所示:日常巡检是否存在问题巡检报告NO 输出定位问题YES可现场排除更换备件问题解决NOYES问题报告输出运维文件归档归档运维资源建档更新资源配置2、定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:IT资源汇总技术专家识别问题备件管理员备件更换问题报告故障解决输出运维资源建档用户驻点工程师IT资源更新告知客户7.6 具体服务项目及输出文档7.6.1小型机、pc服务器、网络设备及存储系统小型机、pc 服务器、网络设备及存储系统运维部分主要分为三部分,分别为小型机存储系统运维、pc 服务器运维、网络设备运维。小机存储系统运维内容主要包含小型机设备、光纤交换机、存储设备三部分主要从以下几个方面进行维护:1、检查设备各部件的状态灯;2、检查并处理设备的错误日志;3、硬件设备的全面检查;4、网络配置的检查及测试;5、操作系统性能分析;6、核对各小型机配置信息,根据需要调整配置;7、检查设备的微码版本;8、检查存储设备运行情况;针对如上要求输出如下检测报告:小型机系统巡检报告用户单位名称:设备名:设备型号:产品序列号:检测项目检测方式说明检查结果巡检周期电源风扇检查主电源灯状态指示灯常绿表示系统正在运行正常异常检查直 流电 源指 示灯状态指示灯常绿表示电源供电正常正常异常检查直 流电 源风 扇状态检查风扇是否散热正常异常处理器执行命令:lsdev Cc processor 检查 CPU 的数量及状态。CPU 状态为Available,表示CPU 使用正常正常异常内存执行命令:lsattr El mem0 检查内存数量及状态。size与 goodsize的数量相等表示内存使用正常正常异常磁盘执行命令:lsdev Cc disk 检查磁盘的数量及状态。磁盘状态为Available,表示磁盘使用正常正常异常适配器执行命令:lsdev Cc adapter 检查系统中配置了哪些适配器及使用状态。各个适配器的状态为Available,表示各个适配器目前工作正常。若适配器状态为Define,则表示该设备已经被配置但是未被当前系统使用。正常异常分页空间执行命令:lsps-a 检查分页空间的分配数量及利用率。Size 为已分配的分页空间数量;%Used为目前系统的分页空间使用率,该值若超过70,正常异常表示系统内存不足系统镜像执行命令:lsvg l rootvg 检查系统卷组的镜像状态。各个逻辑卷的PPs数量应该为LPs 数量的整数倍,倍数大于 1 并且能被PVs整除,表示卷组已经作镜像。各个逻辑卷的LV STATE应该为 syncd,否则表示镜像不同步。正常异常文件系统执行命令:df-k 检查已经挂载的文件系统的使用状态。重点检查/(根)/tmp(临时)/var(日志文件)这些动态文件系统的使用率最好保持在70以下。正常异常错误日志执行命令:errpt 检查系统日志是否有硬件或软件方面的永久错误。若发现错误类型为P 的信息,则需要注意。正常异常网卡配置情况执行命令:ifconfig a 检查各个网卡的配置情况,状态是否为UP,检查ip 地址和子网掩码等配置是否正确。正常异常系统备份执行命令:lsmksysb-V-f/dev/rmt0 检查磁带备份的可读性。若没有错误显示,则表示备份磁带的数据是有效可恢复的。正常异常客户确认巡检结论:【】合格【】不合格用户代表签字:年月日服务工程师签字:年月日存储系统设备巡检:设备名称:检查时间:年月日时本年度第次检查检查项目:检查结果:1.检查存储硬件情况:设备故障灯是否有亮SAN交换机端口LED状态有无正常不正常2.存储系统故障报告(Problem Log):正常不正常Problem Log/Serviceable Event 正常不正常有否硬件故障3.存储系统运行状态:View Storage Facility State/正常不正常CdaPreverify/View RIO Topology 正常不正常4.通信:正常不正常/Master Console/SMC/HMC和存储设备的通信 Good Degraded OfflineRebuilding 6.存储设备内部状态:正常不正常7.存储系统硬件状态:正常不正常双控制器同时正常工作正常不正常电池、电源和风扇模块是否物理硬盘和逻辑盘是否8.微码(Microcode)是否满足IBM 的最低要求是否9.是否启用了Call Home 是否10.收集存储设备基本信息存档是否目前存在的问题:改进措施或建议:检查结论:客户签字:工程师签字:日期:年月日日期:年月日Pc 服务器运维内容主要包含设备硬件、操作系统、软件几个方面进行考虑。PC 服务器巡检:服务器设备巡检报告用户单位名称:设备名:设备型号:产品序列号:检测项目检测方式说明检查结果巡检周期显示器正常异常光驱正常异常磁带机正常异常电源正常异常键盘/鼠标正常异常风扇正常异常系统指示灯状态前面板指示灯正常异常电源指示灯正常异常磁盘指示灯正常异常系统控制板指示灯(CPU/MEM,I/O 等)正常异常系统日志信息IML 日志正常异常操作系统日志正常异常交换区使用率TOP或任务管理器查看使用率正常异常磁盘分区使用率Windows系统Unix 系统用命令df-k C:/使用率正常异常D:/usr 使用率正常异常E:/var 使用率正常异常其它分区正常异常正常异常操作系统版本/正常异常核心 patch 版本正常异常高可用性软件正常异常数据库软件正常异常存储软件正常异常备份软件正常异常正常异常正常异常巡检结论:【】合格【】不合格用户代表签字:年月日服务工程师签字:年月日网络设备的运维内容主要包含交换机、防火墙以及负载均衡等相关设备输出文档按照如下:网络安全设备巡检报告用户单位名称:设备名:设备型号:产品序列号:检测项目检测方式说明检查结果巡检周期正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常正常异常7.6.2 机房空调、UPS 设备运维服务为保证机房内各个应用系统的设备正常稳定的运行,良好的机房环境是非常必要的,我公司针对本次项目主要从机房空调系统、UPS 供配电系统,作为重点运维内容,同时对机房内的其他指标项进行检测如机房内温度、湿度、消防系统、新风系统等。机房空调系统的运维内容主要遵循如下表单进行巡检:机房空调巡检报告用户单位名称:设备名:设备型号:产品序列号:系统检查项目检查时间:检查时间:空调 1 控制温度控制湿度%当前温度当前湿度%业务机房当前温度当前湿度%监控室、/ups 当前温度当前湿度%当前运行空调检查空调是否有排水不出产生积水、漏水现象()1号机在用()2号机在用()1号机在用()2号机在用()无积水、漏水现象()无积水、漏水现象()有积水、漏水现象()有积水、漏水现象目前存在的问题:改进措施或建议:巡检结论:客户签字:工程师签字:日期:年月日日期:年月日备注:我公司巡检人员每周会严格按照机房空调巡检报告具体要求对客户的空调系统检测,为保证空调系统的工作正常,每年不低于2 次的全面巡检,对故障配件进行检修,在日常维护中及时清理及更换过滤网和加湿罐等耗材,定期清理机房空调的室外机,检修内各供水管路及排水管路,杜绝漏水,保证管路畅通。在设备出现故障后,保证在48小时内恢复正常。机房 UPS系统的运维内容主要遵循如下表单进行巡检:UPS巡检报告设备型号:产品序列号:信息显示检查检查量测量值显示值检查量测量值显示值1 输入电压 Vab 输入电流 Ia 2 输入电压 Vbc 输入电流 Ib 3 输入电压 Vca 输入电流 Ic 4 输出电压 Vab 输出电流 Ia 5 输出电压 Vbc 输出电流 Ib 6 输出电压 Vcb 输出电流 Ic 7 输入频率 Hz 输出频率 Hz 8 输出功率 KW 输出视在功率9 电池电压 Vdc 电池电流 Id 当前 UPS运行状态市电逆变旁路电池逆变故障停机单机并机旁路或电池逆变的原因:内部检查:(检查时可能断电,用户需断开负载)是否合格处理概要1 检视输入/输出端子、螺栓、螺帽紧固性2 检视所有主控板电气连接是否安全可靠3 检查器件、电缆等损坏、老化情况4 检查风扇及风道状况5 检查机柜、电池架等结构件腐蚀、形变与连接紧固情况6 检查机内变压器、散热器等散热环境和通道状况7 检测所有滤波电容外观、紧固和泄露情况8 清扫可达空间和无源空间9 视检整流器和逆变器驱动板是否过热或烧焦10 视检整流器充电器晶体二极管是否老化11 视检直流电容/交流电容是否老化12 检查所有保险丝是否正常功能测试(如果必须进行以下测试,经客户同意后按照操作流程进行)1 市电逆变/旁路转换功能正常异常2 实际负荷下电池放电和充电等电池管理功能正常异常3 UPS逆变同步,并机均流正常异常4 报警功能和历史故障信息记录,并清除历史记录正常异常处理概要:其他问题或建议:电池检测报告有无巡检人签名:用户签名:日期日期备注:我公司巡检人员每周会严格按照UPS巡检报告具体要求对客户的UPS供配电系统进行检测,根据具体的检测结果对UPS设备进行合理维修,为保证UPS设备的正常运行,每年至少进行一次全面巡检,巡检时检查蓄电池使用情况,在客户授权的情况下进行充放电,当 UPS设备发生故障时,应在72 小时内恢复正常运行。7.6.3 数据库系统运维服务针对数据系统的运维我公司提供如下解决方案:本方案适用于技术人员的日常运维工作。ORACLE DB 维护方法数据库启动1、以 oracle 用户用户登录,sqlplus/as sysdba sqlplus startup 2、以 oracle 用户或 ora816 用户登录sqlplus/as sysdba sqlplusstartup nomunt sqlplus alter database mount;sqlplus alter database open;3、第一种启动方式是最常用的手工启动方式,第二种启动方式是数据库有故障时常用的逐步启动方式,可以观察故障点。因为startup nomount 语句只读取spfile(server parameter file 数据库参数文件),启动 instance,启动 SGA 和后台进程;alter database mount语句打开控制文件,确认数据文件和联机日志文件的位置,但此时不对数据文件和日志文件进行校验检查;alter database open打开包括 Redo log 文件在内的所有数据库文件,这种方式下可访问数据库中的数据。Startup 完成功能是上述三条语句的之和。数据库停止1、sqlplus/as sysdba sqlplusshutdown normal 正常方式关闭数据库。2、shutdown immediate 立即方式关闭数据库,在 SQLPLUS 中执行 shutdown immediate,数据库并不立即关闭,而是在所有事务执行完毕并提交工作后才关闭,所以可能会等待,因此在关闭数据前要停掉连接到数据库的所有应用程序。建议日常维护工作中的关闭数据库,采用此方式。3、shutdown abort 直接关闭数据库,正在访问数据库的会话会被突然终止。如果数据库中有大量操作正在执行,这时执行 shutdown abort 后,因日志回滚、前滚(Roll Back/Roll Forward),下次重新启动数据库需要教长时间。当用shutdown immediate 不能关闭数据库时,shutdown abort可以立即完成数据库的关闭操作。监听器的启停1、监听器的启动,以oracle 用户用户登录lsnrctl start$ORACLE_SID 2、监听器的停止,以oracle 用户用户登录lsnrctl stop$ORACLE_SID 3、监听器状态的查看,以oracle用户用户登录lsnrctl status$ORACLE_SID 4、检测服务名是否有效,在操作系统下运行tnsping SERVICE_NAME NUMBERS SERVICE_NAME为你建立的服务名,NUMBERS为你要试 PING数据库服务的次数用户管理1、用 SQL语句查看系统中已有用户情况select*from dba_users;2、增加新的用户,并授予连接和资源权限,只有授予连接权限才可登录,授予资源权限才可建表和修改create user USERNAME profile defaultidentified by PASSWORD default tablespace DEFALUT_TABLESPACE_NAME temporary tablespace TEMP_TABLESPACE_NAME;grant connect to USERNAME;grant resource to USERNAME;3、修改用户口令alter user USERNAME identified by NEWPASSWORD;4、删除用户drop user USERNAME;5、限制某个已有用户会话的连接数(通过创建 profile的方式)create profile PROFILENAME limit sessions_per_user CONNECT_NUMBERS;alter user USERNAME profile PROFILENAME;数据库参数文件1、参数文件位置$ORACLE_HOME/dbs/spfileINSTANCE_NAME.ora,参数主要分为动态参数和非动态参数,动态参数修改够直接生效,非动态参数需要重新启动数据库才能生效。2、修改参数的方法altersystem set PARAMETER_NAME=VAlUE scope=both(system/spfile)3、几个重要的参数A、db_block_size 数据库块大小,数据库创建时决定,创建后不能修改。B、db_block_buffers 数据高速缓冲区大小为此值与db_block_buffes的乘积,该区越大越好。C、share_pool_size 程序高速缓冲区和数据字典缓冲区的大小,主要用于存储执行过的sql 语句,减少重复分析,提高运行速度。该区也越大越好,但建议数据高速缓冲区加上程序高速缓冲区和数据字典缓冲区的大小(即 SGA)一般不超过系统物理内存的50%。D、sort_area_size 每个会话用于排序操作的内存大小,建议为默认值的两倍到 M之间。E、process 能同时访问数据库的最大进程数,根据连接数的多少,来设定,一般为 300 以上。F、db_io_slaves 后台写进程数对 I/O 比较繁忙的数据库,可以将其设为多于 1 个。(以上参数以 9i 为参考,在 10g 里个别参数名有所变化)数据库概况的查询1、表空间的情况select tablespace_name,stauts from dba_tablespaces;2、数据文件的情况SELECT FILE_NAME,FILE_ID,TABLESPACE_NAME FROM DBA_DATA_FILES;3、段的情况SELECT SEGMENT_NAME,TABLESPACE_NAME,SEGMENT_ID,FILE_ID,STATUS FROM DBA_ROLLBACK_SEGS;4、表、存储过程的拥有者名字和创建日期select owner,object_name,object_type,created from all_objects where object_type=TABLE OR OBJECT_TYPE=PROCEDURE 5、其他常用的视图和表v$lock 锁的情况v$session 会话的情况v$process 进程的情况v$parameter 数据库参数v$rollname 回滚段的情况v$sqlarea 共享池中的 SQL语句v$waitstat 等待的会话dba_jobs 数据里定义的作业dba_jobs_running 数据库里正在运行的作业dba_views 数据库中所有视图的文本dba_indexs 数据库中所有索引的描述dba_free_space 数据库中所有表空间自由分区dba_db_links 数据库中所有数据库链接常用对象的创建和使用1、表的创建(在表空间 zy 上创建表 dhhm为例)create table dhhm (hm varchar2(11),yhmc varchar2(60)tablespace zy;2、索引的创建(将 DHHM 表上 hm字段建立索引 hmsy存储在表空间 zy 上为例)create index hmsy on dhhm(hm)tablespace zy;3、已有存储过程、函数、包源代码的查找select name,text from user_source where name=NAME;4、数据库链接的创建和使用create public database link DBLINKNAME.world connect to USERNAME identdied by PASWORD using SERVICENAME;select*from TABLE_NAMEDBLINKNAME;5、同义词的创建和使用(以 dyh 用户可以查询并修改yyxt 用户的 dhhm表为例)cratesynonyn dyh.dhhm for yyxt.dhhm;grant select on yyxt.dhhm to dyh;grant update on yyxt.dhhm to dyh;失效数据库对象的检测和编译1、失效存储过程的查找和编译select alter procedure|object_name|compile;from user_objects where status=INVALID and object_type=PROCEDURE 然后复制粘贴并执行第一条语句的输出结果2、失效的包的查找和编译select alter package|object_name|compile;from user_objects where status=INVALID and object_type=PACKAGE然后复制粘贴并执行第一条语句的输出结果表空间的管理1、查看所有表空间大小和使用率select a.tablespace_name,sum(a.bytes)/1024/1024 total size(M),round(10000*(sum(a.bytes)/1024/1024-sum(b.bytes)/1024/1024)/1000used size(M),round(10000*(sum(a.bytes)/1024/1024-sum(b.bytes)/1024/1024)/(sum(a.bytes)/1024/1024)/100 percent%from dba_data_files a,(select tablespace_name,file_id,sum(bytes)bytes from dba_free_space group by tablespace_name,file_id)b where a.tablespace_name=b.tablespace_name and a.file_id=b.file_id group by a.tablespace_name;2、使用文件系统的表空间扩展 alter database TABLESPACE_NAME add datafile FILE_NAME size SIZE;3、用裸设备表空间的扩展alter database TABLESPACE_NAME add datafile RAW_DEVICE_NAME size SIZE;这里需要注意的是裸设备要提前建立后,且这里使用的是裸设备的字符文件(类型为 C),SIZE 值要比其实际大小要稍微小一些。4、集群中,在某一台主机上共享卷组上增加文件系统和裸设备后,一定要同步到集群中另外的主机,否则当数据库在另外的主机中启动时,会找不着相应的设备号,导致数据库不能够被打开。5、查找表空间的剩余空间块数以及最大空闲块的大小,如果碎片过多或最大空闲块过小,需要手工合并表空间碎片select tablespace_name,count(*)free block number,trunc(sum(bytes)/1024/1024)total free size(M),trunc(max(bytes)/1024/1024)max block(M)from dba_free_space group by tablespace_name;6、手工合并某表空间碎片alter tablespace TABLESPACE_NAME coalesce;数据文件 I/O 的统计优化col 文件名 format a35;select df.name 文件名,fs.phyrds 读次数,fs.phywrts 写次数,(fs.readtim/decode(fs.phyrds,0,-1,fs.phyrds)读时间,(fs.writetim/decode(fs.phywrts,0,-1,fs.phywrts)写时间from v$datafile df,v$filestat fs where df.file#=fs.file#order by df.name;错误号的跟踪出理1、在操作系统级显示其错误详细信息和常用解决办法以报ora_4031 错误为例)$oerr ora 4031 2、有时为了进一步跟踪其错误,让其产生更详细的告警日志在用户报警文件里,需要在数据库的初始化文件里加下面一句配置,并重新启动数据库event=4031 trace name errorstack level 3 这里注意的是,跟踪完毕后,应将此句话屏蔽掉,以免影响数据库性能。ORACLE 数据库日常检查1、登录到主机上利用sqlplus 检查是否可用;2、数据库告警日志的检查$ORACLE_HOME/admin/INSTANCE_NAME/bdump/alert_INSTANCE_NAME.log 此文件中记载数据库的启动、停止、系统级修改、告警信息、日志切换,是日常维护中的重要依据。会话连接日志的清理会话连接日志$ORACLE_HOME/network/log/listener.log,此文件中记载着每个连接登录时的地址和时间等情况,可作为监测的依据,因为此文件不断增大,需要定期清空,清空方式为在$ORACLE_HOME/network/log 目录下运行操作系统命令listener.log。数据库 hang住时的停止和方法在某个帐务数据库发生故障时,在将其对应的服务和后台帐务应用停完后,需要数据库重新启动,具体停止方法如下:$lsnrctl stop$kill 9 ps ef|grep LOCAL=NO|grep v grep|awk print$2$sqlplus /as sydbasqlplus alter system switch logfile;sqlplus shutdown immediate 启动方法为:$sqlplus /as sydbasqlplus startup$lsnrctl start扩表空间方法方法一:利用图形化得OEM 工具来扩,选择存储管理的表空间;方法二:利用脚本:alter database TABLESPACE_