2022年服务器巡检常规检查项 .pdf
服务器巡检项目经理需要定期对硬件、软件及数据库环境进行检查常规检查项如下:1.服务器部分:服务器前面板有无故障灯闪烁,或者面板有无提示报警信息。服务器电源,查看电源模块指示灯是否长亮。服务器硬盘每个硬盘指示灯是否有报警灯闪烁。服务器主机序列号确认,再电话报修原厂商或者对口供货商技术支持人员。2.存储部分:存储系统指示灯是否有报警灯或者错误灯常亮。存储每个硬盘指示灯是否有报警或者损坏的颜色灯亮。存储序列号确认,再电话报修原厂商或者对口供货商技术支持人员。3.网络部分:网络交换机和光纤交换机指示灯是否有报警灯或者错误灯常亮。网络交换机和光纤交换机序列号确认,再电话报修原厂商或者对口供货商技术支持人员。IBM 4008101818 HP 4006102058 DELL 4008845177 4008868616 HDS 4006786793 ORACLE 8008100365 4.操作系统部分:查看系统日志Windows系统:利用事件查询器导出系统日志,应用日志,注意日志数量,避免因日志容量限制仅存在日期不足的日志;发现错误日志,尤其连续错误为严重问题应进行排查解决。LINUX系统:查看 cat/var/log/messages系统日志,有无报错信息。查看磁盘空间Windows下查看业务磁盘空间,与历史规律比较有无异常增加查看业务数据所使用的临时目录是否存在大量未处理的文件,如果存在应与排除。集群模式下,查看仲裁盘是否有业务数据占用,应禁止除操作系统之外任何业务数据使用。在软件更新过后或业务扩大使用范围后,应重新评估建立新的数据量使用规律,以指定下次检查时间。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 3 页 -LINUX下查看业务磁盘空间查看命令 df-h 时间校准检查所有服务器时间应与标准时间差异在30秒以内。Windows查看右下角日期时间部分,如果有差异请调整。Linux 查看命令 date,如果有差异用 date s hh:mm:ss 更新时间对于 oracle RAC 的集群环境,请先关闭 CRS 和一个 instance实例再同步系统时间,否则会导致节点重启。5.数据库部分:查看数据库alterlog;/u01/app/oracle/diag/rdbms/emr/emr1/trace/altersid.log 查看 RAC集群的 CRS 状态:crs_stat-t Name Type Target State Host -ora.DATA.dg ora.up.type ONLINE ONLINE rac1 ora.ER.lsnr ora.er.type ONLINE ONLINE rac1 ora.N1.lsnr ora.er.type ONLINE ONLINE rac2 ora.OCR.dg ora.up.type ONLINE ONLINE rac1 ora.asm ora.asm.type ONLINE ONLINE rac1 ora.eh.db ora.se.type ONLINE ONLINE rac1 ora.emr.db ora.se.type ONLINE ONLINE rac1 work ora.rk.type ONLINE ONLINE rac1 ora.SM1.asm application ONLINE ONLINE rac1 ora.C1.lsnr application ONLINE ONLINE rac1 ora.rac1.vip ora.t1.type ONLINE ONLINE rac1 ora.SM2.asm application ONLINE ONLINE rac2 ora.C2.lsnr application ONLINE ONLINE rac2 ora.rac2.vip ora.t1.type ONLINE ONLINE rac2 ora.scan1.vip ora.ip.type ONLINE ONLINE rac2 查看表空间使用大小及自动增长SelectFILE_NAME,TABLESPACE_NAME,BYTES/1024/1024,USER_BYTES/1024/1024,AUTOEXTENSIBLE as AUT from dba_data_files;查看数据库归档路径使用命令 archive log list;然后再根据归档路径查看归档空间大小。删除 5 天前的归档日志rman target/Delete noprompt archivelog all completed before sysdate-5;查看 DATAGuard 使用命令查看归档间隙名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 3 页 -Select*from v$archive_gap;使用命令查看归档日志应用恢复状态SELECT SEQUENCE#,APPLIED,FIRST_TIME,NEXT_TIME FROM V$ARCHIVED_LOG ORDER By SEQUENCE#;查看归档日志归档路径Archive log list;查看归档文件夹大小df h 删除已经应用恢复的归档日志Rman target/delete noprompt archivelog all completed before sysdate;或使用系统命令直接删除归档日志文件rm rf xxx.dbf 名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 3 页 -