2022年IBM小型机及操作系统管理 .pdf
《2022年IBM小型机及操作系统管理 .pdf》由会员分享,可在线阅读,更多相关《2022年IBM小型机及操作系统管理 .pdf(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 1 of 25 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 25 页 - - - - - - - - - File
2、name: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 2 of 25 IBM 小型机及操作系统管理 .3 第一章系统登陆 .3 1.1 使用 netterm 登录 AIX 操作系统 .3 1.2 使用 Xmanager 登录系统 .4 1.3 登陆情况检查 .5 1.3.1 基本信息检查 .5 1.3.
3、2 查看系统登录情况 .5 第二章巡检计划 .5 2.1 巡检计划简介 .5 2.2 日巡检计划 .5 2.2.1 日巡检目的 .5 2.2.2 日巡检操作简述(及详细说明).6 2.2.3 日巡检检查单 .7 2.3 月巡检计划 .8 2.3.1 月巡检目的 .8 2.3.2 月巡检操作简述(及详细说明).8 2.3.3 月巡检检查单 .9 第三章故障处理 . 10 3.1 故障级别分类定义 . 10 3.2 故障现象列表和相应处理. 10 3.3 故障分级响应处理流程(包括管理、技术流程). 12 3.4 紧急重大故障处理流程(技术方面) . 12 第四章软硬件变更 . 13 升级与打补丁
4、注意事项. 13 数据与系统参数的修改注意事项. 13 第五章日常维护操作 (知识性、摘要性). 13 5.1 常用操作命令 . 13 5.2 常用操作步骤 . 17 启动. 17 系统关闭 . 17 查看系统的错误记录 . 17 系统与数据备份 . 18 第六章入侵检测方法与命令 . 21 6.1 检查/etc/passwd 文件中是否有可疑用户 . 21 6.2 检查/etc/inet.conf 和 crontab 文件是否被修改 . 21 6.3 检查.rhosts、 /etc/hosts.equiv、.forward 文件是否被修改 . 22 6.4 检查是否有危险的Root Suid
5、 程序 . 22 6.5 检查系统日志 . 23 6.6 检查是否有可疑进程 . 23 6.7 检查网络连接和开放端口 . 23 附录: . 24 通信录 . 24 相关文档 . 24 IBM 机房要求 . 24 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 25 页 - - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/1
6、3 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 3 of 25 IBM 小型机及操作系统管理第一章系统登陆1.1 使用 netterm登录 AIX 操作系统如上图所示,使用NetTerm 时,应对每次的操作都使用日志文件记录。登录时请注意检查上次不正确的登录及正确的登录时间、终端、IP 等信息:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3
7、 页,共 25 页 - - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 4 of 25 1.2 使用 Xmanager登录系统登录界面 : 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师
8、精心整理 - - - - - - - 第 4 页,共 25 页 - - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 5 of 25 建议使用NetTerm 登录系统进行维护,并将每次对系统作的操作都使用进行记录,以便日后错误检查。1.3 登陆情况检查1.3.
9、1 基本信息检查命令:,若有异常,请立即检查系统1.3.2 查看系统登录情况命令:,常用参数:who l who q who p who r who a /etc/utmp who /var/adm/wtmp /etc/utmp Contains user and accounting information. /etc/security/failedlogin Contains the history of all invalid logins. /var/adm/wtmp Contains the history of all logins since the file was last
10、created. /usr/include/sys/signal.h Contains a list of termination values. 第二章巡检计划2.1 巡检计划简介此巡检计划主要针对RS/6000 主机、存储产品、AIX 和 HACMP ,巡检操作由公司人员完成。发现问题由技术支持方提供及时的问题诊断和排错建议。2.2 日巡检计划2.2.1日巡检目的每日检查主机和存储阵列运行情况和业务运行情况是否正常,是否有硬/软件故障, AIX 系统参数,文件系名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 -
11、 - - - - - - 第 5 页,共 25 页 - - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 6 of 25 统参数配置情况是否正常。2.2.2日巡检操作简述(及详细说明)检查项目操作简述详细说明检查硬件外观情况观察服务器有无异常情况检查服务器风扇
12、, 响声 ,指示灯和平时运作情况是否一致,有无服务器线缆破损。观察服务器前方指示面板观察指示面板上的故障灯(橙色闪电标志)有无亮起, 指示面板上是否有代码出现(大多数情况下,服务器正常工作的时候,指示面板上没有代码出现)观察服务器前方内置磁带机故障灯当磁带机故障灯亮时(橙色闪电标志) ,表明内置磁带机需要清洗或有其它故障,需要作进一部分析处理。观察服务器后方电源上的指示灯电源正常工作时电源灯为长亮绿灯。电源有故障或服务器接上电源但未启时电源灯为闪烁绿灯观察外置磁带库指示面板观察硬件故障灯是否亮起(橙色闪电标志) ,观察有否出现与磁带库正常工作的时候不一样的代码观察磁盘阵列的指示灯观察磁盘阵列面
13、板上的硬件故障灯(橙色闪电标志) 有无亮, 磁盘阵列中的各个硬盘上的黄色故障灯有无亮起检查系统错误报告Errpt | pg ,如有可疑报告,可用 errpt a | pg 查看详细报告对类型为H (硬件) 和 PERM(永久性)错误的信息要密切留意,errpt 的信息分析详见本文档相关部分。检查发给 root 用户的邮件中是否含有错误报告Mail 命令Mail会将包括硬件错误在内的重要信息发给root 用户,用mail命令结合d,h,q,x 等子命令可以查阅发给root 的信件中的错误信息。检查文件系统使用率Df k 检查文件系统的使用率和I-node 节点的 使 用 率 , 尤 其 是 /
14、( 根 目 录 ) ,/tmp,/var,/usr,/home等系统基本目录的使用率。 当超过 85%的时候, 要特别注意。检查有无非同步的逻辑卷Lsvg o |lsvg il|grep stale 检查文件系统完整性,检查有无stale(非同步)的逻辑卷,如果有Stale 的逻辑卷需要用syncvg 同步,如果同步失败,需要根据具体情况采取相应措施检 查 磁 盘 阵 列RAID 盘的状态Smitty ssaraid 进入 smitty ssaraid 后选菜单第一项, 观察所有的RAID 的状态, 若 RAID 状态不是 good , 应马上通知IBM 工程师,采取相应措施。网卡的状态、 I
15、P 地址、路由表Ping Netstat -in 用 PING 命令可以检查服务器的网络状况,netstat 加上不同的参数可以检查网名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 25 页 - - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Docum
16、ent File Name: 26410417.doc Last changed by: wlg Page: 7 of 25 卡 IP, 子网掩码,路由信息等网络状况。系统性能综合动态观测(Topas) topas 命令可以动态观测最占用CPU,IO 资源的进程,综合观察系统的内存,换页空间等等状况。观察 CPU,内存( vmstat n)Vmstat n 为每 n 秒取样一次内存和CPU信息, 该命令主要用于观察内存,页交换空间使用情况,CPU 在系统,应用程序,等待IO,空闲这四方面的比例。观察 IO (iostat n) Iostat n 为每 n 秒取样一次IO 信息,该命令主要用于观
17、察服务器的各IO 设备的读写速度, 累计读写量, 带宽利用情况等等数据2.2.3 日巡检检查单IBM 小型机日巡检检查单检查时间:操作人:检查项目操作结果备注检查硬件外观情况检查服务器风扇,响声,指示灯和平时运作情况是否一致一致不一致有无服务器线缆破损。有无观察指示面板上的故障灯(橙色闪电标志)有无亮起,有无指示面板上是否有代码出现有无观察服务器前方内置磁带机故障灯有否亮起有无观察服务器后方电源上的指示灯长亮绿灯闪烁绿灯观察外置磁带库指示面板,硬件故障灯有否亮起有无观察有否出现与磁带库正常工作的时候不一样的代码有无观察磁盘阵列面板上的硬件故障灯(橙色闪电标志)有无亮有无磁盘阵列中的各个硬盘上的
18、黄色故障灯有无亮起有无检查系统错误报告Errpt | pg 有异常报告无异常报告检查发给 root 用户的邮件中是否含有错误报告Mail 命令有异常报告无异常报告名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 25 页 - - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release
19、: Master Document File Name: 26410417.doc Last changed by: wlg Page: 8 of 25 检查文件系统使用率Df k 查看文件使用率和I-NODE节点使用率有无大于85% 有无检查有无非同步的逻辑卷Lsvg o |lsvg il|grep stale 观察有无 stale 的 LV 有无检 查 磁 盘 阵 列RAID 盘的状态Smitty ssaraid,观察 RAID 的状况有无不是GOOD 的有无网卡的状态、 IP 地址、路由表Ping ,Netstat in 正常异常系统性能综合动态观测(Topas)正常异常观察 CPU,内
20、存( vmstat n)正常异常观察 IO (iostat n) 正常异常2.3 月巡检计划2.3.1 月巡检目的每月检查服务器部分变化比较少的参数,确定AIX 系统参数配置情况和硬件,机房环境是否正常。2.3.2 月巡检操作简述(及详细说明)基本操作与日巡检操作相同检查项目操作简述详细说明检查机房电源情况测量相电压, 零地电压, 以及各相的相序IBM 要求相电压为220V,零地电压少于1V,接头为左边零线,右边火线。进行系统硬件诊断Diag -a 系统正常时,运行diag 的结果应该是no trouble was found 。注意,diag 在应用繁忙阶段不建议使用检查服务器微码是否满足稳
21、定运行的要求Lscfg vp | grep alter Lscfg 显示微码的版本,由IBM 工程师判断微码版本是否满足要求,当不满足要求的时候由IBM 工程师进行微码升级。检查磁带机是否需要清洗观察磁带机上的闪电黄灯是否亮起/usr/lpp/diagnostics/bin/utape -cd rmt0 n 一般建议使用超过30 小时以上或超过3个月对磁带机做一次清洗,也可以用utape命令来查看磁带机使用小时数。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 25 页
22、- - - - - - - - - Filename: IBM小型机及操作系统管理Sub Area: 系统管理Functional Area: BASIS Last changed on: 04/20/13 8:43 AM Version: Release: Master Document File Name: 26410417.doc Last changed by: wlg Page: 9 of 25 检查用户数据是否已作保护Lsvg o | lsvg il 若一个 lp 对应多个 pp 则表明已镜象,当做了镜象之后,多个硬盘之中的一个损坏,数据不会丢失。进行系统备份Smitty mksy
23、sb Mksysb 命令对 rootvg里面 mount 起来的文件系统做全备份(建议加强对备份磁带的标签的管理)进行数据备份Smitty savevg Savevg 是对整个VG 做备份,数据备份还可以通过数据库的备份工具进行备份(建议加强对备份磁带的标签的管理)系统 DUMP 设置是否正确Sysdumpdev 利用 sysdumpdev 命令用 -l,-e,-L,-K等参数可以检查和修改dump device 设定是否正确, Always allow dump 是否设置为 True,device尺寸是否够大。检查内存交换区Lsps a 检查内存交换区使用是否超过70% ,有无多个内存交换区
24、放在同一硬盘上的现象,多个内存交换区的尺寸是否一致。检查补丁程序(PTF) 是 否 满足稳定运行的需要Instfix ik | grep ML Instfix ik | grep ML命令查看系统的补丁版本,发现异常情况之后应对相应的补丁做update 或 reject的操作进行 HACMP 切换测试Smitty clstop 测试在服务器发生异常情况的时候,HACMP 是否可正常运作接管系统。关于HACMP 的详细操作见本文档有关章节。保存系统状态存档Snap ac Snap ac 命令在 /tmp/ibmsupt/ 目录下生成 snap.tar.Z,该文件收集所有的系统信息,以作存档和参考
25、。2.3.3 月巡检检查单IBM 小型机月巡检检查单检查时间:操作人:检查项目操作结果备注检查机房电源情况相电压 V 零地电压 V 各相的相序正常异常进行系统硬件诊断Diag a 正常异常检 查 服务 器微 码是 否 满足稳定运行的要求Lscfg vp | grep alter 符合要求不符合要求检 查 磁带 机是 否需 要 清洗观察磁带机上的闪电黄灯是否亮起需要清洗不需要清洗检 查 用户 数据 是否 已 作保护Lsvg o | lsvg il 有保护无保护进行系统备份Smitty mksysb 备份成功备份不成功名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - -
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年IBM小型机及操作系统管理 2022 IBM 小型机 操作系统 管理
限制150内