《2022年AIX日常 .pdf》由会员分享,可在线阅读,更多相关《2022年AIX日常 .pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、AIX日常维护1 文件系统是否满方法:df k 可以以 K 为单位检查文件系统的使用率。(90% 以上,需要调整)2 检查系统出错日志使用 errpt |more来检查清除现有的log: Errclear 0 3 检查系统合法/ 非法登陆情况使用 Last 命令来检查来自登陆的地方。4 检查系统是否有巨大的Core文件生成使用find / -name core print来检查。对Core 文件,一般直接删除就可以了。5 系统性能检查:a) CPU性能:使用vmstat, topas来检查b) 内存使用情况:也是使用topas, vmstat来检查c) 检查 IO 平衡使用情况:使用iosta
2、t来检查d) 交换空间使用情况:使用lsps a 来检查6 Mail 检查7 Diag 一个月一次补充两点:1。硬件检查,检查各指示灯状态和各物理设备的可用情况。2。进程检查,检查是或有死进程。用 who -d 查出一些死进程!AIX 日常指令和常用操作一:开机登录在开机之前,先检查电源是否插好;然后,按下前面板上白色电源开关后,主机会进入硬件自检和引导阶段;此时,前面板上的液晶会有代码跳动,每一个代码表示自检或引导的不同阶段,最后在引导结束时,前面板液晶上的代码消失,彩显或终端上有显示,进入系统初始化和登录提示。如果主机停在某一代码上,引导不下去( 大于半小时 ) ,说明系统可能有故障,请与
3、IPACS 联系,并把代码一起报给我们。二:关机1) 关闭应用程序2)HACMP软件,先用smit clstop关闭 HACMP 。3) 命令行打 “ shutdown - F” 进关机,显示器上出现“ Halt Completed”可按下前面板上白色电源开关,关电源。如果需要关机后重新引导,打“shutdown -Fr” 命令。三:基本定义1) Physical Volume(PV) Physical Volume就是指硬盘,在AIX中用 hdiskx表示。7133磁盘阵列中的某个硬盘用pdiskx表示,pdiskx对应的 AIX 操作系统中Physical Volume用 hdiskx表示
4、。用 lspv 命令来看一下PV 与 VG 对应关系用 lsdev -Cc disk命令看一下硬盘状态,Available 表示硬盘可用,Defined 表示物理硬盘找不到,只有逻辑定义。2)Volume Group(VG) Volume Group 是由多个Physical Volume组成的集合。Physical Partition是 VG 分配空间的最小单位。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 6 页 - - - - - - - - - AIX 操作系统
5、所在的卷组就是rootvg 可用 lsvg 查看 VG 信息,用 lsvg -o 查看打开的卷组。3)Logical Volume(LV)和 FileSystem(FS) Logical Volume和 Filesystem是在卷组上划分的空间,不能跨多个卷组而且只能扩大不能缩小。Filesystem是在 LV 上建的,使用时,需mount在 AIX 某一目录上。可用 lsvg -l VG_Name来看 VG 上所有的LV 和 FS 用 df 命令来看Filesystem 使用情况用 mount命令来看已mount的 Filesystem 四:日常系统管理AIX 通过 smit 工具(smit
6、ty是字符界面 ) 来进行系统管理。1) 增加修改删除用户smit user 2) 增加修改删除卷组smit vg 3) 增加修改删除逻辑卷smit lv 4) 增加修改删除文件系统smit fs 5) 网络设置和查询smit tcpip Minimal Configuration填入 IP 地址,子网掩码,网关等参数;Start Now改为 Yes netstat -i / netstat -in 查看网卡interface状态和参数6) 日常维护平时需用df 和 errpt 检查一下文件系统使用率和有无新的错误日志。如果文件系统使用率大于90% ,需扩大该文件系统。命令行打errpt后,可
7、以显示类似下列错误日志;ERROR_IDENTIFIER TIMESTAMP T CL RESOURCE_NAME ERROR_DESCRIPTION 192AC071 0101000070 I 0 errdemon Error logging turned off 0E017ED1 0405131090 P H mem2 Memory failure 9DBCFDEE 0101000070 I 0 errdemon Error logging turned on 038F2580 0405131090 U H scdisk0 UNDETERMINED ERROR AA8AB241 04051
8、30990 I O OPERATOR OPERATOR NOTIFICATION 其中, TIMESTAMP代表日期,以MMDDhhmmYY格式;如0405131090表示 1990年4 月 5 日 13 时 10 分T(Type)一栏中, P 表示永久性错误,T 表示零时性错误,U 表示不能决定是什么错误,I 表示信息而非错误。CL(CLass)一栏中, H 表示硬件错误,S 表示硬件错误,O 表示通知操作员。如果T(Type)一栏中是P 且 CL(CLass)一栏中是H,表示较严重错误,需跟IBM 联系。五:系统备份(仅 rootvg备份 ) 备份是用户的责任,可用下列步骤备份rootvg
9、,其它数据需另外备份。系统备份要定名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 6 页 - - - - - - - - - 时做,一般1-2月做一次,凡rootvg数据有变化 ( 如系统参数修改) 要马上备份。最好用几合带子轮流备份。备份带上要标明备份时间和内容。1) 用 root用户登录2)mount rootvg下需备份的文件系统3)smit mksysb 选择备份介质Expand /tmp filesystem if needed 改为Yes 六:诊断diag -
10、System Verification 选择需诊断的硬件设备七:常用命令set -o vi 类似 PC DOS 中 doskey命令,先按ESC 键再按几下k 键,可重现以前打过的命令。export TERM=vt100/ibm3153/lft 设置终端类型lsdev -C和 lscfg -v 显示硬件配置1、df -k文件系统空间使用情况2、lsvg 列出系统中所有vg 的名字lsvg -o 列出激活vg 名字lsvg vgname列出指定vg 的详细信息lsvg -l vgname列出指定vg 上的 lv 情况3、lsdev -P -H列出 AIX 支持的设备(即预定义odm数据库中的设备
11、对象)lsdev -C 列出 AIX 支持的设备已定义的odm数据库中的设备对象lsdev -Cc xxx列出定制odm数据库中某个设备对象的信息例如:lsdev -Cc disk lsdev -Cc tape lscfg列出系统上已安装的资源的配置信息lscfg -vl列出某个设备的VPD 信息例如:lscfg -vl ent1 lscfg -vl hdisk1 lscfg -l xxx*列出设备的不带VPD 的相关信息lscfg -l proc* lscfg -l hdisk* 4、修改文件及目录的属性4.1 chmod 例如:chmod 765 xxx 修改文件xxx 属性为 765 c
12、hmod -R 765 XXX 修改目录xxx 及其下子目录及文件属性为765 4.2 chown 例如: chown user:usergroup xxx修改文件xxx的属主为user:usergroup chmod -R user:usergroup xxx 修改目录xxx 及其下子目录及文件属主为user:usergroup 5、系统性能检测工具名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 6 页 - - - - - - - - - vmstat内存、 pages
13、pace、CPU 等监测( vmstat 2 10每隔 2 秒钟执行一次,共执行10 次)iostat 硬盘 I/O监测netstat网卡监测topas综合检测工具6、ps 进程察看ps -ef|grep 进程名例如:ps -ef|grep sap ps -ef|grep oracle ps -ef|grep tsm ps -ef|grep cluster 其他的指令可参照smitty工具来操作Basis 学习showmount -e ip lsdev -Cc adapter|grep ent 查看网卡lsdv -Cc if 查看网卡接口ifconfig -a netstat -in 看网卡
14、IP 信息netstat -rn 路由lssrc -t telnet lssrc -t ftp vi /etc/inetd.conf 禁止远程通过root 登陆 , 修改 /etc/security/user 文件 , 在 root选项将false 作为rlogin 的值进行 AIX 的日常维护,需要关注哪些日志文件?文件描述建议core 和 snapcore 由应用产生的dump 文件,可用于诊断错误可删除nohup.out nohup 命令的输出结果可删除.xerrors X11的输出结果可截短mbox 用户邮箱中的邮件可截短smit.log 和 smit.script 用户使用smit
15、命令后的日志可适当保留最后1000行,或删除/var/adm/wtmp 记录用户的登录信息,是二进制文件,用 who 命令来阅读其内容根据需要保留 60 天中有用的内容,其余删除/etc/security/failedlogin 记录用户失败的登录信息,是二进制文件,用who 命令来阅读其内容可根据需要保留60 天中有用的内容,其余删除/var/adm/sulog 用户使用su 命令的日志可根据需要保留60 天中有用的内容,其余删除/var/adm/cron/log cron的日志可截短/var/tmp/snmpd.log snmp 监控进程日志可截短/var/tmp/dpid.log /va
16、r/tmp/dpid2.log /var/tmp/hostmidb.log /var/tmp/muxatmd snmp 子系统日志可截短dead.letter 未成功的邮件可删除trcfile trace 实用程序的输出可删除名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 6 页 - - - - - - - - - /var/adm/messages 用于记录 syslog进程的日志可适当保留最后1000行,或删除/etc/shutdown.log 系统关机过程日志, 用
17、 shutdown -l 命令产生可适当保留最后1000行,或删除如何自动杀死UNIX僵死的进程作者:曹苏华人保系统的计算机应用,已从单机运行方式过渡到以公司为中心的集中处理方式,各县级支公司通过广域网、远程telnet登录到市公司主机。由于网络的原因,有些进程会突然僵死。这些僵死的进程,会消耗系统大量的资源,直接影响机器的正常运行。为了实时地、 自动地杀死这些僵死的进程,本人编写了Shell程序 Autokill。Autokill程序脚本# # autokill # ps - ef | awk , print $1,$2,$7,$8 , |awk ,/0-90-9:0-90-9:1-90-9
18、/ print $1,$2,$3,$4 , |awk ,!/root/ print kill - 9 $2, /tmp/k_kill chmod 777 /tmp/k_kill /tmp/k_kill Autokill程序解释首先,用UNIX 命令ps -ef 查看进程状态,通过管道传送给awk 进行处理。在第一个awk 中, 获取进程的用户标识 (UID ) 、 进程号(PID ) 、 进程占用 CPU 时间 ( Time ) 、进程执行命令(CMD )四个字段的值。在第二个awk 中,通过模式匹配,选取所有匹配模式的行。在awk 中, 0-9匹配 0 9中任一个数字, 1-9匹配 1 9
19、中任何一个数字, 连用两个 0-90-9则匹配一个任意两位数,因此 0-90- 9 :0-90-9:1-90-9则匹配Time时间字段值,查找占用CPU 时间超 过10 秒 的 进 程 ; 如 果 要 查 找 占 用CPU 时 间 超 过 半 小 时 的 进 程 , 则 把 模 式 改 成0-90-9:3-90-9:0-90-9。在第三个awk 中,用“!/root/ ” 过滤掉由Root用户生成的进程,并进行Shell语言拼装,并将最终结果定向到文件/tmp/k_kill。 在 /tmp/k_kill 文件中, 都是形如kill -9 123 的Shell命令。在 Autokill程序的最后
20、,执行/tmp/k_kill 杀死进程。查看中间结果Autokill程序采用了管道处理方式,如要查看中间结果,则可以依次断开管道。第一步执行:ps -ef 第二步执行:ps - ef | awk , print $1,$2,$7,$8 ,第三步执行:ps - ef | awk , print $1,$2,$7,$8 , |awk ,/0-90-9:0-90-9:1-90-9/ print $1,$2,$3,$4 ,第四步执行:ps - ef | awk , print$1,$2,$7,$8 , |awk ,/0-90-9:0-90-9:1-90-9/ print $1,$2,$3,$4 , |
21、awk ,!/root/ print kill - 9 $2, /tmp/k_kill 最终查看/tmp/k_kill 文件。再有,如只想自动杀死由某一用户执行的进程(如jdc3206) ,只要将模式“!/root/”改成“ /jdc3206/”即可 ; 如只想杀死执行某一命令的进程(如xinmu ),只要将模式 “ !/root/” 改成“ /xinmu/”即可。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 6 页 - - - - - - - - - 最后用cront
22、ab -e 增加一个cron 作业。0,30 * * * * /tmp/autokill Kill 命令失灵怎么办经过以上步骤,系统每隔半小时执行一次/tmp/autokill。但在 UNIX系统中,有些僵死的进程会莫名其妙地不能用Kill 命令杀死,这就需要重新引导机器,一方面清除系统垃圾,另一方面需要对资源重新分配。采用中心运行模式,机器不能随意开关机,总要等到夜晚没有用户使用机器时, 才能重新开关机。为此编写一个Shell程序,让机器自动开关机。以下是 Autoreboot 程序脚本。# # autoreboot # PATH=/bin:/etc:/usr/bin:/tcb/bin:/u
23、sr/informix/bin INFORMIXDIR=/usr/informix INFORMIXSERVER=da3206a ONCONFIG=onconfig.yca export PATH INFORMIXDIR INFORMIXSERVER ONCONFIG onmode -ky sync sync reboot Autoreboot程序前5 行,是设置Informix系统环境, 命令onmode -ky 是关闭Informix Online数据库 , 命令 sync 是 UNIX 文件系统超级块回写,命令reboot 是 UNIX 系统中的系统重新启动命令。用 crontab -e 命令,增加一行cron 作业 30 6 * * * /tmp/auto_boot。该命令使系统每天6 :30 重新开关机。如果使用的是双机系统,则要在两台机器上,都要进行重新开关机,时间定成一致。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 6 页 - - - - - - - - -
限制150内