Linux shell编程学习笔记3.doc
Linux shell编程学习笔记(三) -chinaitlab linux学习视频 第五章 文本过滤1.正则表达式一种用来描述文本模式的特殊语法,由普通字符以及特殊字符(元字符)组成 -只匹配行首$ -只匹配行尾* -匹配0个或多个此单字符 -只匹配内字符,可以使用-表示序列范围1-5 -屏蔽一个元字符的特殊含义. -匹配任意单字符patternn 只用来匹配前面pattern出现的次数,n为次数patternn,只用来匹配前面pattern出现的次数,至少为npatternn,m只用来匹配前面pattern出现的次数,次数在n-m之间eg:A3B AAABA3,B AAAB AAAAB .A3,5B AAAB AAAAB AAAAAB2.find命令 -查找文件和目录find pathname -options -print -exec -okpathname -查找的目录路径. .-表示当前目录,/表示根目录-print 输出-exec 对匹配的文件执行该参数所给出的shell命令,相应命令形式为'command' ;' 注意和;之间的空格-ok 与-exec相同,不过执行命令前会有提示options : -name -perm -user -group -mtime -n +n (atime,-ctime) 修改时间(访问时间,创建时间)-size nc-type 查找某一类型的文件eg.testszbirdora 1$ find ./ -mtime +5./helloworld.sh./nohup.out查看./目录(当前)下修改时间超过5天的文件3.grep介绍grep -c 输出匹配行计数grep -i 不区分大小写grep -h 查询多文件时不显示文件名grep -H 显示文件名grep -l 查询多文件时只输出包含匹配字符的文件名grep -n 显示匹配行及行号grep -s 不显示不存在或不匹配文本的错误信息grep -v 显示不包含匹配文本的所有行(过滤文本)eg.testszbirdora 1$ grep -n 's.a' myfile2:/dev/sda1 20G 3.3G 16G 18% /4:/dev/sda2 79G 18G 58G 23% /u015:/dev/sda4 28G 3.9G 22G 15% /u02testszbirdora 1$ grep -n '2$' myfile5:/dev/sda4 28G 3.9G 22G 15% /u02grep -options '正则表达式' filename4.sed介绍sed不与初始化文件打交道,它操作的只是一个拷贝,然后所有的改动如果没有重定向到一个文件将输出到屏幕sed是一种重要的文本过滤工具,使用一行命令或使用管道与grep与awk相结合。sed调用:1.命令 sed options '正则表达式sedcommand' input-files2.script :sed options -f sedscript input-filessed在文本中查询文本的方式 -行号,可以是简单数字,或一个行号范围 -使用正则表达式x -行号x,y -行号范围从x到yx,y! -不包含行号x到ysed命令选项:-n 不打印-c 下一个命令是编辑命令-f 如果正在调用sed脚本文件基本sed命令p 打印匹配行= 显示文本行号a 在定位行号后附加新文本信息i在定位行号前插入新文本信息d 删除定位行c用新文本替换定位文本s 使用替换模式替换相应模式r 从另一个文件中读文本w 写文本到一个文件q 第一个模式匹配完成后退去l 显示与八进制ascii代码等价的控制字符在定位行执行命令组n 从一个文件中读文本下一行,并附加在下一行g 将模式2粘贴到/pattern n/y 传送字符eg.testszbirdora 1$ sed -n '2p' myfilec打印myfile第2行testszbirdora 1$ sed -n '2,4p' myfilecfb打印第二行到第四行testszbirdora 1$ sed -n '/a/p' myfilea打印匹配a的行testszbirdora 1$ sed -n '2,/2/p' myfilecfb12打印第二行到匹配'2'的行s命令替换testszbirdora 1$ sed 's/b/a/p' myfileaaacde替换b为a多点编辑 -eeg. (myfile包含a-e)testszbirdora 1$ sed -e '2d' -e 's/c/d/' myfile 11addesed命令r -从文件中读取选定的行,读入输入文件中,显示在匹配的行后面eg.testszbirdora 1$ cat 11*Alaska*testszbirdora 1$ sed '/a/r 11' myfilea*Alaska*bcde写入命令:w 将输入文件中的匹配行写入到指定文件中eg.testszbirdora 1$ cat 11btestszbirdora 1$ sed -n '/a/w 11' myfiletestszbirdora 1$ cat 11a追加:a 将文本追加到匹配行的后面。sed要求在a后加,不止一行的以连接eg.testszbirdora 1$ sed '/b/a*hello*-china-' myfileab*hello*-china-cde插入命令:i 将文本插入到匹配行的前面。sed要求在a后加,不止一行的以连接eg.testszbirdora 1$ sed '/b/i> THE CHARACTER B IS BEST> *' myfileaTHE CHARACTER B IS BEST*bcde下一个:n 从一个文件中读文本下一行,并附加在下一行退出命令 q 打印多少行后退出eg.testszbirdora 1$ sed '3q' myfilea alertb bestc cooksed script:sed -f scriptfile myfile5.awk介绍awk可从文件或字符串值基于指定规则浏览和抽取信息awk三种调用方式:1.命令行方式awk -F field-sperator'patternactive' input-filesawk -F field-sperator'command' input-filesawk脚本所有awk命令插入一个文件,并使awk程序可执行,然后用awk命令解析器作为脚本的首行,以便通过键入脚本名称来调用。awk命令插入一个单独文件awk -f awk-script-file input-filesawk脚本由模式和动作组成分隔符、域、记录注意这里的$1,$2是域与位置变量$1,$2不一样。$0文件中的所有记录eg:awk 'print $0' myfileawk 'BEGIN print "IP DATE -"print $1"t"$4ENDprint "end-of -report"testszbirdora 1$ df |awk '$1!"dev"'|grep -v Filesystemnone 1992400 0 1992400 0% /dev/shmtestszbirdora 1$ df |awk 'if ($1="/dev/sda1") print $0'/dev/sda1 20641788 3367972 16225176 18% /testszbirdora shelltest$ cat employeeTom Jones 4424 5/12/66 543354Mary Adams 5346 11/4/63 28765Sally Chang 1654 7/22/54 650000Billy Black 1683 9/23/44 336500testszbirdora shelltest$ awk '/Aadams/' employee Mary Adams 5346 11/4/63 28765testszbirdora shelltest$ sed -n '/Aadams/p' employeeMary Adams 5346 11/4/63 28765testszbirdora shelltest$ grep 'Aadams' employeeMary Adams 5346 11/4/63 28765三种命令方式下,使用模式匹配查询testszbirdora shelltest$ awk 'print $1' employeeTomMarySallyBilly打印文件第一列testszbirdora shelltest$ awk '/Sally/print $1"t"$2' employeeSally Chang打印匹配Sally的行的第一列和第二列testszbirdora shelltest$ df |awk '$4>20884623'Filesystem 1K-blocks Used Available Use% Mounted on/dev/sda2 82567220 17488436 60884616 23% /u01/dev/sda4 28494620 4589172 22457992 17% /u02打印df输出第四列大于××的行格式输出:打印函数testszbirdora shelltest$ dateMon Mar 10 15:15:47 CST 2008testszbirdora shelltest$ date |awk 'print "Month:" $2"nYear:" $6'Month:MarYear:2008testszbirdora shelltest$ awk '/Sally/print "ttHave a nice day,"$1"t"$2' employee Have a nice day,Sally Changprintf函数testszbirdora shelltest$ echo "LINUX"|awk 'printf "|%-10s|n",$1'|LINUX |testszbirdora shelltest$ echo "LINUX"|awk 'printf "|%10s|n",$1'| LINUX|匹配符testszbirdora shelltest$ awk '$1/Tom/print $1,$2' employee Tom Jonesawk 给表达式赋值关系运算符:< 小于 > 大于= 等于!= 不等于>= 大于等于<= 小于等于 匹配! 不匹配eg.testszbirdora shelltest$ cat employee Tom Jones 4424 5/12/66 543354Mary Adams 5346 11/4/63 28765Sally Chang 1654 7/22/54 650000Billy Black 1683 9/23/44 336500testszbirdora shelltest$ awk '$2/Adams/' employee Mary Adams 5346 11/4/63 28765条件表达式:condition expression1?expression2:expression3eg.awk 'max=($1>$2) ? $1:$2;print max' filename运算符+,-,*,/,%,&&,|,!testszbirdora shelltest$ cat /etc/passwd |awk -F: 'NF!=7printf("line %d does not have 7 fields:%sn",NR,$0)$1!/A-Za-z0-9/printf("line %d,nonalphanumberic user id:%sn",NR,$0)$2="*"printf("line %d,no password:%sn",NR,$0)'awk编程递增操作符 x+,+x递减操作符 x-,-xBEGIN模块BEGIN模块后面紧跟着动作块,在读入文件前执行。通常被用来改变内建变量的值,如:FSRSOFS,初始化变量的值和打印输出标题。testszbirdora shelltest$ awk 'BEGINprint "HELLO WORLD"'HELLO WORLDtestszbirdora shelltest$ awk 'BEGINprint "-LIST-"printENDprint "-END-"' donors -LIST-Mike Harrington:(510) 548-1278:250:100:175Christian Dobbins:(408) 538-2358:155:90:201Susan Dalsass:(206) 654-6279:250:60:50 Archie McNichol:(206) 548-1348:250:100:175 Jody Savage:(206) 548-1278:15:188:150 Guy Quigley:(916) 343-6410:250:100:175 Dan Savage:(406) 298-7744:450:300:275 Nancy McNeil:(206) 548-1278:250:80:75 John Goldenrod:(916) 348-4278:250:100:175 Chet Main:(510) 548-5258:50:95:135 Tom Savage:(408) 926-3456:250:168:200 Elizabeth Stachelin:(916) 440-1763:175:75:300-END-重定向和管道输出重定向awk输出重定向到一个文件需要使用输出重定向符,输出文件名需要用双引号括起来。testszbirdora shelltest$ awk -F: 'print $1,$2>"note"' donors testszbirdora shelltest$ cat noteMike Harrington (510) 548-1278Christian Dobbins (408) 538-2358Susan Dalsass (206) 654-6279Archie McNichol (206) 548-1348Jody Savage (206) 548-1278Guy Quigley (916) 343-6410Dan Savage (406) 298-7744Nancy McNeil (206) 548-1278John Goldenrod (916) 348-4278Chet Main (510) 548-5258Tom Savage (408) 926-3456Elizabeth Stachelin (916) 440-1763输入重定向getline函数testszbirdora shelltest$ awk 'BEGIN"date +%Y"|getline d;print d'2008testszbirdora shelltest$ awk -F" :" 'BEGINprintf "What is your name?"getline name<"/dev/tty"$1 nameprint "Foundt" name "ton line",NR"."ENDprint "see ya," name "."' donorsWhat is your name?JodyFound Jody on line 5.see ya,Jody.testszbirdora shelltest$ awk 'BEGINwhile(getline<"/etc/passwd">0)lc+;print lc'36从文件中输入,如果得到一个记录,getline函数就返回1,如果文件已经到了末尾,则返回0,如果文件名错误则返回-1.管道:awk命令打开一个管道后要打开下一个管道需要关闭前一个管道,管道符右边可以使用“”关闭管道。在同一时间只有一个管道存在testszbirdora shelltest$ awk 'print $1,$2|"sort -r +1 -2 +0 -1"' namestony tramjohn smithdan savagejohn oldenrodbarbara nguyenelizabeth lonesusan goldberggeorge goldbergeliza goldbergalice cheba|后用""关闭管道system函数system("LINUX command")system("cat" $1)system("clear")条件语句1.if()2.if()else3.if()else if()else if()elsetestszbirdora shelltest$ awk -F: 'if ($3>250)printf "%-2s%13sn",$1,"-good partman"elseprint $1' donors循环语句testszbirdora shelltest$ awk -F: 'i=1;while(i<=NF)print NF,$i;i+' donors 循环控制语句break、continue程序控制语句next从输入文件中读取下一行,然后从头开始执行awk脚本if($1/Peter/)nextelseprintexit 结束awk语句,但不会结束END模块的处理。数组:awk 'namex+=$1;for(i=0;i<NR;i+)print i,namei' donors(P177)-2008.3.11awk内建函数sub(正则表达式,替换字符,$n) -域n匹配正则表达式的字符串将被替换。testszbirdora shelltest$ awk 'sub(/Tom/,"Jack",$1);print' employee Jack Jones 4424 5/12/66 543354Mary Adams 5346 11/4/63 28765Sally Chang 1654 7/22/54 650000Billy Black 1683 9/23/44 336500Jack He 3000 8/22/44 320000index函数 index(字符串,子字符串) 子字符串在字符串中的位置testszbirdora shelltest$ awk 'BEGINa=index("hello","llo");print a'3length函数 length(string) 字符串的长度testszbirdora shelltest$ awk 'BEGINa=length("hello world");print a'11substr函数 substr(字符串,开始位置,子字符串长度)testszbirdora shelltest$ awk 'BEGINa=substr("hello world",7);print a'worldtestszbirdora shelltest$ awk 'BEGINa=substr("hello world",7,3);print a'wormatch(string,正则表达式) 找出字符串中第一个匹配正则表达式的位置,其内建变量RSTART为匹配开始位置,RLENGTH为匹配开始后字符数testszbirdora shelltest$ awk 'a=match($0,/Jon/);if (a!=0)print NR,a' employee 1 5testszbirdora shelltest$ awk 'a=match($0,/Jon/);if (a!=0)print NR,a,RSTART,RLENGTH' employee 1 5 5 3toupper和tolower函数testszbirdora shelltest$ awk 'BEGINa=toupper("hello");print a'HELLOsplit函数 split(string,array,fieldseperator)testszbirdora shelltest$ awk 'BEGIN"date"|getline d;split(d,date);print date2'Mar时间函数systime() -1970年1月1日到当前忽略闰年得出的秒数。strftime(格式描述,时间戳)testszbirdora shelltest$ awk 'BEGINd=strftime("%T",systime();print d'13:08:09testszbirdora shelltest$ awk 'BEGINd=strftime("%D",systime();print d'03/12/08testszbirdora shelltest$ awk 'BEGINd=strftime("%Y",systime();print d'20086.sort介绍sort: -c 测试文件是否已经排序 -m 合并两个排序文件 -u 删除所有复制行 -o 存储sort结果的输出文件名 -t 域分隔符;用非空格或tab键分割域 +n n为域号,使用此域号开始排序 (注意0是第一列) -r 逆序排序 n 指定排序是域上的数字排序项testszbirdora 1$ df -lh|grep -v 'Filesystem'|sort +1none 2.0G 0 2.0G 0% /dev/shm/dev/sda1 20G 3.3G 16G 18% /dev/sda4 28G 3.9G 22G 15% /u02/dev/sda2 79G 17G 59G 23% /u01uniq optionfiles 从一个文本文件中去除或禁止重复行 -u 只显示不重复行 -d 只显示有重复数据行,每重复行只显示其中一行 -c 打印每一重复行出现次数 -f n为数字,前n个域被忽略注意要先排序7.split cut join 分割和合并文件命令testszbirdora 1$ split -l 2 myfile split (每两行分割为一个以split名称开头的文件)testszbirdora 1$ lscase.sh df.out helloworld.sh iftest.sh myfile nohup.out nullfile.txt parm.sh splitaa splitab splitac splitad splitaetestszbirdora 1$ cat splitaaFilesystem Size Used Avail Use% Mounted on/dev/sda1 20G 3.3G 16G 18% /