sed工具


sed 工具

回到顶部

下面介绍非常重要的两个文本处理工具sed和awk! 这两个家伙可是相当的有用的啊! 举例来说, 分析登录文件的小程序logfile.sh绝大部分分析关键词的取用、统计等等就是用这两个工具来完成的!
sed本身也是一个管道命令,可以分析standard input! sed还可以进行数据的替换、删除、新增、抓取特定行等!

              [peter@study ~]$ sed [-nefr] [动作]
            
选项与参数: -n:使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到屏幕上。 但如果加上 -n 参数后,则只有经过 sed 特殊处理的那一行(或者动作)才会被列出来。
-e:直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以执行 filename 内的 sed 动作; -r :sed 的动作支持的是扩展正则表达式的语法(预设是基础正则表达式语法);
-i :直接修改读取的文件内容,而不是由屏幕输出。
动作说明:
[n1[,n2]]function
n1, n2 :不见得会存在,一般代表选择进行动作的行数,举例来说,如果我的动作是需要在 10 到 20 行之间进行的,则 10,20[动作行为]
function:
a :新增, a 的后面可以接字符串,而这些字符串会在新的一行出现(目前的下一行)~
c :取代, c 的后面可以接字符串,这些字符串可以取代 n1,n2 之间的行!
d :删除, 因为是删除啊,所以 d 后面通常不接任何参数;
i :插入, i 的后面可以接字符串,而这些字符串会在新的一行出现(目前的上一行);
p :打印, 亦即将某个选择的数据印出。通常p会与参数 sed -n一起运作~
s :取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正则表达式!
例如 1,20s/old/new/g 就是啦!

以行为单位的新增/删除功能
将/etc/passwd的内容列出并且打印行号,同时将第2~5行删除:

              [peter@study ~]$ nl /etc/passwd | sed '2,5d'
              1 root:x:0:0:root:/root:/bin/bash
              6 sync:x:5:0:sync:/sbin:/bin/sync
              7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
              .....(后面省略).....
            
sed的动作为'2,5d',d表示删除!原本应该是sed -e才对,没有-e也可以。需要注意的是sed后面接的动作,请务必以''两个单引号括住!
如果只要删除第2行,可以使用nl /etc/passwd | sed '2d';
若是要删除第3到最后一行,则是nl /etc/passwd | sed '3,$d',钱字号$代表最后一行!
在第二行后(即加在第三行)加上drink tea:
              [peter@study ~]$ nl /etc/passwd | sed '2a drink tea'
              1 root:x:0:0:root:/root:/bin/bash
              2 bin:x:1:1:bin:/bin:/sbin/nologin
              drink tea
              3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
              .....(后面省略).....
            
如果是要在第二行前呢?
nl /etc/passwd | sed '2i drink tea' 将a变成i即可。
如果是要增加两行以上呢? 在第二行后面加入两行字,例如Drink tea or .....与drink beer?
              [peter@study ~]$ nl /etc/passwd | sed '2a Drink tea or ......\
              > drink beer ?'
              1 root:x:0:0:root:/root:/bin/bash
              2 bin:x:1:1:bin:/bin:/sbin/nologin
              Drink tea or ......
              drink beer ?
              3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
              .....(后面省略).....
            
我们可以新增不只一行!可以新增好几行但是每一行之间都必须要以反斜杠\来进行新行的增加!在多行新增的情况下,\是一定要的!

以行为单位的取代与显示功能
将第2-5行的内容取代成为No 2-5 number:

              [peter@study ~]$ nl /etc/passwd | sed '2,5c No 2-5 number'
              1 root:x:0:0:root:/root:/bin/bash
              No 2-5 number
              6 sync:x:5:0:sync:/sbin:/bin/sync
              .....(后面省略).....
            
我们以前想要列出第11~20行, 得要通过head -n 20 | tail -n 10之类的方法来处理。 sed则可以简单的直接取出你想要的那几行!
仅列出/etc/passwd文件内的第5-7行:
              [peter@study ~]$ nl /etc/passwd | sed -n '5,7p'
              5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
              6 sync:x:5:0:sync:/sbin:/bin/sync
              7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
            
-n代表的是安静模式!为什么要使用安静模式呢?你可以自行下达 sed '5,7p' 就知道了 (5-7 行会重复输出)! 可以通过这个 sed 的以行为单位的显示功能, 就能够将某一个文件内的某些行号抓取出来查阅!

部分数据的搜索并取代的功能
除了整行的处理模式之外, sed还可以用行为单位进行部分数据的搜索并取代! 基本上sed 的搜索与取代的与 vi 相当的类似!他有点像这样:
sed 's/要被取代的字符串/新的字符串/g'
上表中特殊字体的部分为关键词,三个斜线分成两栏就是新旧字符串的替换啦!
先观察原始信息,利用/sbin/ifconfig查询IP信息:

              [peter@study ~]$ /sbin/ifconfig eth0
              eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
                inet 192.168.0.105 netmask 255.255.255.0 broadcast 192.168.0.255
                inet6 fe80::1db0:20ae:4993:2b5f prefixlen 64 scopeid 0x20
                
                ether 08:00:27:bd:23:a5 txqueuelen 1000 (Ethernet)
                RX packets 143081 bytes 87366924 (87.3 MB)
                RX errors 0 dropped 0 overruns 0 frame 0
                TX packets 133767 bytes 62279110 (62.2 MB)
                TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
              .....(以下省略).....
            
利用关键词配合grep抓取出第二行的IP数据:
              [peter@study ~]$ /sbin/ifconfig eth0 | grep 'inet '
              inet 192.168.0.105 netmask 255.255.255.0 broadcast 192.168.0.255   
            
删除IP前面的部分:
              [peter@study ~]$ /sbin/ifconfig eth0 | grep 'inet ' | sed 's/^.*inet //g'
              192.168.0.105 netmask 255.255.255.0 broadcast 192.168.0.255
            
# 上面的删除关键在于 ^.*inet broadcast 192.168.1.255啦!正则表达式出现! ^_^
删除IP后面的部分:
              [peter@study ~]$ /sbin/ifconfig eth0 | grep 'inet ' | sed 's/^.*inet //g' | sed 's/ *netmask.*$//g'
              192.168.0.105
            
# 此时所需的正则表达式为: ' *netmask.*$
假设我只要 MAN 存在的那几行数据, 但是含有 # 在内的注释我不想要,而且空白行我也不要!此时该如何处理呢?可以通过这几个步骤来实作看看:
先使用 grep 将关键词 MAN 所在行取出来
              [peter@study ~]$ cat /etc/man_db.conf | grep 'MAN'
              # MANDATORY_MANPATH
              manpath_element
              # MANPATH_MAP path_element manpath_element
              # MANDB_MAP global_manpath [relative_catpath]
              # every automatically generated MANPATH includes these fields
              ....(后面省略)....
            
删除掉注释之后的数据:
              [peter@study ~]$ cat /etc/man_db.conf | grep 'MAN'| sed 's/#.*$//g'
              MANDATORY_MANPATH
              /usr/man
              ....(后面省略)....
            
原本注释的数据都变成空白行啦!所以,接下来要删除掉空白行:
              [peter@study ~]$ cat /etc/man_db.conf | grep 'MAN'| sed 's/#.*$//g' | sed '/^$/d'
              MANDATORY_MANPATH /usr/man
              MANDATORY_MANPATH /usr/share/man
              MANDATORY_MANPATH /usr/local/share/man
              ....(后面省略)....
            

直接修改文件内容(危险动作)
sed甚至可以直接修改文件的内容!而不必使用管道命令或数据流重定向! 由于这个动作会直接修改到原始的文件,所以千万不要随便拿系统配置文件来测试!
我们使用regular_express.txt文件来测试!
将regular_express.txt内每一行结尾的.则换成!

              [peter@study ~]$ sed -i 's/\.$/\!/g' regular_express.txt
            
# 上头的 -i 选项可以让你的 sed 直接去修改后面接的文件内容而不是由屏幕输出喔!
直接在 regular_express.txt 最后一行加入# This is a test
              [peter@study ~]$ sed -i '$a # This is a test' regular_express.txt
            
# $代表的是最后一行,a的动作是新增!
sed 的 -i 选项可以直接修改文件内容,这功能非常有帮助!举例来说,如果你有一个100 万行的文件, 你要在第 100 行加某些文字,此时使用 vim 可能会疯掉!因为文件太大了!通过 sed 直接修改/取代的功能,你甚至不需要使用vim
很多的shell script都会使用到这个命令的功能~ sed 可以帮助系统管理员管理好日常的工作喔!要仔细的学习呢!

相关阅读:
本文由initroot编辑整理,转载请注明www.initroot.com

100次点赞 100次阅读