正則正則是在文件中匹配符合條件的正則的。下面通過本文給大家介紹正則下的正則與正則表達式,需要的的朋友參考下吧
通配符
? *? 任意字符,可重復多次
??? ? 任意字符,重復一次
??? [] 代表一個字符
舉例: [a,b,c] 表示abc中任意一個
通配符的作用是用來匹配文件名的
正則表達式
正則表達式是在文件中匹配符合條件的字符串的
ls find cp是不支持正則表達式的
但是grep awk sed支持正則表達式
[root@hadoop-bigdata01?test]#?touch?aa [root@hadoop-bigdata01?test]#?touch?aab?aabb [root@hadoop-bigdata01?test]#?ll total?0 -rw-r--r--?1?root?root?0?May?16?19:47?aa -rw-r--r--?1?root?root?0?May?16?19:47?aab -rw-r--r--?1?root?root?0?May?16?19:47?aabb [root@hadoop-bigdata01?test]#?ls?aa aa [root@hadoop-bigdata01?test]#?ls?aa? aab [root@hadoop-bigdata01?test]#?ls?aa* aa??aab??aabb
正則表達式正則
正則表達式匹配范圍
正則表達式標準字符
使用正則表達式
?grep?"1"?/etc/passwd
包含關鍵字1的行,grep只要包含就行,不想通配符,要完全一致
[root@hadoop-bigdata01?test]#?grep?"1"?/etc/passwd bin:x:1:1:bin:/bin:/sbin/nologin mail:x:8:12:mail:/var/spool/mail:/sbin/nologin uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin games:x:12:100:games:/usr/games:/sbin/nologin gopher:x:13:30:gopher:/var/gopher:/sbin/nologin ftp:x:14:50:FTP?User:/var/ftp:/sbin/nologin dbus:x:81:81:System?message?bus:/:/sbin/nologin usbmuxd:x:113:113:usbmuxd?user:/:/sbin/nologin avahi-autoipd:x:170:170:Avahi?IPv4LL?Stack:/var/lib/avahi-autoipd:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin wang:x:501:501::/home/wang:/bin/bash grep?'root'?/etc/passwd cat?/etc/passwd?|?grep?'root'
都是同樣的道理,但是管道符更吃資源
所以
1.匹配含有數字的行 ? ?
??grep?'[0-9]'?/etc/passwd
2.匹配連續含有三個數字的行
?grep?'[0-9][0-9][0-9]'?/etc/passwd??????或者??grep?':[0-9][0-9][0-9]:'?/etc/passwd
[root@hadoop-bigdata01?test]#?grep?'[0-9][0-9][0-9]'?/etc/passwd games:x:12:100:games:/usr/games:/sbin/nologin usbmuxd:x:113:113:usbmuxd?user:/:/sbin/nologin rtkit:x:499:497:RealtimeKit:/proc:/sbin/nologin avahi-autoipd:x:170:170:Avahi?IPv4LL?Stack:/var/lib/avahi-autoipd:/sbin/nologin abrt:x:173:173::/etc/abrt:/sbin/nologin nfsnobody:x:65534:65534:Anonymous?NFS?User:/var/lib/nfs:/sbin/nologin saslauth:x:498:76:"Saslauthd?user":/var/empty/saslauth:/sbin/nologin pulse:x:497:496:PulseAudio?System?Daemon:/var/run/pulse:/sbin/nologin liucheng:x:500:500::/home/liucheng:/bin/bash wang:x:501:501::/home/wang:/bin/bas
3.匹配以r開頭 n結尾的行
?grep?'^r.*n$'?/etc/passwd .*代表所有 [root@hadoop-bigdata01?test]#?grep?'^r.*n$'?/etc/passwd???????? rpc:x:32:32:Rpcbind?Daemon:/var/cache/rpcbind:/sbin/nologin rtkit:x:499:497:RealtimeKit:/proc:/sbin/nologin rpcuser:x:29:29:RPC?Service?User:/var/lib/nfs:/sbin/nologin
4.過濾正則config ,截取ip
grep -v 代表反向截取,意思就是去除帶有某關鍵字的行??? sed有替換的意思
[root@hadoop-bigdata01?test]#?ifconfig?|?grep?'inet?addr:' ?????inet?addr:192.168.126.191?Bcast:192.168.126.255?Mask:255.255.255.0 ?????inet?addr:127.0.0.1?Mask:255.0.0.0 [root@hadoop-bigdata01?test]#? [root@hadoop-bigdata01?test]#?ifconfig?|?grep?'inet?addr:'?|?grep?-v?'127.0.0.1' ?????inet?addr:192.168.126.191?Bcast:192.168.126.255?Mask:255.255.255.0 [root@hadoop-bigdata01?test]#?ifconfig?|?grep?'inet?addr:'?|?grep?-v?'127.0.0.1'?|?sed?'s/inet?addr://g' ?????192.168.126.191?Bcast:192.168.126.255?Mask:255.255.255.0 [root@hadoop-bigdata01?test]#?ifconfig?|?grep?'inet?addr:'?|?grep?-v?'127.0.0.1'?|?sed?'s/inet?addr://g'?|?sed?'s/Bcast.*//g' ?????192.168.126.191
誤區
這里有個誤區,想了好久,是正則表達式和通配符的區別
我們知道通配符的*指的是任意字符,可重復多次 正則表達式的*指的是匹配前一個字符>=0次
這兩個是完全不同的,那如何知道我用的*是通配符還是正則表達式
起初我陷入一個誤區,看下面這串命令
[root@hadoop-bigdata01?test]#?touch?ac?aac?abc?abbc [root@hadoop-bigdata01?test]#?ll total?0 -rw-r--r--?1?root?root?0?May?16?19:55?aac -rw-r--r--?1?root?root?0?May?16?19:55?abbc -rw-r--r--?1?root?root?0?May?16?19:55?abc -rw-r--r--?1?root?root?0?May?16?19:55?ac [root@hadoop-bigdata01?test]#?ls?|?grep?'a*c' aac abbc abc ac [root@hadoop-bigdata01?test]#?ls?|?grep?'a.*c' aac abbc abc ac [root@hadoop-bigdata01?test]#?ls?|?grep?'^a.*c' aac abbc abc ac [root@hadoop-bigdata01?test]#?ls?|?grep?'^a*c'? aac ac
為什么grep ‘a*c’? 和 grep ‘^a*c$’ 的結果會不一樣,我以為一個是通配符,一個是正則,因為a*c顯示的四個結果,正好
不就是匹配任意多個字符嗎?
其實不然
通配符的作用是用來匹配文件名的
正則表達式是在文件中匹配符合條件的字符串的
交給管道符之后使用grep已經不是匹配文件名了,這是對文件的操作,所以說,他完全就是正則表達式
grep ‘a*c’ 表示的是匹配a>=0個所以只要含有c就是可以的
而grep ‘^a*c$’也是正則,表示的是以a開頭,且第二個字符匹配a零次或者多次,接下來是c字母的
所以只有aac 和ac 符合條件
所以看這個例子
[root@hadoop-bigdata01?test]#?ls a?aac?abb?abbc?abc?ac?b?bb?c?cb [root@hadoop-bigdata01?test]#?ls?|?grep?'a*b' abb abbc abc b bb cb
這里grep ‘a*b’ 指的可不是含有a和b 而是a重復0次或者多次然后含有b