首页 > 其他 > 详细

关于正则表达式第三篇

时间:2014-11-15 02:24:50      阅读:296      评论:0      收藏:0      [点我收藏+]

在正则表达式中,还有很多的内容值得学习。
之前的两篇中列举了很少的一部分。没有做更多的分析。

-->字符组
下面的例子可以根据字符组来灵活匹配。比如输入了Good cat或者Good hat就可以通过字符组来进行匹配。[ch]
$ echo "Good cat"|sed -n ‘/[ch]at/p‘
Good cat
$ echo "Nice hat"|sed -n ‘/[ch]at/p‘
Nice hat
$echo "Yes" |sed -n ‘/[Yy][Ee][Ss]/p‘
Yes

当然了匹配尽管灵活也是有一定的约束的。
$ cat a.txt
101
1234
303
30
909
$ sed -n ‘/[0123][0123][0123]/p‘ a.txt   --可以看到,匹配的时候30,909都被过滤掉了。
101
1234
303
$ sed -n ‘/^[0123][0123][0123]$/p‘ a.txt --如果匹配的条件更加严格,把1234也给过滤掉了。
101
303

-->排除字符组
排除字符组的使用也比较广泛,把^放进[]就是取反了。像good cat通过[^ch]来排除的时候,因为有匹配的字符cat所以就把单词good cat全给过滤掉了。
想big boat通过[^ch]来匹配就没有找到匹配的值,没有排除掉,所以还是能够输出。
$ echo "good cat"|sed -n ‘/[^ch]at/p‘
$ echo "big boat"|sed -n ‘/[^ch]at/p‘
big boat

-->区间字符组
区间字符组就比较形象了,一看就是区间的表示。
比如输出b.txt的内容,根据匹配条件[a-ch-m]来筛选的时候,fat tiger就没有可匹配的情况,所以不会输出而cat is sleeping中的cat,that is a very nice hat中的hat都是区间匹配。
$ cat b.txt
 cat is sleeping
 fat tiger
 that is a very nice hat
sed -n ‘/[a-ch-m]at/p‘ b.txt
 cat is sleeping
 that is a very nice hat

-->特殊字符组
可以根据制定的字符组来更为方便的进行数据的筛选,过滤。
[[:alpha:]]  任意字母字符,大小写都包括
[[:alnum:]] 任意数字字符,0-9,a-z,A-Z
[[:blank:]]   空格或者制表符
[[:digit:]]     0-9之间的数字
[[:lower:]]   小写字母a-z
[[:upper:]]   大写字母A-Z
[[:print:]]      任意可打印字符
[[:punct:]]    标点符号
[[:space:]]    空白字符:空格,制表符,NL,FF,VT,CR
使用的例子简单总结如下:
$ echo "abc."|sed -n ‘/[[:alnum:]]/p‘     --筛选任意数字
abc.
$ echo "abc."|sed -n ‘/[[:alpha:]]/p‘      --筛选任意字母
abc.
$ echo "abc."|sed -n ‘/[[:digit:]]/p‘     --筛选0-9之间的数字
$ echo "abc."|sed -n ‘/[[:punct:]]/p‘   --筛选标点符号
abc.
$ echo "abc."|sed -n ‘/[[:print:]]/p‘   --筛选可以打印的字符
abc.
$ echo "abc."|sed -n ‘/[[:lower:]]/p‘  --筛选小写字母
abc.
$ echo "abc."|sed -n ‘/[[:upper:]]/p  --筛选大写字母

关于正则表达式第三篇

原文:http://blog.itpub.net/23718752/viewspace-1330493/

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!