Regex介绍

时间：2014-03-01 09:40:22 阅读：314 评论：0 收藏：0 [点我收藏+]

定义

在一个文件或字符里查找和替代文本的一种标准,就是用一个“字符串”来描述一个特征，然后去验证另一个“字符串”是否符合这个特征。

用途：

验证字符串是否符合指定特征，比如验证是否是合法的邮件地址。

用来查找字符串，从一个长的文本中查找符合指定特征的字符串，比查找固定字符串更加灵活方便。

用来替换，比普通的替换更强大。

bubuko.com,布布扣

PCRE（Perl Compatible Regular Expression）. PERL兼容正则可以使用任何不是字母、数字或反斜线（\）的字符作为定界符，如果作为定界符的字符必须被用在表达式本身中，则需要用反斜线转义。也可以使用()，{}，[] 和<> 作为定界符修正符： PERL兼容正则中可能使用的修正符（修正符中的空格和换行被忽略，其它字符会导致错误）

POSIX的全称是Portable Operating System Interface for uniX，它由一系列规范构成，定义了UNIX操作系统应当支持的功能。

PCRE与POSIX正则表达式的不同

1)POSIX 是 UNIX 遵循的标准, UNIX 的命令如 grep、sed能用的正则是 POSIX。 PERL 正则在POSIX上做了扩展，实现了很多方便的功能。

2)PCRE函数需要模式以分隔符闭合. POSIX兼容正则没有定界符，函数的相应参数会被认为是正则。 POSIX兼容正则没有修正符。

3)匹配数字的例子，Perl用 \d，POSIX 用 [0-9](POSIX 新版本已支持\d ）、\w、\s

4)不像POSIX,PCRE扩展没有专门用于大小写不敏感匹配的函数. 取而代之的是, 支持使用/i模式修饰符完成同样的工作. 其他模式修饰符同样可用于改变匹配策略.

5)POSIX函数从最左面开始寻找最长的匹配, 但是PCRE在第一个合法匹配后停止. 如果字符串不匹配这没有什么区别, 但是如果匹配, 两者在结果和速度上都会有差别.

BRE: 在Linux/Unix常用工具中，grep、vi、sed都属于BRE这一派，它的语法看起来比较奇怪，元字符『(』、『)』、『{』、『}』必须转义之后才具有特殊含义，所以正则表达式『(a)b』只能匹配字符串 (a)b而不是字符串ab；正则表达式『a{1,2}』只能匹配字符串a{1,2}，正则表达式『a\{1,2\}』才能匹配字符串a或者aa。BRE不支持『+』和『?』量词，也不支持多选结构『(…|…)』和反向引用『\1』、『\2』…。

GNUBRE：GNU对BRE做了扩展，支持『+』、『?』、『|』，只是使用时必须写成『\+』、『\?』、『\|』，而且也支持『\1』、『\2』之类反向引用

ERE：并不要求兼容BRE的语法，而是自成一体。因此其中的元字符不用转义（在元字符之前添加反斜线会取消其特殊含义），所以『(ab|cd)』就可以匹配字符串ab或者cd，量词『+』、『?』、『{n,m}』可以直接使用。ERE并没有明确规定支持反向引用，但是不少工具都支持『\1』、『\2』之类的反向引用。

bubuko.com,布布扣

Regex介绍,布布扣,bubuko.com

Regex介绍

原文：http://blog.csdn.net/quincyfang/article/details/20149113

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)