首页 > 其他 > 详细

re模块与正则

时间：2019-07-17 19:24:48 阅读：106 评论：0 收藏：0 [点我收藏+]

一.正则

正则就是用来筛选字符串中的特定的内容

正则表达式与re模块的关系:

　　1.正则表达式是一门独立的技术,任何语言都可以使用

　　2.python中药想使用正则表达式需要通过调用re模块

正则应用场景:

　　1.爬虫

　　2.数据分析

正则字符:

元字符	匹配内容
.	除换行符以外的任意字符
\n	换行符
\w	字母或数字或下划线
\s	任意的空白字符
\d	数字
\W	非字母或数字或下划线
\S	非空白字符
\D	非数字
\t	制表符
^	字符串的开始
$	字符串的结尾
\b	单词的结尾
a\|b	字符 a 或 b
()	匹配括号内的表达式,也表示一个组
[...]	匹配字符组中的字符
[^...]	匹配出了字符中的所有字符

量词	说明
*	重复零次或多次
+	重复一次或多次
?	重复零次或一次
{n}	重复 n 次
{n,}	重复 n 次或多次
{n,m}	重复 n 到 m 次

字符组概念

在同一位置可能出现各种字符 组成了一个字符组,在正则表达式中用[ ]表示,一个字符组内每次只能匹配一个字符,[ ]内的字符是或的关系

例:

匹配0-9数字 : [0123456789] 或 [1-9]
匹配A-Z字母 : 同上
匹配a-z字母 : 同上

　　ps: 字符组内范围必须从小到大必须按ASCII码表排序

^:以什么开头

　　^[1-9] : 匹配字符是否以1-9其中的数字为开头

$:以什么结尾

　　[a-z]$ : 匹配的字符是否以a-z其中的字母结尾

^...$:精准匹配固定长度的目标字符
- 　　^waller$ : 匹配waller
| :或
- 　　ab|abc 优先匹配 | 前面的内容,若前面内容匹配上 | 后面的内容不再匹配(在书写时把长的写在 | 前面)

　　　　　　

[^...] : 除括号内的内容其他都匹配

量词只能和元字符配合使用,并且是贪婪匹配

技术分享图片

+ : 匹配1次或多次
- 　　匹配 13555555555 ,用 \d 每次只能匹配单个数字,要想把数字一次都匹配上要用 \d+
- 匹配到 1 条结果
* : 匹配零次或多次
- 　　匹配到 2 条结果
{n} : 指明重复个数

题:

轨道通道地道魔道人道
逐个匹配出后面的道:
- 　
  
  　
取出词:
- [^\s]{2} : 去掉空格,每次取两个字符
- .道 : 取出 .和道组成的词
- [^\s]. : [^\s]本身占了一个位置加 . 共取两个位置
-

匹配人名: 海燕海娇海东

　　

海.	取海和.组成的词	海燕海娇海东	匹配所有"海."的字符
^海.	只取以海和.为开头	海燕	只从开头匹配"海."
海.$	只取以海和.为结尾	海东	只匹配结尾的"海.$"

正则	待匹配字符	匹配结果	说明
李.?	李杰和李莲英和李二棍子	李杰李莲李二	?表示重复零次或一次，即只匹配"李"后面一个任意字符
李.*	李杰和李莲英和李二棍子	李杰和李莲英和李二棍子	*表示重复零次或多次，即匹配"李"后面0或多个任意字符
李.+	李杰和李莲英和李二棍子	李杰和李莲英和李二棍子	+表示重复一次或多次，即只匹配"李"后面1个或多个任意字符
李.{1,2}	李杰和李莲英和李二棍子	李杰和李莲英李二棍	{1,2}匹配1到2次任意字符

re模块与正则

原文：https://www.cnblogs.com/waller/p/11203007.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！