首页 > 其他 > 详细

9.正则和re模块

时间:2020-07-13 17:23:32      阅读:46      评论:0      收藏:0      [点我收藏+]

一、正则表达式

正则表达式:一套规则,匹配字符串的

用途:1、检测字符串是否合法2、从大文件中找到符合规则的内容

放到字符组和非字符组中表示所有

量词

{n} 表示匹配n次

{n,} 表示至少匹配n次

{n, m} 表示至少n次,至多m次

? 表示匹配0或1次 {0,1}

+ 表示一次或多次 {1,}

* 表示0次或多次 {0,}

# 字符组 []  
# [abc] 一个字符组只表示一个字符位置上
# [0-9] 根据ascll码
# [a-z]
# [A-Z]
# [a-zA-Z] 大小写   只有-前后才有大小比较

# [0-9]  -->\d   表示匹配一位任意数字  digit
# [0-9a-z_]  -->\w   表示数字字母下划线 word

# 空格\tab\enter --> |\t|\n  
# -->\s 表示所有空白,包括空格、tab、回车

# 正则表达式中表示匹配的内容的符号都是正则中的元字符


# \W   非数字字母下划线
# \D   非数字
# \S   非空白

# [\d]  \d  相同
# [\d\D][\w\W][\s\S]   匹配所有
# .     表示匹配除了换行符之外的任意一个字符
# [^1]   表示非字符组,除了1以外的
# [^\d]  表示匹配所有的非数字
# ^     表示匹配一个字符串的开始
# $     表示匹配一个字符串的结尾


#^a.$     在adacad这个字符串中什么也匹配不上
# ad|bc   匹配ad或bc,优先匹配左边的,不匹配右边,所以长字符在左

# 在www.中可以加\转义.
# www\.(oldboy|baidu|taobao)\.com   匹配该三个网址

#\b     匹配单词的边界


# 记忆元字符
# \d  \w  \s  \t \n 
# [] [^]        
# ^ $
# | ()

# 一个元字符只能匹配一位

二、re模块

待续

9.正则和re模块

原文:https://www.cnblogs.com/journeyer-xsh/p/13294285.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!