正则表达式,应该都不陌生,但能真正用的熟的估计也没几个了,以下我的一些笔记
以python为主
#!/usr/bin/python # -*- coding:GBK -*- import re #1,获取字符串中的某一段,注意有些字符需要转义 s = ‘<title>测试标题</title>‘ print re.findall(r‘\<title>(.*?)\</title>‘,s)[0] #2,获取字符串中的数字,会将一行字符串中的分成数组 s=‘测试标题12,测试标题34测试标题7223‘ print re.findall(‘\d+‘,s) #3,获取字符串中匹配且包含自身的 s = ‘<title>测试标题</title>‘ print re.findall("<title.*?\/title>",s)[0];
原文:http://blog.csdn.net/wiker_yong/article/details/19164591