正则表达式，获取a href后面的数据

时间：2020-03-15 19:28:32 阅读：131 评论：0 收藏：0 [点我收藏+]

<div class="share-person-data-top">
　　<a href="/share/home?uk=3924974212&suk=mOZidGjjyKS6Y6NecksgaQ" target="_blank" title="å»Taç
                                                                                           åäº«ä¸»é¡µ" class="share-
person-username global-ellipsis">ç¯å**åäº«</a>
　　<a href="//yun.baidu.com/buy/center?tag=1&from=sicon" class="unvip-icon sicon">
　　<em></em>
　　</a>
</div>

如上：div下有<a href。我们需要获取href后的数据

首先正则获取div内的数据，response为返回内容，且以text输出，返回内容即上文html

tr_content = re.findall(‘<div class="share-person-data-top">(.*?)</div‘, response, re.S)[0]

打印tr_content

技术分享图片

然后正则获取href数据

td_content = re.findall(‘<a.*?href="(.+)".*?>(.*?)</a>‘, tr_content, re.S)#正则获取href值

打印td_content

技术分享图片

去掉最外面的"[]"

print(td_content[0])

技术分享图片

取出”3924974212“并打印

td_content = re.findall("\d+", td_content, re.S)
print(td_content[0])

技术分享图片

正则表达式，获取a href后面的数据

原文：https://www.cnblogs.com/becks/p/12499345.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)