首页 > Web开发 > 详细

正则表达式,获取a href后面的数据

时间:2020-03-15 19:28:32      阅读:129      评论:0      收藏:0      [点我收藏+]
<div class="share-person-data-top">
  <a href="/share/home?uk=3924974212&suk=mOZidGjjyKS6Y6NecksgaQ" target="_blank" title="å»Taç
                                                                                           å享主页" class="share-
person-username global-ellipsis">ç¯å**å享</a>
  <a href="//yun.baidu.com/buy/center?tag=1&from=sicon" class="unvip-icon sicon">
  <em></em>
  </a>
</div>

如上:div下有<a href。我们需要获取href后的数据

 
首先正则获取div内的数据,response为返回内容,且以text输出,返回内容即上文html
 
tr_content = re.findall(<div class="share-person-data-top">(.*?)</div, response, re.S)[0]

 

打印tr_content

技术分享图片

 

 然后正则获取href数据

td_content = re.findall(<a.*?href="(.+)".*?>(.*?)</a>, tr_content, re.S)#正则获取href值

打印td_content

技术分享图片

 

 去掉最外面的"[]"

print(td_content[0])

技术分享图片

 

 取出”3924974212“并打印

td_content = re.findall("\d+", td_content, re.S)
print(td_content[0])

技术分享图片

 

正则表达式,获取a href后面的数据

原文:https://www.cnblogs.com/becks/p/12499345.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!