首页 > 其他 > 详细

xpath简单入门

时间:2018-01-04 10:43:58      阅读:378      评论:0      收藏:0      [点我收藏+]

技术分享图片

语法:

选取节点:

技术分享图片

实例:

技术分享图片

 

 技术分享图片

技术分享图片

技术分享图片(贴图转载自w3school)


 

补充:

/a/@href        #获取a标签的href属性

当<div class="demo"></div>种情况的时候我们可以写成/div[@class="demo"]

但如果是

<div class="demo1 demo2 demo3"></div>

这种情况我们如果匹配demo2就不能直接用等于的方法

可以用/div[contains(@class,‘demo2‘)]

如果选择demo2和demo3

可以用/div[contains(@class,‘demo2‘) and contains(@class,‘demo3‘)]

/*网上的一个相关解答还有一个*/

如果目标Class不一定是第一个,那么

//div[contains(concat(‘ ‘,@class,‘ ‘),‘demo‘)]

 没看明白,但是暂且保留


 

python下用lxml模块

导入的时候只需要一个etree来接收就可以

import ...

from lxml import etree

...

html = urllib.request.urlopen(url)

content = etree.HTML(html)

cont_list = content.xpath(‘/div[@class="test"]‘)

//cont_list接收的是一个匹配成功的列表

xpath简单入门

原文:https://www.cnblogs.com/lawliet-y/p/8191317.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!