首页 > 编程语言 > 详细

Python_爬虫_数据解析回顾

时间:2019-09-11 09:31:11      阅读:101      评论:0      收藏:0      [点我收藏+]

--数据解析原理

  --定位标签

  --提取标签中存储的数据

--xpath解析原理

  --实例化一个etree的对象且将解析的页面源码数据加载到该对象中

  --通过xpath方法(返回值:列表)结合者xpath表达式进行数据解析

      -- //tagName

      -- //tagName[@attr = ‘value‘]

      -- //tagName[index]

      -- /text() //text()

      -- /@attrName

--bs4解析原理

  --实例化一个bs4的对象且将解析的页面源码数据加载到该对象中

  --通过相关的方法和属性进行数据解析

      -- soup.tagName

      -- soup.find(‘tagName‘, attrName = ‘value‘)  <==> find_all()

      -- select(‘css选择器‘) //标签, 类, id, 层级

      -- string,text,get_text()

      -- tag[‘attrName‘]

 

 

  

Python_爬虫_数据解析回顾

原文:https://www.cnblogs.com/helloboke/p/11504150.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!