首页 > 其他 > 详细

scrapy爬虫框架

时间:2017-05-17 16:37:49      阅读:271      评论:0      收藏:0      [点我收藏+]

技术分享

downloader:负责下载html页面

spider:负责爬取页面内容,我们需要自己写爬取规则  srapy提供了selector,获取的方式有xpath,css,正则,extract 

item容器:spider获取到的内容放到item中

schedul:负责调度    

scrapy爬虫框架

原文:http://www.cnblogs.com/caojunjie/p/6868195.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!