ImagesPipeline使用流程
管道类的编写:
from scrapy.pipelines.images importImagesPipeline import scrapy classImgproPipeline(object): item =None def process_item(self, item, spider): # print(item) return item #ImagesPipeline专门用于文件下载的管道类,下载过程支持异步和多线程 classImgPipeLine(ImagesPipeline): #对item中的图片进行请求操作 def get_media_requests(self, item, info): yield scrapy.Request(item[‘src‘]) #定制图片的名称 def file_path(self, request, response=None, info=None): url = request.url file_name = url.split(‘/‘)[-1] return file_name def item_completed(self, results, item, info): return item #该返回值会传递给下一个即将被执行的管道类
原文:https://www.cnblogs.com/cou1d/p/12626295.html