首页 > 数据库技术 > 详细

scrapy 基于管道持久化操作,分别存在本地和数据库

时间:2020-07-27 17:32:10      阅读:90      评论:0      收藏:0      [点我收藏+]

定义两个管道类,每个管道类中重写process_item(self, item, spider)

pipelines.py

# 这个类把数据保存进数据库
class save_to_db:
    def process_item(self, item, spider):
        # 要返回item给下一个类调用
        return item

# 这个类把数据保存到本地text文件
class save_to_text:
    def process_item(self, item, spider):
        return item

在管道中开启

ITEM_PIPELINES = {
   ‘learn_scrapy.pipelines.LearnScrapyPipeline‘: 300,
   ‘learn_scrapy.pipelines.save_to_db‘: 200,
   ‘learn_scrapy.pipelines.save_to_text‘: 300,
}

scrapy 基于管道持久化操作,分别存在本地和数据库

原文:https://www.cnblogs.com/bibicode/p/13385147.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!