首页 > 其他 > 详细

scrapy-redis

时间:2019-04-28 16:26:25      阅读:151      评论:0      收藏:0      [点我收藏+]

下载scrapy-redis

 git clone https://github.com/rmax/scrapy-redis.git

 

settings

PIDER_MODULES = [example.spiders]
NEWSPIDER_MODULE = example.spiders

USER_AGENT = scrapy-redis (+https://github.com/rolando/scrapy-redis)

# 指定RFPDupeFilter方法给request对象去重
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
# 指定Scheduler队列
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
# 队列中的内容是否持久化保存,False在redis关闭的时候清空redis
SCHEDULER_PERSIST = True


ITEM_PIPELINES = {
    example.pipelines.ExamplePipeline: 300,
    # scrapy_redis实现 items保存到redis的pipline
    scrapy_redis.pipelines.RedisPipeline: 400,
}

# 指定redis地址
# REDIS_URl = ‘redis://192.168.1.103:6379‘
# 另一种形式 指定redis地址
REDIS_HOST = localhost
REDIS_PORT = 6379

 

scrapy-redis

原文:https://www.cnblogs.com/tangpg/p/10784559.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!