首页 > 编程语言 > 详细

python scrapy ip代理的设置

时间:2017-06-10 18:54:16      阅读:528      评论:0      收藏:0      [点我收藏+]

在scrapy项目中建一个与spider同级的python目录并在下面添加一个py文件内容为

# encoding: utf-8
import base64
proxyServer = 代理服务器地址 ##我的是‘http://proxy.abuyun.com:9010’

# 代理隧道验证信息 这个是在那个网站上申请的
proxyUser = 用户名
proxyPass = 密码
proxyAuth = "Basic " + base64.b64encode(proxyUser + ":" + proxyPass)

class ProxyMiddleware(object):
def process_request(self, request, spider):
request.meta["proxy"] = proxyServer
request.headers["Proxy-Authorization"] = proxyAuth

在setting文件中添加
DOWNLOADER_MIDDLEWARES = {
‘项目名.spider同级文件名.文件名.ProxyMiddleware‘: 543,
}

代码地址


python scrapy ip代理的设置

原文:http://www.cnblogs.com/seablog/p/6979358.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!