urllib发送请求

时间：2020-05-31 12:00:20 阅读：36 评论：0 收藏：0 [点我收藏+]

from urllib import request

url = "http://www.baidu.com"
res = request.urlopen(url) # 获取相应

print(res.info()) # 响应头
print(res.getcode()) # 状态码
print(res.geturl()) # 返回响应地址

输出结果为：

技术分享图片

from urllib import request

url = "http://www.baidu.com"
res = request.urlopen(url) # 获取相应

html = res.read()
html = html.decode("utf-8")
print(html)

技术分享图片

上面这种方式是最初级的，没有考虑任何反爬机制，换个网站就行不通了

from urllib import request

url = "http://www.dianping.com"
res = request.urlopen(url) # 获取相应

print(res.info()) # 响应头
print(res.getcode()) # 状态码
print(res.geturl()) # 返回响应地址

技术分享图片

最基础的措施为添加header，可以输入F12，在network选项中的Request Headers找到

技术分享图片

找到后，给User-Agent添加引号，对冒号后面的部分也添加引号，然后写入header变量中

再通过request.Request(url,headers=header)来发送请求

# 添加header信息，这是最基本的反爬措施
url = "http://www.dianping.com"
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3741.400 QQBrowser/10.5.3863.400"
}
req = request.Request(url,headers=header)
res = request.urlopen(req) # 获取响应

print(res.info()) # 响应头
print(res.getcode()) # 状态码
print(res.geturl()) # 返回响应地址

技术分享图片

urllib发送请求

原文：https://www.cnblogs.com/cyx-b/p/12996705.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)