爬虫学习一些有用的函数吧

时间：2015-05-14 20:17:55 阅读：132 评论：0 收藏：0 [点我收藏+]

1.geturl---- 获取真实的url

from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError

old_url = ‘http://rrurl.cn/b1UZuP‘
req = Request(old_url)
response = urlopen(req)
print (‘Old url :‘ + old_url)
print (‘Real url :‘ + response.geturl())

2.info()----这个返回对象的字典对象，该字典描述了获取的页面情况。通常是服务器发送的特定头headers。目前是httplib.HTTPMessage 实例。

经典的headers包含"Content-length"，"Content-type"，和其他内容。

from urllib.request import Request, urlopen
from urllib.error import URLError, HTTPError

old_url = ‘http://www.sina.com‘
req = Request(old_url)
response = urlopen(req)
print (‘Info():‘)
print (response.info())

爬虫学习一些有用的函数吧

原文：http://www.cnblogs.com/my-time/p/4504109.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

爬虫学习 一些有用的函数吧

爬虫学习一些有用的函数吧