首页 > 编程语言 > 详细

python爬虫项目-一见倾心壁纸

时间:2019-12-07 22:24:07      阅读:111      评论:0      收藏:0      [点我收藏+]
来自:https://www.cnblogs.com/xdd1997/p/11962969.html
import re import urllib import urllib.request def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html def getImage(html,x): #https://mmbiz.qpic.cn/mmbiz_jpg/ib55rg6wzUc3B16KIY3uU53nkcTTDic8uEA4WWBPaHJ8LpibvAnkpS2FZtyjrv7w7dbEeNrhfvPuuyReNAxsLdgJA/640?wx_fmt=jpeg #https://mmbiz.qpic.cn/mmbiz_jpg/ib55rg6wzUc3B16KIY3uU53nkcTTDic8uEHqocI7r86nehl2NeForAqvcTiaEAIuWjTWPKNXnnXIPuUuqnuJeFKYw/640?wx_fmt=jpeg #此处正则为重点 reg = ‘data-src="(.*?)"‘ image = re.compile(reg) imlist = re.findall(reg,html.decode(‘utf-8‘)) print(imlist) for i in imlist: print(i) print(x) urllib.request.urlretrieve(i,‘%s.jpg‘ % x) x +=1 return x x=1 url = ‘https://mp.weixin.qq.com/s/MVDcn0O3093OlIhMYkqBIA‘ html = getHtml(url) x = getImage(html,x) print(‘下载完成‘) #下载结果与此.py文件在同一目录

  

 

python爬虫项目-一见倾心壁纸

原文:https://www.cnblogs.com/gisoracle/p/12003609.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!