首页 > 其他 > 详细

《百年孤独》百度百科的爬取

时间:2020-05-03 19:26:01      阅读:55      评论:0      收藏:0      [点我收藏+]

一、参考网址:https://baike.baidu.com/item/%E7%99%BE%E5%B9%B4%E5%AD%A4%E7%8B%AC/688708?fr=aladdin

二、源代码:

import requests
def A():
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=‘utf-8‘
return r.text
except:
return ""
url=‘https://baike.baidu.com/item/%E7%99%BE%E5%B9%B4%E5%AD%A4%E7%8B%AC/688708?fr=aladdin‘
print(A())

三、成果:

技术分享图片

 

 

 

 

四、只爬取了文字没有爬取图片,可能我的成果难度系数比较低,望进一步学习爬虫熟练运用。

《百年孤独》百度百科的爬取

原文:https://www.cnblogs.com/cqyqqx98576/p/12822992.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!