首页 > 编程语言 > 详细

[python]爬虫学习(三)糗事百科

时间:2017-01-03 22:08:33      阅读:210      评论:0      收藏:0      [点我收藏+]
import requests
import os
from bs4 import BeautifulSoup
import time


page=2
url=‘http://www.qiushibaike.com/hot/page/‘+str(page)
headers={‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0‘}
html=requests.get(url,headers=headers)
soup=BeautifulSoup(html.text,‘lxml‘)

names=soup.select(‘div.author h2‘)
years=soup.select(‘div.articleGender‘)
contents=soup.select(‘div.content span‘)
ups=soup.select(‘div.stats span.stats-vote i.number‘)
comments=soup.select(‘div.stats span.stats-comments a i.number‘)

for name,year,content,up,comment in zip(names,years,contents,ups,comments):
data={
‘name‘:name.get(‘title‘),
‘year‘:year.text,
‘content‘:content.text,
‘up‘:up.text,
‘comment‘:comment.text
}
print(data)




[python]爬虫学习(三)糗事百科

原文:http://www.cnblogs.com/lfqcode/p/6246554.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!