首页 > 其他 > 详细

简易版爬虫(豆瓣)

时间:2017-07-04 16:31:51      阅读:249      评论:0      收藏:0      [点我收藏+]


import requests
import re
def get_douban():

    res_str = requests.get("https://movie.douban.com/top250?start=0&filter=")

    return res_str.text
def run():

    resong = get_douban()

    obj = re.compile(‘<span class="title">(?P<name>.*?)</span>.*?<span>(?P<evaluate>.*?)</span>.*?‘
                     ‘<p class="">\\n\s+(?P<director>.*?)&nbsp;&nbsp;&nbsp;?‘, re.S)

    ret = obj.finditer(resong)

    return ret
def zuz():

    for i in run():

        yield{"name":i.group(‘name‘),
            "evaluate":i.group(‘evaluate‘),
              "director":i.group(‘director‘)

           }
for i in zuz():

    print(i)

简易版爬虫(豆瓣)

原文:http://www.cnblogs.com/lizhaoyu/p/7117235.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!