首页 > 其他 > 详细

Scrapy 教程(一)-安装与入门

时间:2019-05-17 10:18:48      阅读:115      评论:0      收藏:0      [点我收藏+]

安装

具体请自行百度

依赖库

技术分享图片

 

网上说pip安装会内分泌失调,我试了下还行吧,不过也遇到几个问题

技术分享图片

解决方法

pip install -I cryptography

 

技术分享图片

解决方法

pip install -U pyopenssl

安装成功

技术分享图片

 

实战入门

import scrapy

class MovieItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()

class MeijuSpider(scrapy.Spider):
    name = "meiju"
    allowed_domains = ["meijutt.com"]
    start_urls = [http://www.meijutt.com/new100.html]

    def parse(self, response):
        movies = response.xpath(//ul[@class="top-list  fn-clear"]/li)
        for each_movie in movies:
            item = MovieItem()
            item[name] = each_movie.xpath(./h5/a/@title).extract()[0]
            yield item

命令行运行

scrapy runspider test.py -o test1.json

自动生成 test.json 文件,并存入爬取内容。

 

这是最简单的代码和运行方式。

 

Scrapy 教程(一)-安装与入门

原文:https://www.cnblogs.com/yanshw/p/10842765.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!