Scrapy 教程(一)-安装与入门

时间：2019-05-17 10:18:48 阅读：117 评论：0 收藏：0 [点我收藏+]

安装

具体请自行百度

依赖库

技术分享图片

网上说pip安装会内分泌失调，我试了下还行吧，不过也遇到几个问题

技术分享图片

解决方法

pip install -I cryptography

技术分享图片

解决方法

pip install -U pyopenssl

安装成功

技术分享图片

实战入门

import scrapy

class MovieItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()

class MeijuSpider(scrapy.Spider):
    name = "meiju"
    allowed_domains = ["meijutt.com"]
    start_urls = [‘http://www.meijutt.com/new100.html‘]

    def parse(self, response):
        movies = response.xpath(‘//ul[@class="top-list  fn-clear"]/li‘)
        for each_movie in movies:
            item = MovieItem()
            item[‘name‘] = each_movie.xpath(‘./h5/a/@title‘).extract()[0]
            yield item

命令行运行

scrapy runspider test.py -o test1.json

自动生成 test.json 文件，并存入爬取内容。

这是最简单的代码和运行方式。

Scrapy 教程(一)-安装与入门

原文：https://www.cnblogs.com/yanshw/p/10842765.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)