目录
爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。
发送请求
模拟浏览器向web服务端
获取数据
如果服务器能正常响应,则会得到一个Response Response包含:html,json,图片,视频等
解析数据
解析得到有用的数据
保存数据
将数据存储到数据库或本地
略
爬虫基本原理
原文:https://www.cnblogs.com/zj420255586/p/12156661.html