爬虫:
客户端:
Web应用本质
APP
服务器:
URL -> API
自动程序(爬虫):
起始URL:
https://www.cnblogs.com/
下载源码:
<!DOCTYPE html>
<html lang="zh-cn">
<head>
<meta name="viewport" content="width=device-width, initial-scale=1"><meta charset="utf-8">
<title>博客园 - 开发者的网上家园</title>
<meta name="k
...
--- 获取关键字,收录到数据库 -
-- 再获取其他URL,href
再继续访问......
服务器提供API,URL有个专有名词叫API
requests.post(...)
原文:http://www.cnblogs.com/yard/p/6272289.html