首页 > 其他 > 详细

信息采集入门系列目录(更新中...)

时间:2015-04-11 11:32:33      阅读:167      评论:0      收藏:0      [点我收藏+]

  已经做搜索一段时间了,觉得有必要记录下来,不然就没有沉淀了,这个系列准备一直延续下去,后面也会有越来越多高深点的东西等着去学习。目前准备有这些内容,后面会慢慢的添加

入门篇

1.C#获取网页信息核心方法(入门系列一)

2.页面解析和内容提取

3.SOLR的增删改查

4.Nutch爬虫的使用

5.自己开发的一个完整定制爬虫(C#)

杂记

1.Nutch抓取需要登录的页面

2.C#读取RSS源,并利用Solr索引



 

信息采集入门系列目录(更新中...)

原文:http://www.cnblogs.com/xiaoshuai1992/p/search.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!