Apache Lucene 是一个基于Java的全文搜索引擎,利用它可以轻易的为Java软件加入全文搜索引擎的功能。
Lucene最重要的工作是替文件的每一个字索引,索引让搜索娥效率比传统的逐字搜索高出很多。
Lucene 提供一组解析、过滤、分析文件,已经编排和实用索引的API。它的强大之处除了高效和简单外,最重要的是使开发者可以随时根据自己的需要自定义其功能。
Nutch -全文搜索和网络爬虫
Solr -基于Lucene的全文搜索引擎框架
Compass -基于Lucene的搜索有引擎框架
LIUS-基于Lucene的多文件格式索引框架
WebLucene-基于Lucene和XML的网页索引引擎
原文:http://blog.csdn.net/caicongyang/article/details/36222357