首页 > 其他 > 详细

在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解

时间:2015-02-10 11:15:48      阅读:355      评论:0      收藏:0      [点我收藏+]

在配置IKAnalyzer 同义词时,遇到一些麻烦,配置了半天终于成功,在此做个记录,方便以后参考

其实配置也简单,主要是jar包,IKAnalyzer貌似已经没人更新了……本人也是从别人那下载的才可用,我也将jar包上传至本人资源,

下载路径为:http://download.csdn.net/download/tjcyjd/8430613

在solr的配置文件schema.xml中添加:

<!--IKAnalyzer-->
   <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">  
     <analyzer type="index">  
       <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="false"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
     </analyzer>  
     <analyzer type="query">  
       <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="true"/>       
       <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
     </analyzer>  
   </fieldType>

其中的org.wltea.analyzer.lucene.IKAnalyzerSolrFactory类是自己扩展的,synonyms.txt在solr_home/core/conf文件下。


配置扩展词跟扩展停顿词配置入下:

技术分享


IKAnalyzer.cfg.xml内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
  
<comment>IK Analyzer 扩展配置</comment>
  
<!--用户可以在这里配置自己的扩展字典
  
<entry key="ext_dict">ext.dic;</entry>
-->
 
  
<entry key="ext_dict">mydict.dic;</entry>
 
<!--用户可以在这里配置自己的扩展停止词字典-->
  
<entry key="ext_stopwords">stopword.dic;</entry>  
</properties>

到此配置完成,如现在需要配置“beijing”和"北京"这两个同义词,只要在synonyms.txt文件中添加:  beijing,北京 重启solr服务即可,如果不生效,把文件保存为UTF-8+BOM。


jar包下载地址:http://download.csdn.net/download/tjcyjd/8430613

在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解

原文:http://blog.csdn.net/tjcyjd/article/details/43699525

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!