首页 > 其他 > 详细

给LUKE增加word分词器

时间:2015-04-07 21:52:05      阅读:268      评论:0      收藏:0      [点我收藏+]

word分词是一个Java实现的分布式中文分词组件


1、下载http://luke.googlecode.com/files/lukeall-4.0.0-ALPHA.jar(国内不能访问)


2、下载并解压Java中文分词组件word-1.0-bin.zip


3、 将解压后的 Java中文分词组件word-1.0-bin/word-1.0 文件夹里面的4个jar包解压

到当前文件夹,用压缩解压工具如winrar打开lukeall-4.0.0-ALPHA.jar,将当前文件夹

里面除了.jar、.bat、.html文件外的其他所有文件拖到lukeall-4.0.0-ALPHA.jar里面


4、执行命令 java -jar lukeall-4.0.0-ALPHA.jar 启动luke,在Search选项卡的Analysis

里面就可以选择 org.apdplat.word.lucene.ChineseWordAnalyzer 分词器了

 

5、在Plugins选项卡的Available analyzers found on the current classpath里面也可以

选择 org.apdplat.word.lucene.ChineseWordAnalyzer 分词器


下载已经制作好的:lukeall-4.0.0-ALPHA-with-word-1.0.jar 


如下图所示:

技术分享


技术分享

给LUKE增加word分词器

原文:http://my.oschina.net/apdplat/blog/397069

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!