首页 > Web开发 > 详细

lucene合并测试的总结

时间:2014-10-19 14:16:08      阅读:360      评论:0      收藏:0      [点我收藏+]
1 查询的总时间等于每个segment查询时间的总和
2 合并的步骤
    (1)做flush操作的先生成一个新的segment
    (2)检查在新segment之前已经存在的segment的数量是否大于maxmerge(默认是10个),大于了进行合并
    (3)合并完成又会生成一个新的segment,然后把前面10个segment删除。
 
每次追加46W条数据(46W一次提交) kfc数据,单field,单字分词,保存termvector,position,offset和payload信息,每次追加以后进行一次查询测试。
 
每次提交46W数据花费42-43S左右的时间,磁盘空间稳定上升36M,查询时间提高0.05秒,加入第12个segment的时候触发合并,合并前690MB,合并后425MB,12segment查询一次0.5S,查到3293508数据,12个segment生成到合并花费560S
总时间 42*11+560
 
egg同类测试(去事务,单字分词,压缩方式)
每批数据在22S左右,12次提交以后文件总大小1.3G,花费时间为244S,查询到 3293508花费 1.335018s
总时间 22*12

lucene合并测试的总结

原文:http://www.cnblogs.com/hdflzh/p/4034825.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!