首页 > 其他 > 详细

ES-索引规范

时间:2021-04-07 20:59:01      阅读:36      评论:0      收藏:0      [点我收藏+]
  1. 必须手动指定分片数。
    分片数会影响查询效率。
     
    分两种情况:
    数据量大而分片数较少。将影响单分片的查询效率。导致最终查询时间慢。
    数据量不大但分片数过多。分片数过多影响聚合效率,也会导致最终查询慢。
     
    不建议使用es的默认分片数(根据es版本的不同,默认分片数为5或者1),不适合实际使用情况。
    一般根据数据量或者数据存储大小来判断。大概5到10G,1000w到3000w条数据一个分片。
     
  2. 将无需分词查询的字段类型设为keyword。
     
    es中字符串有两种类型,text 和 keyword。如果该字段不需要分词查询(如feed_id),类型设为keyword即可。
    keyword类型的字段不会被分词,节约es内存空间。
     
  3. 需要中文分词的字段,必须指定分词器。一般为"ik_smart"。
     
    如果不指定分词器,es将会使用默认分词器。默认分词器不支持中文,会把中文分为一个个汉字的形式。浪费空间且不符合实际使用情况。

ES-索引规范

原文:https://www.cnblogs.com/mn-lily/p/14628157.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!