[首页]
[文章]
[教程]
首页
Web开发
Windows开发
编程语言
数据库技术
移动平台
系统服务
微信
设计
布布扣
其他
数据分析
首页
>
其他
> 详细
sphinx索引分析续
时间:
2017-01-05 09:53:48
阅读:
248
评论:
0
收藏:
0
[点我收藏+]
4.10 同义词文件/Synonym
同义词文件格式
from
=>
to
AT &T
=>
AT&T
AT & T
=>
AT & T
standarten fuehrer
=>
Standartenfuehrer
standarten fuhrer
=>
Standartenfuehrer
Ms-Dos
=>
MS-DOS
MS DOS
=>
MS-DOS
5 算法
5.1 字典
double array trie 检索树
5.2 分词算法
5.3 文档id压缩 – Variable Byte Coding
5.4 索引存储 – 多路归并排序
7 创建索引过程
扫描配置文件。
创建程序内部数据结构,schema, mva attr等。
第一次遍历文档记录,连接数据库读取创建索引的记录。
循环分词创建spa, spp文件(临时格式)(如果inline模式只创建spp文件), 如果非inplace模式,那么创建对应 tmp->spa, tmp->spp对应文件。
第二次遍历文档记录,创建mva属性(非field mva attributes)。
多路归并创建spm文件。
更新并创建最终的spa文件,更新mva的位置信息到spa文件。
读取临时格式的spp文件,多路归并创建spi,spd,spp文件。
创建索引头文件sph。
更新索引创建后的信息(例如存储当前已经简历索引的)释放资源
sphinx索引分析续
原文:http://www.cnblogs.com/bonelee/p/6251094.html
踩
(
0
)
赞
(
0
)
举报
评论
一句话评论(
0
)
登录后才能评论!
分享档案
更多>
2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)
最新文章
更多>
2021/09/28 scripts
2022-05-27
vue自定义全局指令v-emoji限制input输入表情和特殊字符
2022-05-27
9.26学习总结
2022-05-27
vim操作
2022-05-27
深入理解计算机基础 第三章
2022-05-27
C++ string 作为形参与引用传递(转)
2022-05-27
python 加解密
2022-05-27
JavaScript-对象数组里根据id获取name,对象可能有children属性
2022-05-27
SQL语句——保持现有内容在后面增加内容
2022-05-27
virsh命令文档
2022-05-27
教程昨日排行
更多>
1.
list.reverse()
2.
Django Admin 管理工具
3.
AppML 案例模型
4.
HTML 标签列表(功能排序)
5.
HTML 颜色名
6.
HTML 语言代码
7.
jQuery 事件
8.
jEasyUI 创建分割按钮
9.
jEasyUI 创建复杂布局
10.
jEasyUI 创建简单窗口
友情链接
汇智网
PHP教程
插件网
关于我们
-
联系我们
-
留言反馈
- 联系我们:wmxa8@hotmail.com
© 2014
bubuko.com
版权所有
打开技术之扣,分享程序人生!