美文网首页
全文检索-sphinx

全文检索-sphinx

作者: 表弟_212 | 来源:发表于2018-07-10 12:18 被阅读0次

为什么要用Sphinx
原因1:MySQL不支持中文全文检索、模糊查询(like)慢
原因2:sphinx支持中文全文检索、并且支持分词高亮
什么是Sphinx
就是一个软件,用来代替MySQL全文检索
Sphinx的特性
强、快
特性
高速的建立索引(峰值性能达10M/s)
高性能的搜索(在2-4G的文本数据上,平均每次检索时间小于0.1秒)
可处理海量数据

优势
Sphinx单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速
度为0.x秒(毫秒级)。
Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000
万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

Sphinx使用流程【★】
步骤1:通过sphinx去MySQL中获取并建立索引文件
步骤2:通过php去sphinx中查询数据并返回ID
步骤3:根据ID去MySQL中查询具体数据

安装Sphinx
1、概念
1)什么是Coreseek
Coreseek 是一款中文全文检索/搜索软件,基于Sphinx研发并独立发布,专攻中文搜
索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。
简单概括:就是中文版sphinx

2)Coreseek和sphinx的关系?
sphinx默认只支持英文和俄文,但是它提供了一种方式可以支持任意一种语言,但是需要自己写相关语言语言词库。
Coreseek是在sphinx的基本上添加了中文词库的二次开发。
简单概括:sphinx由俄国人开发,默认不支持中文,但是提供了接口,coreseek基于该接口开发。

3)下载地址

Sphinx官网:<u>http://www.sphinxsearch.com</u>

coreseek官网:<u>http://www.coreseek.com</u> (版本:Coreseek 3.2.14)

2、安装Coreseek

n 安装包(绿色版)目录文件介绍

coreseek-3.2.14-win32\bin\indexer.exe 创建索引

coreseek-3.2.14-win32\bin\searchd.exe 服务器端

coreseek-3.2.14-win32\etc\csft_mysql.conf 配置文件

相关文章

网友评论

      本文标题:全文检索-sphinx

      本文链接:https://www.haomeiwen.com/subject/xlyfpftx.html