美文网首页
Elasticsearch实战 使用相关性进行搜索

Elasticsearch实战 使用相关性进行搜索

作者: 二次元日系控铲屎官 | 来源:发表于2019-03-18 10:40 被阅读0次

一、Elasticsearch的打分机制

Elasticsearch使用了被搜索词条的频率以及他有多常见来影响得分。简单的解释是,一个词条出现在某个文档中的次数越多,它就越相关,但是如果该词条出现在不同文档的次数越多,它就越不想关。这一点被成为TF-IDF。TF=term frequency,IDF=iverse document frequency

Lucene评分公式

给定查询q和文档d,其得分是查询中每个词条t的得分总和,而每个词条的纷纷是该词在文档d中的词频的平方根,乘以该词逆文档频率的平方和,乘以该文档字段的归一化因子,乘以该词的提升权重

综上所属,词条的词频越高,得分越高;相似的,索引中词条越罕见,逆文档频率越高。

相关文章

网友评论

      本文标题:Elasticsearch实战 使用相关性进行搜索

      本文链接:https://www.haomeiwen.com/subject/ceplmqtx.html