搜索|ES 近一年新版本，关于knn的新功能与优化

ES 近一年新版本，关于knn的新功能与优化

25-03-07 17:41

4119

12615

blog.csdn.net

id="article_content" class="article_content clearfix"> id="content_views" class="htmledit_views">

近一年，es发布了很多个版本。本文，主要整理了es关于knn搜索相关的优化项。

也放了官方文档的链接。

> >

8.8 版本

What’s new in 8.8 | Elasticsearch Guide [8.8] | Elastic

Reciprocal Rank Fusion (RRF)

改添加了倒数排名融合 (RRF)，它遵循将结果集合并在一起的基本公式，sum(1/(k+d))其中k 是排名常量，d是文档在查询结果集中的得分位置。以这种方式排名的主要优势是结果集的分数不必相对于彼此进行规范化，因为 RRF 仅依赖于每个结果集中的位置。

PRF是用来更好的融合KNN和BM25相关性分数的方法。有了这个以后，才是真正意义上的支持混合检索。将BM25的相关性和KNN的相关性结合。

遗憾的是，这是一个白金版本，也就是只有氪金才能使用。es的官方授权是非常贵的，它是按照节点来售卖的，大概每个节点每年10w。

 class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="1">

class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="1"> class="hljs-ln-code"> class="hljs-ln-line">PUT vectors class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="2"> class="hljs-ln-code"> class="hljs-ln-line">{ class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="3"> class="hljs-ln-code"> class="hljs-ln-line"> "mappings": { class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="4"> class="hljs-ln-code"> class="hljs-ln-line"> "properties": { class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="5"> class="hljs-ln-code"> class="hljs-ln-line"> "my_vector": { class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="6"> class="hljs-ln-code"> class="hljs-ln-line"> "type": "dense_vector", class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="7"> class="hljs-ln-code"> class="hljs-ln-line"> "index": true, class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="8"> class="hljs-ln-code"> class="hljs-ln-line"> "index_options": { class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="9"> class="hljs-ln-code"> class="hljs-ln-line"> "type": "int8_hnsw" class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="10"> class="hljs-ln-code"> class="hljs-ln-line"> } class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="11"> class="hljs-ln-code"> class="hljs-ln-line"> } class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="12"> class="hljs-ln-code"> class="hljs-ln-line"> } class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="13"> class="hljs-ln-code"> class="hljs-ln-line"> } class="hljs-ln-numbers"> class="hljs-ln-line hljs-ln-n" data-line-number="14"> class="hljs-ln-code"> class="hljs-ln-line">} class="hljs-button signin active" data-title="登录复制" data-report-click="{"spm":"1001.2101.3001.4334"}" onclick="hljs.signin(event)">

ES 近一年新版本，关于knn的新功能与优化

8.8 版本

Reciprocal Rank Fusion (RRF)

knn检索，支持相似度阈值参数similarity

官方发布(ELSER) 模型，并能够在es中天然使用

8.9 版本

KNN检索，支持embedding

8.10 版本

启用跨段并行 KNN 搜索

技术细节

8.12 版本

int8量化

查询阶段在单个分片内启用并行检索

8.14 版本

A SIMD (Neon) optimised vector distance function for merging int8 Scalar Quantized vectors has been added

8.15 版本

int4 量化

ZStandard 替换 LZ4压缩算法

评论记录：