“向量数据库在召回效率与召回准确率之间,需要做一个业务平衡”
RAG的核心技术点就在于召回数据的准确性,而在相似度搜索过程中,技术载体主要是以向量数据库为主;因此,怎么提升向量数据库的召回准确率就成了一个亟待解决的问题。
在上一篇关于向量数据库的介绍中说,向量数据库不同于传统关系型数据的一点就是其使用的是向量度量的方式召回数据;而这一点就导致召回的数据在向量层面有关系,但在语义方面可能完全无关。就比如上篇文章中举的例子,在西游记的向量数据库中,搜索林黛玉竟然能搜索到结果。
因此,怎么优化向量数据库的召回准确率,这个问题应该怎么解决?