链载Ai

标题: 图数据库 vs 向量数据库 [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 图数据库 vs 向量数据库

最近大模型出来之后,向量数据库重新翻红,业界和市场上有不少声音认为向量数据库会极大的影响图数据库,图数据库市场会萎缩甚至消失,今天就从技术原理角度来讨论下图数据库和向量数据库到底差别在哪里,适合什么场景,图数据库会不会消失。

人工智能思路之争

讨论图、向量,大模型之前先简单说下人工智能发展过程中出现的主义之争。人工智能在过去几十年的发展中,出现了好几种思路,也就分为几大学派,或者主义。分别是:

这三种主义是思路之争,其实也代表了对人工智能模拟的三个路径。未来可能会走向大一统和融合。

图数据库适合什么场景

图数据库比起传统的信息存储和组织模式,图数据库能够很清晰揭示复杂的模式,尤其在错综复杂的社交,物流,金融风控行业效果更为明显。典型场景有:

向量数据库适合什么场景

向量数据库最早解决非结构化数据相似度检索问题。通过把非结构化数据 embedding 成向量,通过向量的相似度检索来实现非结构化数据的相似度搜索。电销场景有:

用一张表格总结如下:

分类

说明

能做什么业务

典型场景和行业

相似度检索

向量传统应用场景,向量检索为主

  • 多模态检索(文本、图片、音频、视频)

  • 推荐系统

  • 分类系统

  • 互联网,电商的推荐

  • 政企,如公安的图片搜索

  • 网盘,自动驾驶里面的图片搜索

语义搜索

文本和向量混合索引

替代 ES 的一些搜索场景

  • 文档,向量混合搜索,多路召回

  • reranker 模型一般有Cohere Rerank(闭源)和BGE-Reranker(开源)

  • 企业搜索,行业不限

RAG

搭配大模型使用,检索结果给大模型总结

  • 知识库

  • 客服

  • 大模型记忆问答

  • 各种copilot,行业不限



两者对比

图数据库擅长推理能力,但是图实体模型建立本身门槛高,需要大量专业人员。向量数据库人工介入较少,但是结果准确度就差一些,各有各合适空间。下面是两者的对比:


向量数据库+大模型

图数据库+知识图谱

性能

数据量大,性能更好

数据量大,性能受挑战

复杂问题

复杂问题,查询结果不一定完整

复杂问题,可以取得更可靠的内容

建模难度

适合处理非结构化数据,文本转换成高维向量

实体关系建模,构建知识图谱

建模工作难度和工作量很大

适合场景

智能推荐系统:找出相似的,不需要精确

决策支持系统,需要梳理特定关系,保证逻辑关系正确性

因此我们可以看出,向量和知识图谱还是有各自适合的范围。

选型考虑条件

如果一个业务到底要选型向量还是知识图谱,就要从多个维度去考虑,下面是建议参考和选型的维度:


向量数据库

知识图谱

问题复杂度

非结构化,无复杂关系的选向量

大量相互关联知识实体

使用场景

简单相似度搜索,用向量数据库

基于实体关系的,复杂推理

数据量考量

扩展性高,数据量大

数据增长,关系复杂,维护难度会变高

团队能力

人力缺乏,选向量

事件建模,开发,算法技能

未来趋势

目前市面上看到各个厂家都在纷纷探索向量+图的融合演进,可见的未来,大概率两者会取各自长处,进行融合解决更复杂的问题






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5