链载Ai

标题: 类海马体的RAG检索策略 [打印本页]

作者: 链载Ai    时间: 前天 11:29
标题: 类海马体的RAG检索策略
今天分享的是来自俄亥俄州立大学的一篇文章 HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models,受神经生物学启发的大语言模型的长期记忆策略。
文章链接:https://arxiv.org/pdf/2405.14831
代码链接:https://github.com/OSU-NLP-Group/HippoRAG

摘要

这篇论文提出了一种名为 HippoRAG 的新型检索框架,灵感来源于人类长期记忆的海马体索引理论,旨在帮助大语言模型(LLMs)更高效地整合新的知识和经验。当前的 LLMs 即使结合检索增强生成(RAG)技术,仍然难以在预训练后高效地处理大量新信息。HippoRAG 将 LLMs、知识图谱以及 Personalized PageRank 算法结合起来,模仿新皮质和海马体在记忆中的不同角色,从而实现更深层次和高效的知识整合。

海马体索引理论

海马体索引理论可以用一个形象的比喻来解释:想象你有一个非常复杂的图书馆,里面有成千上万的书籍。这些书籍代表了你所有的记忆和知识。现在,图书馆有两个主要的区域:
  1. 书架区(新皮质):这是存放书籍的地方,你可以在这里找到每一本书。这些书籍代表了你处理和存储的各种信息和记忆。
  2. 索引卡区(海马体):这是一个存放索引卡的地方。每张索引卡上写着关于书籍的详细信息,比如书名、作者、主题等。索引卡帮助你快速找到你需要的书籍。
海马体索引理论认为,当你学习新东西时,信息首先进入“书架区”,即新皮质,然后通过“索引卡区”,即海马体,建立起索引卡。索引卡上的信息就是你记忆的关键信息和关联,用来帮助你在需要时找到具体的书籍或记忆。
当你想要回忆某件事时,你的脑海中会想起一些提示(就像查找索引卡),然后根据这些提示去“书架区”找到相关的书籍。这样,即使你只有一些部分信息(索引卡上的提示),也能帮助你完整地回忆起整个记忆(找到书籍)。
简单来说,海马体索引理论描述了大脑如何通过创建和利用记忆的“索引卡”来帮助我们更好地存储和检索信息。这使得大脑在面对新信息时,能够高效地更新记忆,同时保持过去的信息不丢失。

检索框架

我们结合框架图来理解这个框架是如何设计的以及如何模拟人类的记忆过程。
  1. 离线索引(Offline Indexing)






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5