返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

基于KG生成语料增强解决RAG问答幻觉问题的简单框架-Walk

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 21:05 |阅读模式 打印 上一主题 下一主题

Walk&Retrieve基于知识图谱,利用基于图遍历和知识表述来进行零样本RAG的语料库生成。解决RAG系统的幻觉问题。该框架思路比较简单,核心点在于零样本RAG的语料库生成,下面来看看,供参考。

方法架构

语料生成

在框架中,语料生成该方法的核心步骤。该阶段从知识图谱中提取相关信息,并将其转化为适合LLM处理的文本格式。语料生成包括以下几个步骤:基于图的遍历、知识表示和索引。

1.基于图的遍历

  1. 随机游走:随机游走是一种随机过程,从一个节点开始,每次以均匀的概率选择当前节点的邻居节点进行移动。

    其中,表示节点的邻居数量。 对于每个节点,生成条长度为的随机游走路径。最终的语料库是所有节点的随机游走路径的集合。

  • 优点:简单易行,适用于大规模图谱。
  • 缺点:可能会产生重复路径和噪声。
  • 广度优先搜索-BFS游走:BFS是一种图遍历算法,从根节点开始,逐层访问其邻居节点。对于每个根节点,构建一个层次结构,每一层的节点表示与根节点的最短路径距离。然后,按照层次顺序进行遍历,确保每个节点只被访问一次。

    其中,,是最大深度。

    • 优点:避免了重复路径,生成的游走路径更加多样化。
    • 缺点:计算复杂度较高,尤其是在深层遍历时。

    2.知识表示

    LLM需要文本输入,需要将提取的图遍历路径转换为自然语言描述。使用预定义的提示模板,将每个节点的游走路径转化为自然语言句子。例如,对于一个随机游走的路径,可以生成类似“通过关系连接到,而通过关系连接到”的句子。

    预定义的提示模板

    3.索引

    将每个游走路径转换为向量表示,并计算每个节点的全局表示,作为其所有游走路径向量的拼接。将节点及其对应的游走路径向量存储起来,便于在推理阶段进行快速检索。

    检索问答

    该阶段不是重点,与传统的RAG相同,包括将query编码、相似性检索(k近邻搜索)、上下文整合、答案生成。

    答案生成prompt模板

    实验性能

    MetaQA上的性能:Walk&Retrieve-BFS在答案准确性和减少虚假答案方面表现最佳,相对提高了38.64%。其他基于KG的RAG系统虽然准确性高,但虚假答案更多。Walk&Retrieve-BFS在1跳、2跳和3跳问题上的真实性和减少无响应方面表现优异。

    CRAG上的性能:Walk&Retrieve变体在答案准确性上优于仅使用LLM和基于文本的RAG,同时在虚假答案和无响应率上与之相当。由于CRAG的复杂性较高,Walk&Retrieve的性能略有下降,但仍表现出良好的鲁棒性。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ