链载Ai

标题: SentGraph:一句一句把多跳RAG“画”成图 [打印本页]

作者: 链载Ai    时间: 昨天 17:13
标题: SentGraph:一句一句把多跳RAG“画”成图


为什么传统 RAG 会“断链”

作者一句话总结:“不是检索不准,是检索单元太胖,逻辑关系太乱。”

传统 chunk 图     SentGraph 句图
[整段1]——相似——[整段2] [S1]—因果→[S2]—对比→[S3]
↓ 含 6 句废话 ↓ 句句相关
上下文爆炸 推理链清爽

SentGraph 的“瘦身”思路

把检索单元从“段”缩到“句”,再把这些句子按真正的逻辑关系画成一张三层图,线下建好,线上直接按图索骥。

图长啥样?

Topic 层——跨文档“桥梁”

Core 句层——核心事实

Sup 句层——背景、因果、举例

线下建图三步曲

步骤
做什么
关键技术
解决痛点
① 拆句
把文档切成单句
常规 NLI 模型
避免 chunk 冗余
② 找关系
识别句间 12 种修辞关系
精简版 RST(修辞结构理论)
把“因为、但是、例如”显式化
③ 架桥梁
跨文档实体对齐
LLM 生成“实体-关系-实体”三元组
让多文档证据连成一条线

例:
文档 A「克罗地亚官方语言为克罗地亚语。」
文档 B「电影《围城》使用克罗地亚语拍摄。」
系统线下就在 Topic 层建一条边:(克罗地亚语, 被用于, 电影《围城》)


线上推理三步曲

  1. Anchor 初选
    用 dense retriever 把“问题向量”和所有句子向量比对,先取 Top-K 候选句。

  2. Anchor 精炼
    让 LLM 当“裁判”:






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5