Cog-RAG: Cognitive-Inspired Dual-Hypergraph with Theme Alignment Retrieval-Augmented Generation
西交、清华、西电联合团队
https://arxiv.org/pdf/2511.13201
Retrieval-Augmented Generation(RAG)已经成为大模型落地垂直领域的“标配外挂”——把私域文档切成 chunk,做向量索引,回答时召回最相似的片段喂给 LLM,简单粗暴却有效。
但扁平的向量相似度检索天生有两个缺陷:
近两年,GraphRAG、LightRAG 等工作把实体级知识图谱搬进 RAG,用“边”把实体串起来,一定程度上缓解了割裂问题。
然而,图谱仍然只关注“成对关系”,对于“多个实体共同构成一个事件/主题”的高阶依赖束手无策,如图 1(a)(b) 所示。
Cog-RAG 的核心思想一句话概括:先找主题,再找细节,像人一样先快速浏览目录把握主旨,再定位到关键段落精读。
为此,作者设计了两张互补的超图 + 两阶段检索,见图 2。
| Theme Hypergraph | |||
| Entity Hypergraph |
构建流程
存储
两类超图分别序列化到向量+结构混合数据库,支持超边/顶点双路检索。
| Stage-1 主题驱动 | |||
| Stage-2 细节回溯 |
评测指标
| Cog-RAG | 84.5 % |
❝表1 节选:Cog-RAG 在 Mix 数据集上总体胜率 84.5%,领先第二名 Hyper-RAG **37.7%**。
❝表2 Score-based 消融:实体超图在跨域稀疏场景最敏感;主题超图在域内稠密场景贡献更大。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |