结论:外部 corpus 与模型内部知识高度重叠,继续"全量检索"≈ 白花钱、拖延迟、降效果。
复旦大学邱锡鹏提出Zero-RAG。首先提出了"掌握度评分"这一指标,用以精准识别RAG知识库中的冗余知识并进行剪除。经过剪枝后,对于模型已"掌握"的问题,其回答将主要依赖模型自身的内部知识。
一句话:"零冗余"不是口号,是真能剪、真加速、真不掉点。
结果:138M 句维基 → prune 30% 后索引体积同比例缩小。
消融显示:拿掉 Router 后 EM 显著下降,证明多检索一次反而添乱。
训练数据三种配方:
统一损失让模型学会忽略无用片段,靠内部知识作答。
经此微调,即使在 prune 后 corpus 里偶尔捞出无关句,模型也能"视而不见"。
❝句子:"Queen Victoria became Empress of India in 1876."
生成的 4 个 QA 全被 Llama3-70B 裸机答对 ⇒ Mastery-Score=1 ⇒直接剪除。
这些"教科书级别"的常识,就是 Zero-RAG 眼中该被"零冗余"的靶子。
Zero-RAG: Towards Retrieval-Augmented Generation with Zero
Redundant Knowledge
https://arxiv.org/pdf/2511.00505
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |