《ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator》

ATM Attacker Agent - Generator Agent 架构
论文链接:https://arxiv.org/abs/2405.18111
解决问题:RAG 利用语义相关文档作为生成器的输入上下文,并重新注入外部知识,但是当今互联网充斥着大量错误、无关、无用内容,甚至是 LLM 捏造的虚假知识,会给 RAG 生成器带来额外噪音,团队设计多 Agent 对抗防御系统(ATM),通过对抗引导生成器更好地了解特定文档是否有助于回答问题,增强生成器鲁棒性,最终能在 LLM 捏造文档中分辨出有用的文档
模型框架:ATM 包括生成器 Agent 和攻击者 Agent,攻击者竭力编造虚假知识并增加文件列表中的噪音,生成者抵御噪音并保持稳健,团队进行多 Agent 迭代优化,使攻击者 Agent展现出更强大的攻击模式,生成器 Agent 迭代增强
使用效果:ATM 在自然问题上的分数提高 31%。在 ATM 架构下,Generator 生成器逐步超越了以前最先进的 RALM、RetRobust 和 Self-RAG,在各数据集上的性能领先 5%
应用空间:各个领域的 RAG 系统,另外还可以加强模型安全性、准确率等指标

ATM 测试性能