链载Ai

标题: 动态构建Agent团队:平均准确性比现有方法提升了 21.94% [打印本页]

作者: 链载Ai    时间: 昨天 10:26
标题: 动态构建Agent团队:平均准确性比现有方法提升了 21.94%

动态构建Agent团队:平均准确性比现有方法提升了 21.94%

发布时间:2024 年 05 月 29 日

多Agent应用

Adaptive In-conversation Team Building for Language Model Agents

通过多个大型语言模型(LLM)智能体协同工作,已被证实是应对复杂任务的有效策略。然而,如何巧妙地为特定应用设计这些代理,仍是一门艺术。我们面临的核心挑战是:如何为特定任务组建一支高效的 LLM 智能体团队?我们的创新——自适应团队构建模式,提供了一种灵活的解决方案,其核心是“队长智能体”这一新颖设计。队长智能体能够根据任务解决的每一步动态组建和管理团队,通过嵌套对话和反思机制,确保团队拥有多元化的专业技能,避免单一化的输出。这种方法不仅灵活,而且结构化,有效减少了冗余,提升了输出的多样性。在六个真实场景的广泛测试中,队长代理的平均准确性比现有方法提升了 21.94%,展现出卓越性能,且无需针对特定任务进行提示工程的调整。

https://arxiv.org/abs/2405.19425

1. 现有多Agent团队构建方法的局限性

基于大语言模型的智能体应用凭借其卓越的上下文学习能力、规划能力、工具调用能力和多轮对话能力,使得其已经能够与人类团队的协作能力相提并论。

虽然现在智能体应用已经被大家广泛接受,但是如何构建一个有效的多智能体团队呢?这是大家面临的一个新问题。

上图展示了两种构建LLM智能体团队的方法。"静态构建"方法在任务执行之前预先组建一个固定团队。而"自适应构建"策略则是在任务解决过程中,通过一个自适应构建者代理来动态组建多样化的团队。

2. 什么是自适应构建智能体团队(daptive In-conversation Team Building)

如上图所示,队长智能体的工作流程简洁明了:接到用户指令,便着手规划任务,从检索与生成中精选智能体团队,并引导他们在群聊环境中协同完成分解后的任务。

对话结束后,反思智能体将对交流内容进行复盘,并向队长代理提交报告。根据反馈,队长智能体将决定是结束任务还是调整团队和指令,继续推进问题解决。

队长代智能体的核心魅力在于其两大关键组件:

队长代智能体启动智能体与工具的智能检索,通过详尽的角色描述,包括技能要求与潜在角色名称,巧妙地引导出所需“专家”。这一过程自然流畅,借助句子嵌入技术与余弦相似度量化,精准匹配角色与智能体或工具之间的最佳耦合。

在角色描述的指引下,系统首先检索出排名靠前的智能体与工具,确保每个角色都与最合适的智能体和工具相匹配。这一检索过程不仅高效,而且通过余弦相似度的科学衡量,实现了角色与资源的最优配置。

智能体的选择同样经过精心设计,基于LLM的代理选择器会根据角色描述和检索到的智能体资料,挑选出最佳人选。

为此,设计了一个JSON模板,确保选择过程的准确性。此外,引入了独特的弃权机制,允许在没有合适代理的情况下选择“None”,避免了不合适代理的强行加入,保证了任务团队的专业性和效率。

对于那些在上一步中未能匹配到代理的角色,设计了一个智能体生成流程。这一流程根据角色描述自动生成智能体名称和技能,并将这些信息与任务、编码及群聊指令融合,形成最终的系统消息。参考思维链和反思的理念设计了一般任务和编码指令,确保了指令的全面性和实用性。

最终的系统消息被凝练为一句简洁的描述,为接下来的嵌套群聊环节做好准备。同时,根据描述从工具库中检索出的工具,也被巧妙地融入到生成的系统消息之中。这样生成的智能体,最终将被纳入智能体库,为未来的任务提供更多选择。

2.3 嵌套群组对话与深度反思

在自适应构建的多智能体团队中,经选拔与生成的智能体将参与到一个嵌套式的群组聊天室。他们将根据用户任务的需要,通过层层深入的对话,从队长智能体那里领取并解决细分任务。接着,一个反思型LLM将被引导检索并审视整个对话历程,在预设模板中归纳结论、结论依据、潜在矛盾与问题点,并标识出是否需对结果进行复核。

我们的嵌套群组对话技术,借助AutoGen框架和创新的工具应用范式,让所有智能体置身于同一聊天室,由一个群聊管理器LLM根据对话进展和代理特性,挑选每一轮的发言者。智能体的身份资料将转化为简洁的描述,辅助管理器决策。智能体编写的代码和调用的工具将被即时执行并反馈至对话中。工具的详细描述、Python模块路径和响应格式将嵌入到相关智能体的系统消息里,使得智能体能够依据这些信息自由编写代码,将工具无缝融入到更广阔的编程任务中。所有智能体编写的程序将由一个共享代码执行环境的用户代理执行,并将执行结果实时反馈至对话。

在对话反思环节,智能体的发言可能包含不一致之处,如事实错误、臆想或成见。尽管其他智能体有机会在对话中进行调整和纠正,但有时也可能会陷入困境,导致问题解决失败。为此,设计了一个反思智能体,配合精心设计的对话总结提示模板,来发现并标记对话中的矛盾和问题。一旦发现问题,反思器将标记“需复核”,并给出详细的理由。这将触发队长智能体启动一个验证流程,通过构建一个新的嵌套对话来复核先前的结果。

2.4 相较于静态构建的优势

静态团队由于成员数量有限,可能无法全面覆盖所需能力。尽管构建大量具备全面人物设定或技能的代理可以扩展能力范围,但LLM智能体介绍所有参与者的长上下文存在难度,这会降低对话质量。同时,功能重叠的智能体也可能参与到问题解决中。与之相对,队长智能体能够根据当前任务的具体情况,自适应地选择和构建更加优化的智能体团队,既减轻了LLM的提示负担,也减少了不相关智能体的冗余输出,同时保证了团队的多样性。

3. 效果评估







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5