链载Ai

标题: XAgent:采用双循环运转机制,自主解决复杂任务的通用智能体 [打印本页]

作者: 链载Ai    时间: 昨天 11:01
标题: XAgent:采用双循环运转机制,自主解决复杂任务的通用智能体

1 XAgent简介

XAgent是一个开源、基于大型语言模型(LLM)的通用自主智能体,可以自动解决各种复杂任务。XAgent采用双环机制,外循环用于高层任务管理,起到规划(Planning)的作用,内循环用于底层任务执行,起到执行(Action)的作用。XAgent具有如下特点:


图1 XAgent的工作流程图

2 XAgent实现原理

2.1 规划(外循环)和执行(内循环)

CAMEL专注于以任务为导向的角色扮演,包含一个AI助理(AI Assistant)和一个AI用户(AI User)。在多智能体系统接收到人类用户的初步想法和角色分配后,任务指定智能体将提供详细的描述,使想法更加具体化。然后,AI助理和AI用户将通过多轮对话合作完成指定的任务,直到AI用户确定任务完成为止。一方面,AI用户负责向AI助理提供指令,并引导对话朝着任务完成的方向进行;另一方面,AI助理则需要遵循AI用户的指示,做出回答并提供具体的解决方案。完整的角色扮演框架如图2所示。

在XAgent中,规划和任务执行过程通过双循环机制(外循环和内循环)进行编排。其本质上,外循环处理高层次的任务管理和分配,内循环专注于每个子任务的低层次执行和优化。

图2 XAgent实现机制

外循环

外循环作为高层规划器和整个问题解决序列的主要协调者,充当整个问题解决序列的管理。它的职责可以分解如下:

内循环

内循环负责执行外循环分配的各个子任务。基于外循环给定的子任务,内循环会指定一个合适的ToolAgent,确保任务达到预期的结果。内循环的关键点包括:

2.2 PlanAgent:动态规划和迭代改进

PlanAgent赋予智能体不断制定和修订计划的能力,以适应多变的环境和突发需求。这些能力对于确保灵活性、弹性和效率以应对未预见的挑战至关重要。PlanAgent专用于外循环,其通过生成初始计划和不断修订计划来实现这一目标。PlanAgent包含四个函数来优化计划:

2.3 ToolAgent:在函数调用中协同推理和行动

如前所述,ToolAgent使用ReACT会寻找最佳的一系列动作(工具调用)来完成子任务。在每一轮中,智能体根据先前的交互生成一个动作,对于每个动作,在同一个函数调用中将智能体的推理和行动协同起来,即推理跟踪(“思考”)和将要执行的动作都被视为特定函数的参数。具体而言,每个(函数调用)具有以下组件:

2.4 ToolServer:多样化的支持工具

ToolServer包括三个关键组件:

3 XAgent总结

XAgent的实现逻辑更像是BabyAGI,依赖大模型做任务分解然后执行,这种实现的问题是任务分解的粒度:大模型往往会过度分解,简单的任务会无限复杂化,无法有效终止,从XAgent给出的实例来看,也无法避免。

XAgent的框架定义的不清晰:XAgent提供的不是一个SDK框架,是一个Web服务,这样开发者无法扩充修改;代码框架层面也不是很清晰,Agent没有抽象化,逻辑混乱,而且Memory目前还没有使用。

XAgent并缺乏多Agent的能力,例如多Agent的协作模式、通信模式和自定义等,其内部定了的多个Agent,但这些Agent更像是函数的封装。

XAgent定义给出的是通用智能体:从XAgent开发框架来看,本质是想通过Agent的任务分解能力加上集成更多的Tools的能力,将复杂任务有效的分解成细粒度的任务执行,但从当前的业界实现,BabyAGI,AutoGen都不是很理想,只能在有限的问题上可能效果可以,但还不是很稳定,完全依赖GPT4的能力,遇到专业性强的复杂问题,效果都不会很好,比如:狼人杀。

4课程推荐:从0带你实操15个AI Agent项目系列课程

0基础的你,想入门AI应用开发吗?你是否想过构建属于你自己的AI应用,却不知从何入手?

好消息来了,由多位资深AI应用开发专家共同打造的“AI入门实践”课程即将上线。该课程将会通过15个精心制作的项目和5场直播,从0教会大家如何去构建AI服务。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5