当我们还在惊叹ChatGPT能写诗作文时,AI的进化已经悄然进入了下一个阶段——Agent时代。 什么是AI Agent?简单来说,它就是能像人一样进行推理、记忆、使用工具,甚至学习使用新工具的AI系统。虽然"学习使用新工具"这个能力目前还做不到,但AI Agent已经在推理、记忆和工具使用方面展现出了惊人的能力。 回想起来,针对AI操纵电脑这件事,其实是2023年Simular这家公司最先发布的,时隔整整一年,Claude才推出了同样的Computer Use功能。这个时间差本身就说明了AI Agent领域的快速演进和激烈竞争。 让我们来看看AI Agent是如何一步步进化到今天的。第一阶段:Single Agent(单个智能体成熟)
 - 2022年10月:ReAct推理技术的突破这是AI Agent历史上的里程碑时刻。ReAct让AI学会了思考和行动的循环——不再是简单的一问一答,而是能够制定计划、执行行动、观察结果,然后调整策略。这就像给AI装上了大脑和手脚。
- 2023年5-11月:记忆能力的飞跃Claude 100K、200K上下文长度的发布,给了AI更强的"记忆"能力。想象一下,原来AI只能记住几千字的对话,现在能记住几十万字的内容。这意味着AI可以处理更复杂、更长期的任务,而不会健忘。
- 2023年6月-2024年10月:动手能力的觉醒Function Calling和Computer Use功能的推出,让AI开始真正动手。它们不再只是聊天机器人,而是能够调用API、操作软件、甚至直接控制电脑界面的数字员工。
这个阶段解决的核心问题是:让AI从只会说话进化到既会思考又会行动。 第二阶段 单机上实现多智能体通信 单个Agent再强大,面对复杂任务时也会力不从心。就像一个人再聪明,也不如一个团队的集体智慧。 这个阶段的代表性框架包括LangGraph、AutoGen等。它们通过planner(规划器)实现multi-agent通信,让多个agent在一个系统库内协作。 工作原理: 1、任务分解:系统会写很多prompt,把复杂任务拆分成多个子任务 2、角色分配:不同的agent承担不同的专业角色 3、协作通信:各个agent之间通过预定义的协议进行信息交换 4、结果整合:最终将各个agent的输出整合成完整解决方案 虽然看起来是多智能体,但本质上还是单机系统,所有agent都运行在同一个环境中。这就像是一家公司内部不同部门的协作——虽然分工不同,但都在同一栋楼里办公。 这个阶段解决的问题是:如何让AI具备团队协作的能力,通过分工合作处理更复杂的任务。 第三阶段:不同设备机房之间联动 让agent在不同设备、不同机房去做计算,去联动,这个是未来支持亿级用户必须要有的架构。 目前我们仍处于第三阶段的竞争和尝试中,这个阶段尝试解决的问题是:很多网站或工具不支持ai agent调用,比如在mauns也能看到其在访问某些网站,由于有些网站有反机器人的设置,所以经常访问失败。那么这个阶段就需要打造一个通用协议来解决这个问题,才能支持agent与外界的联动。2024年11月,Claude推出了MCP协议,这是向统一Agent生态迈出的重要一步。 第四阶段:Agent-Agent协议通信 目前AI Agent应用大规模爆发的最大壁垒是缺乏真正统一的Agent-Agent协议通信标准与分布式计算能力。就像现在的安卓与iOS生态,我们也需要全球承认且通用的AI OS。 具体场景举例: 假设你有三个专业agent: - Agent C:需要整合前两者的能力,提供综合服务
AgentA是做采访摘要的,AgentB是关于AI行业的分析调研,能不能再写一个Agent把两个Agent的能力综合起来,这个第三个Agent需要负责与那两个Agent通信去获取信息。理想情况下,Agent C应该能够无缝调用Agent A和Agent B的能力。但现实是:这三个agent之间的交互没有统一标准,底层链路打不通,就像两个使用不同语言的人无法直接沟通。目前很多初创公司正在努力解决这个问题。比如2024年11月底,安卓系统前高管创业的公司DevAgents,他们想要打造一个通用操作系统,目标是为AI Agent提供统一平台。 我们正处在历史的转折点目前我们正处于第三阶段的尾声和第四阶段的开端。这意味着什么? 对开发者:现在是布局AI Agent生态的最佳时机,早期参与者将获得巨大优势。 对企业:需要开始思考如何将AI Agent整合到现有业务流程中,这不是可选项,而是必需品。 对用户:我们即将迎来一个真正的"AI助手"时代,不是简单的问答机器人,而是能够跨平台、跨应用为我们处理复杂任务的数字员工。 就像早期的互联网需要HTTP协议一样,AI Agent时代急需统一的通信标准。谁能制定这个标准,谁就能掌握未来AI生态的话语权。 AI Agent的进化才刚刚开始,但变化的速度可能比我们想象的更快。从单个智能体到万物互联的Agent生态,这不仅是技术的进步,更是我们与AI协作方式的根本变革。 在这个历史转折点上,我们每个人都是见证者,也是参与者。 |