链载Ai

标题: AI Agent进化史:从单兵作战到万物互联的四个关键阶段 [打印本页]

作者: 链载Ai    时间: 昨天 21:54
标题: AI Agent进化史:从单兵作战到万物互联的四个关键阶段

当我们还在惊叹ChatGPT能写诗作文时,AI的进化已经悄然进入了下一个阶段——Agent时代。 什么是AI Agent?简单来说,它就是能像人一样进行推理、记忆、使用工具,甚至学习使用新工具的AI系统。虽然"学习使用新工具"这个能力目前还做不到,但AI Agent已经在推理、记忆和工具使用方面展现出了惊人的能力。 回想起来,针对AI操纵电脑这件事,其实是2023年Simular这家公司最先发布的,时隔整整一年,Claude才推出了同样的Computer Use功能。这个时间差本身就说明了AI Agent领域的快速演进和激烈竞争。 让我们来看看AI Agent是如何一步步进化到今天的。

第一阶段:Single Agent(单个智能体成熟)


image

这个阶段解决的核心问题是:让AI从只会说话进化到既会思考又会行动。

第二阶段 单机上实现多智能体通信

image

单个Agent再强大,面对复杂任务时也会力不从心。就像一个人再聪明,也不如一个团队的集体智慧。 这个阶段的代表性框架包括LangGraph、AutoGen等。它们通过planner(规划器)实现multi-agent通信,让多个agent在一个系统库内协作。 工作原理:

1、任务分解:系统会写很多prompt,把复杂任务拆分成多个子任务

2、角色分配:不同的agent承担不同的专业角色

3、协作通信:各个agent之间通过预定义的协议进行信息交换

4、结果整合:最终将各个agent的输出整合成完整解决方案

虽然看起来是多智能体,但本质上还是单机系统,所有agent都运行在同一个环境中。这就像是一家公司内部不同部门的协作——虽然分工不同,但都在同一栋楼里办公。 这个阶段解决的问题是:如何让AI具备团队协作的能力,通过分工合作处理更复杂的任务。

第三阶段:不同设备机房之间联动

image

让agent在不同设备、不同机房去做计算,去联动,这个是未来支持亿级用户必须要有的架构。

目前我们仍处于第三阶段的竞争和尝试中,这个阶段尝试解决的问题是:很多网站或工具不支持ai agent调用,比如在mauns也能看到其在访问某些网站,由于有些网站有反机器人的设置,所以经常访问失败。那么这个阶段就需要打造一个通用协议来解决这个问题,才能支持agent与外界的联动。2024年11月,Claude推出了MCP协议,这是向统一Agent生态迈出的重要一步。

第四阶段:Agent-Agent协议通信

image

目前AI Agent应用大规模爆发的最大壁垒是缺乏真正统一的Agent-Agent协议通信标准与分布式计算能力。就像现在的安卓与iOS生态,我们也需要全球承认且通用的AI OS。

具体场景举例: 假设你有三个专业agent:

AgentA是做采访摘要的,AgentB是关于AI行业的分析调研,能不能再写一个Agent把两个Agent的能力综合起来,这个第三个Agent需要负责与那两个Agent通信去获取信息。理想情况下,Agent C应该能够无缝调用Agent A和Agent B的能力。但现实是:这三个agent之间的交互没有统一标准,底层链路打不通,就像两个使用不同语言的人无法直接沟通。

目前很多初创公司正在努力解决这个问题。比如2024年11月底,安卓系统前高管创业的公司DevAgents,他们想要打造一个通用操作系统,目标是为AI Agent提供统一平台。

我们正处在历史的转折点

目前我们正处于第三阶段的尾声和第四阶段的开端。这意味着什么?

对开发者:现在是布局AI Agent生态的最佳时机,早期参与者将获得巨大优势。

对企业:需要开始思考如何将AI Agent整合到现有业务流程中,这不是可选项,而是必需品。

对用户:我们即将迎来一个真正的"AI助手"时代,不是简单的问答机器人,而是能够跨平台、跨应用为我们处理复杂任务的数字员工。

就像早期的互联网需要HTTP协议一样,AI Agent时代急需统一的通信标准。谁能制定这个标准,谁就能掌握未来AI生态的话语权。 AI Agent的进化才刚刚开始,但变化的速度可能比我们想象的更快。从单个智能体到万物互联的Agent生态,这不仅是技术的进步,更是我们与AI协作方式的根本变革。

在这个历史转折点上,我们每个人都是见证者,也是参与者。







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5