如果把智能体系统拆开看,其实有四种主要的架构,它们的差异不在于“谁更先进”,而在于它们适合什么样的任务。
最基础的是单智能体系统。它就像一个全能选手:感知、推理、规划、执行都在自己脑子里完成。它掌握所有上下文,没有信息在传递中被压缩或拆散,这让它在处理长链条、环环相扣的任务时最稳定,也最省资源——没有沟通成本,也不存在“协作税”。缺点也很明显:面对特别庞大或复杂的任务,它无法像团队那样把问题拆开来做,容易被局部细节困住。独立式多智能体是最简单的“多人模式”。每个智能体各做各的,互不交流,最后把结果简单投票汇总。它的最大好处是快,因为没有任何沟通延迟。但由于没有互相检查的过程,一旦某个智能体犯错,错误就会直接进入最终答案,没有任何纠偏机制。协调者负责拆解任务、分发给子智能体,并负责回收和审核结果。它像质检员一样过滤错误,使系统在结构化任务里更稳健。但协调者会成为瓶颈,所有沟通都要经过它,协作开销也随之上升。分散多智能体则走向另一端:所有智能体之间都能点对点沟通,互相辩论、交换信息。这种结构适合探索性强、信息模糊的任务,通过高冗余的反复确认来降低幻觉风险。但成本极高——随着智能体数量增加,通信量不是线性,而是指数级增长,对 Token 的消耗非常可怕。混合式架构试图融合这两种模式:既保留中心化的秩序,又允许底层智能体横向交流。理论上,它能适配最复杂的任务。但现实中,结构越复杂,协作成本越高,往往得不偿失——系统越“聪明”,越容易被自己的复杂性拖垮。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;text-align: center;line-height: 1.75;">/ 04 /ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;text-align: center;line-height: 1.75;">算一笔经济帐
除了性能上,这篇论文还从经济学的角度对多智能体系统进行了残酷的剖析。
第一,效率暴跌:多智能体在Token 利用率上全面溃败。单看最终准确率,多智能体偶尔能胜过单智能体。但如果换成商业最看重的指标——每 1000 Token 能带来多少次成功?单智能体:每1000 Token 能换来67.7次成功。中心化架构:效率降至21.5 次(效率仅为单智能体的1/3)。混合式架构:效率暴跌至13.6 次(效率仅为单智能体的1/5)。这意味着,如果任务不是价值极高(如金融决策),多智能体几乎没有商业可行性。第二,轮次的“平方级膨胀”:协作不是加法,是乘法。研究指出:智能体数量增加(n),轮次增加不是线性(n),而是接近平方(n²)。混合式架构:轮次飙升至44.3 个,是单智能体的 6.2 倍。同时,由于实验中严格控制了总Token 预算(平均 4800 Tokens)。当轮次从 7 激增到 44 时,留给每一轮的平均 Token 数就会被极度压缩,智能体没有足够的上下文窗口去进行深度的“思维链”(CoT)推理,答案只能越来越浅,回答的质量迅速下滑。也就是说,轮次越多,推理越浅;推理越浅,性能越差。而轮次越多,是协作本身造成的。数据表明,3-4个智能体是当前技术下的“黄金分割点”。一旦超过这个规模,通信成本就会主导计算资源,导致边际收益变为负数 。智能体系统的扩展不是“人数越多越好”。它更像是一场在推理能力、协作开销与任务结构之间的走钢丝。在很多情况下,一个足够强的单模型,比一群需要反复沟通的模型更高效、更可靠。