Manus带着MCP一起火了起来，原来这就是快速构建AI Agent的秘诀！

显示全部楼层

前言

上周，Manus爆火将Agent发展推向新的高潮，随后又引发一波开源复现狂潮，Agent仿佛已被大众所熟知。

工程上可将Agent拆分为三个核心模块：规划、工具使用、记忆。

图中的Action代表着行动，是真正让智能体有「手」的关键因素，并让LLM能够与现实世界进行交互。

而Action事实上就依赖于智能体所拥有的工具集合，工具集合所能触及到的范围就是智能体的能力边界。

要是听着还迷糊的话，给大伙整个生活案例。

你自己就是个智能体，假如你的大脑都没有对「冰箱」这个工具的定义和认识，压根你就不知道还有「冰箱」这个工具的存在，那么你又怎么可能会去用冰箱保存食物呢？

每个开发者在设计智能体时，都要提前定义一堆工具。

在之前都是通过函数调用实现的，开发者定义特定函数和参数，让模型按照规定格式调用，这个过程重复且繁琐。

传统工具调用如同定制手机接口：每个开发者都要为AI定制专属API接口。当A公司的"提交代码"叫create_PR，B平台却用generate_PullRequest。像极了之前安卓的充电口是安卓的，苹果的充电口是苹果的，使用起来贼不舒服。

去年11月，Anthropic开源了Model Context Protocol (MCP)协议。理解MCP只需拆解三个字母：

MCP正在做的，是给整个AI世界装上Type-C接口。通过统一接口层，让所有开发者都使用同一套规范，让AI对接Github就像Type-C连接显示器般自然，这大家不就都舒服了吗。

为什么说MCP具有划时代意义？看看消费电子史就懂了。

当年苹果坚持Lightning接口的十几年，造就了：

直到欧盟强推USB-C统一标准，这场"接口军阀混战"才看到终结的希望。如今MCP想在AI领域复刻这场革命：

当然，MCP并非银弹。就像统一普通话会消弭方言特色，标准化也可能带来：