前言上周,Manus爆火将Agent发展推向新的高潮,随后又引发一波开源复现狂潮,Agent仿佛已被大众所熟知。
工程上可将Agent拆分为三个核心模块:规划、工具使用、记忆。 
图中的Action代表着行动,是真正让智能体有「手」的关键因素,并让LLM能够与现实世界进行交互。 而Action事实上就依赖于智能体所拥有的工具集合,工具集合所能触及到的范围就是智能体的能力边界。
要是听着还迷糊的话,给大伙整个生活案例。 你自己就是个智能体,假如你的大脑都没有对「冰箱」这个工具的定义和认识,压根你就不知道还有「冰箱」这个工具的存在,那么你又怎么可能会去用冰箱保存食物呢? MCP的划时代意义每个开发者在设计智能体时,都要提前定义一堆工具。 在之前都是通过函数调用实现的,开发者定义特定函数和参数,让模型按照规定格式调用,这个过程重复且繁琐。
传统工具调用如同定制手机接口:每个开发者都要为AI定制专属API接口。当A公司的"提交代码"叫create_PR,B平台却用generate_PullRequest。像极了之前安卓的充电口是安卓的,苹果的充电口是苹果的,使用起来贼不舒服。
去年11月,Anthropic开源了Model Context Protocol (MCP)协议。理解MCP只需拆解三个字母: - Model:各类AI模型,如GPT、Claude等
MCP正在做的,是给整个AI世界装上Type-C接口。通过统一接口层,让所有开发者都使用同一套规范,让AI对接Github就像Type-C连接显示器般自然,这大家不就都舒服了吗。 MCP与传统工具调用的对比为什么说MCP具有划时代意义?看看消费电子史就懂了。 当年苹果坚持Lightning接口的十几年,造就了: 直到欧盟强推USB-C统一标准,这场"接口军阀混战"才看到终结的希望。如今MCP想在AI领域复刻这场革命:
冷思考:标准化的代价与未来当然,MCP并非银弹。就像统一普通话会消弭方言特色,标准化也可能带来: - 创新自由度受限:如同所有开发者被"甲方审美"统一,万一MCP标准是错误的呢?
- 生态垄断风险:可能形成新的技术卡脖子点,MCP核心生态可能全被主导者控制,并要求开发者强行遵守
|