上周,Manus爆火将Agent发展推向新的高潮,随后又引发一波开源复现狂潮,Agent仿佛已被大众所熟知。
工程上可将Agent拆分为三个核心模块:规划、工具使用、记忆。
图中的Action代表着行动,是真正让智能体有「手」的关键因素,并让LLM能够与现实世界进行交互。
而Action事实上就依赖于智能体所拥有的工具集合,工具集合所能触及到的范围就是智能体的能力边界。
要是听着还迷糊的话,给大伙整个生活案例。
你自己就是个智能体,假如你的大脑都没有对「冰箱」这个工具的定义和认识,压根你就不知道还有「冰箱」这个工具的存在,那么你又怎么可能会去用冰箱保存食物呢?
每个开发者在设计智能体时,都要提前定义一堆工具。
在之前都是通过函数调用实现的,开发者定义特定函数和参数,让模型按照规定格式调用,这个过程重复且繁琐。
传统工具调用如同定制手机接口:每个开发者都要为AI定制专属API接口。当A公司的"提交代码"叫create_PR,B平台却用generate_PullRequest。像极了之前安卓的充电口是安卓的,苹果的充电口是苹果的,使用起来贼不舒服。
去年11月,Anthropic开源了Model Context Protocol (MCP)协议。理解MCP只需拆解三个字母:
MCP正在做的,是给整个AI世界装上Type-C接口。通过统一接口层,让所有开发者都使用同一套规范,让AI对接Github就像Type-C连接显示器般自然,这大家不就都舒服了吗。
| 整合难度 | ||
| 实时双向通信 | ||
| 动态发现 | ||
| 扩展性 | ||
| 安全性与控制 |
为什么说MCP具有划时代意义?看看消费电子史就懂了。
当年苹果坚持Lightning接口的十几年,造就了:
直到欧盟强推USB-C统一标准,这场"接口军阀混战"才看到终结的希望。如今MCP想在AI领域复刻这场革命:
当然,MCP并非银弹。就像统一普通话会消弭方言特色,标准化也可能带来:
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |