手撕开源版Manus智能体

显示全部楼层

最近爆火的通用Agent智能体——Manus，口碑两极分化，褒贬不一。

有的人说是国产之光，有的人说是过度营销。

我不想评价谁对谁错，而是想站在解决问题的角度去思考，如果要让我实现这样个智能体，我该怎么做。

正好这两天看到一个复现 Manus 的开源项目 —— OpenManus

直接从源代码探究一下 OpenManus 能做哪些任务

在available_tools 中定义了 4 个工具，分别是 Python执行器、谷歌搜索、浏览器工具和文件存储。

说明 OpenManus 可以搜索资料、执行代码、使用浏览器以及向本地文件存储内容。

其中浏览器工具用到的也是开源项目——browser-use，一个可以自主使用浏览器完成任务的智能体，之前文章也有分享过。

这样看来，OpenManus 有点像一个能够操作使用电脑完成任务的初级助理了。

以后需要增加技能，比如：发邮件，就可以直接在代码里添加对应的技能就可以。

这里分享一个我开发智能体的一个体会。虽然Agent要发挥自主决策能力，但也不能任意发挥，而是要让大模型从我们定义好的能力列表中选择，比如，上面定义的4个工具。

这样，不至于让智能体天马行空，乱规划任务，从而让智能体的行为更可控。

为此，Anthropic 还提出了一个标准：模型上下文协议（MCP），可以将 AI 模型连接到不同的数据源和工具，并且已经开源。