|
最近爆火的通用Agent智能体——Manus,口碑两极分化,褒贬不一。我不想评价谁对谁错,而是想站在解决问题的角度去思考,如果要让我实现这样个智能体,我该怎么做。正好这两天看到一个复现 Manus 的开源项目 —— OpenManus直接从源代码探究一下 OpenManus 能做哪些任务在available_tools 中定义了 4 个工具,分别是 Python执行器、谷歌搜索、浏览器工具和文件存储。说明 OpenManus 可以搜索资料、执行代码、使用浏览器以及向本地文件存储内容。其中浏览器工具用到的也是开源项目——browser-use,一个可以自主使用浏览器完成任务的智能体,之前文章也有分享过。这样看来,OpenManus 有点像一个能够操作使用电脑完成任务的初级助理了。以后需要增加技能,比如:发邮件,就可以直接在代码里添加对应的技能就可以。这里分享一个我开发智能体的一个体会。虽然Agent要发挥自主决策能力,但也不能任意发挥,而是要让大模型从我们定义好的能力列表中选择,比如,上面定义的4个工具。这样,不至于让智能体天马行空,乱规划任务,从而让智能体的行为更可控。为此,Anthropic 还提出了一个标准:模型上下文协议(MCP),可以将 AI 模型连接到不同的数据源和工具,并且已经开源。 |