"2025年是智能体的元年",这种说法经常被提起,此前AI行业圈子有报道过AI Agent智能体自主性的摩尔定律,每7个月翻一番,根据在 GAIA通用人工智能助手测试集上的进展,看起来它们将在 2026 年初赶上人类基线,简而言之,AI Agent将在2026年达到人类操作智能的水平。
而且,这一进展仍然主要由基础 LLM 的改进推动:如果使用经过微调的智能体模型,进展会更快,得益于AI行业的快速发展,AI Agent此时此刻更值得入手实践。
同样Agent的普及和发展,离不开工程化实践,AIE工程师峰会按照常见和重要性大致降序排列了相关的6个要素:
带有工具的LLM:每个人都同意的事情。三大“LLM OS”工具是 RAG(上下文讨论)/搜索、沙盒/Canvas、浏览器/CUA 。
“Agent = LLM + 记忆力 + 规划能力 +工具使用能力” — Lilian Weng
编码意图:意图通过多模式 I/O(例如语音对话)进入,在目标中编码并通过在环境中运行的Evals(Snake Oil 、验证器对话)进行验证
“代理是一个可以追求目标导向行为的系统,它可以在实现目标的过程中不断适应。” —— Chisom Rutherford
LLM 驱动的控制流:正如Anthropic 的代理谈话所解释的那样,LLMs-in-the-loop是预设“工作流”和自主“代理”之间的共同点。
“应用越具有代理性,LLM 就越能决定申请的控制流” - Harrison Chase
多步骤规划:SOTA是可编辑的计划,正如Deep Research的讨论和Devin/Manus代理所展示的那样,效果很好
“一个人工智能系统组件,可以执行以前需要人类才能完成的复杂、多步骤操作。” —— Daniel Miessler
长期运行记忆:可创建连贯性和自我完善循环。除了 MemGPT/ MCP 记忆之外,我们还重点介绍了Voyager、SteP 风格的可重复使用工作流和技能库,作为更结构化的记忆形式。
“能够在现实世界中执行并完成长期、开放式任务的人工智能系统” ——Dan Jeffries
授权:信任是最容易被忽视的因素,但却是最古老的因素。“步履蹒跚的代理人”很快就会过时。对于读取量很大的工作流程,你可以信任但要验证,但企业的成功需要更多。
“代理人受信任代表被代理者并为其利益行事。如果没有信任,就没有代理人。 ” — Roman Pshichenko
将上述6个要素第一个字母组合,正好形成了一个单词“IMPACT”。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |