Google说：2025年，Agent改变一切！

显示全部楼层

Google： 2025年是AI Agents元年；

Sam Altman： 2025年我们能构建出达到AGI L3的Agent。

Google trends 关于Ai Agents搜索词汇过去5年的趋势如下，最近几个月突然加速：

最新Google发布了一份关于Agents的白皮书，写的特别精彩，50多页的pdf。

Agent：AI 的新边界，从模型到智能体

现在，我们正在进入一个全新的时代，在这个时代，AI 不仅仅是模型，而是拥有自主思考和行动能力的agent。它不仅能理解你的指令，还能像人类一样规划、推理、并利用外部工具来完成任务，那将带来怎样的变革？这正是 AI agent 的核心理念。它们超越了传统模型的局限，将 AI 的应用推向了新的高度。

Agent 的核心：不止是模型

那么，到底什么是 agent 呢？简单来说，agent 是一个能够观察世界、思考决策并采取行动的程序。它不是一个被动执行指令的工具，而是一个主动解决问题的智能体。我们可以将其拆解为以下三个核心组件：

模型 (Model)：这是 agent 的“大脑”，可以是任何 LLM，比如 Gemini。模型负责理解语言、进行推理和规划。你可以根据需要选择不同大小、不同功能的模型。
工具 (Tools)：模型再强大，也无法访问真实世界。工具就像 agent 的“双手”，让它可以与外部世界互动。比如，使用 API 查询天气，或在数据库中查找信息。
编排层 (Orchestration Layer)：如果说模型是 agent 的大脑，那么编排层就是它的执行机制。它负责协调模型的思考和工具的使用，让 agent 按部就班地完成任务。编排层中，我们可以使用诸如ReAct、Chain-of-Thought (CoT) 或 Tree-of-Thoughts (ToT) 等推理框架来引导 agent 进行思考。

Agent 与模型：关键区别

现在，你可能会问：“agent 和模型到底有什么区别？”这里有一个简单的对比：

特征	模型 (Model)	Agent
知识来源	受限于训练数据	可通过工具连接外部系统获取新知
推理方式	单次推理	可管理历史会话，基于上下文进行多次推理
工具	没有原生工具	集成原生工具
执行逻辑	无逻辑层，仅提供预测	使用推理框架，构建复杂逻辑