链载Ai

标题: Context Engineering 上下文工程:构建可落地 AI Agent 的系统性方法论 [打印本页]

作者: 链载Ai    时间: 4 小时前
标题: Context Engineering 上下文工程:构建可落地 AI Agent 的系统性方法论


导读:

硅谷大神Andrej Karpathy,在今年6月一场主题为“Software in the Era of AI”的演讲中指出:与其构建很多自主Agent的炫目Demo,不如更多构建半自主产品。
是的,AI应用的最大价值之一,其实恰恰是“确定性”。
上下文工程(Context Engineering),其使命正是为了不断将LLM的“概率性”,最大程度优化为“确定性”。
说人话,就是让以AI Agent为代表的Apps,可落地,更靠谱。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;padding: 0.3em 1.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);border-radius: 8px 24px;box-shadow: rgba(0, 0, 0, 0.06) 0px 2px 6px;">从“简单提示”到“认知空间”

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">在构建可落地AI Agent的实践中,我们的视角必须超越单一的“提示工程”。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">正如 Andrej Karpathy 所言,如果大型语言模型(LLM)是新时代的“操作系统”,如下图:

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">那么它的上下文窗口(Context Window)就是“内存(RAM)”,作为模型的工作记忆,ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(15, 76, 129);">上下文工程(Context Engineering)正是这样一门“ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(15, 76, 129);">精妙的艺术与科学,旨在为LLM的上下文窗口精确填充下一步所需的恰当信息”。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">一个精心设计的上下文,可以显著提升Agent的任务解决能力、降低运营成本,并规避性能退化问题。你的AI有多强大,最终取决于你为它构建的上下文有多精良。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;padding: 0.3em 1.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);border-radius: 8px 24px;box-shadow: rgba(0, 0, 0, 0.06) 0px 2px 6px;">核心挑战:长上下文的“四宗罪”

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">通常,Agent会交替执行LLM 调用和工具调用,通常用于执行长时间运行的任务。Agent会交替执行LLM 调用和工具调用,并使用工具反馈来决定下一步操作。

当Agent执行长耗时任务时,其上下文会不断累积,这不仅会超出窗口限制、增加成本与延迟,更会引发一系列性能衰退问题。

这些问题可以归结为长上下文的“四宗罪”:

管理上下文,本质上就是管理AI的注意力与记忆力,是构建可靠Agent的基石。

四大支柱:上下文工程的实现策略

为应对上述挑战,业界已发展出四种核心的上下文工程策略,堪称四大支柱:写入(Write)、选择(Select)、压缩(Compress)和隔离(Isolate)

如下图所示,这些策略构成了上下文工程的通用类别:


支柱一:写入 (Write) - 构建Agent的外部记忆

定义:将信息从即时上下文窗口中移出,保存至外部存储,为Agent构建一个超越单次交互的持久化信息基础。

1.1 便笺

1.2 记忆

支柱二:选择 (Select) - 给予Agent此刻最需的洞察

定义:从外部存储中,智能地检索与当前任务最相关的信息,并将其动态载入LLM的上下文窗口。

2.1 从记忆/便笺中选择

2.2 从工具 (Tools) 中选择

2.3 从知识 (Knowledge) 中选择

支柱三:压缩 (Compress) - 在信息保真度与成本间取得平衡

定义:在保留核心信息的前提下,对上下文进行精简,以减少token消耗、降低延迟。

3.1 上下文总结 (Context Summarization)

3.2 上下文裁剪 (Context Trimming)

支柱四:隔离 (Isolate) - 为专注与安全划分认知边界

定义:通过逻辑或物理方式划分上下文,帮助Agent更专注地处理子任务,或在安全环境中执行操作。

4.1 Multi-Agent架构

4.2 通过环境进行隔离

4.3 通过状态对象进行隔离

结语:请成为「上下文架构师」

上下文工程正在成为构建高阶AI Agent的核心技艺。它要求我们从一个单纯的“提问者”或“提示工程师”,转变为一个深思熟虑的“上下文架构师”

系统性地运用写入、选择、压缩、隔离这四大策略,去主动设计和管理AI的认知空间。这不仅是技术的挑战,更是思维模式的转变。

未来,最强大的AI Agent,必定与最优秀的上下文架构师密不可分。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5