链载Ai

标题: Anthropic长文拆解上下文工程落地策略与实践 [打印本页]

作者: 链载Ai    时间: 昨天 22:23
标题: Anthropic长文拆解上下文工程落地策略与实践
把 200 k token塞满很容易,让模型在长上下文仍能够大海捞针却很难。Anthropic 在29号的官方长文里系统梳理了"上下文工程"(Context Engineering)这一新兴方向。本文将其进行技术拆解与压缩,务必让你快速掌握上下文工程。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">1. 提示词工程的尽头是上下文工程

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">提示词工程主要关注的是怎么写,而上下文工程关注的则是给什么。Anthropic认为上下文工程是提示词工程的自然演化:当 Agent 运行多轮、系统指令、工具、MCP、外部数据、消息历史记录不断涌入时,根据大海捞针的测试,随着上下文窗口中Token数量的增加,模型准确回忆该上下文信息的能力会下降。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">因此,我们需要制定策略来管理整个上下文状态,所以问题也就从如何写一条好提示升级为如何在每一轮只让模型看到最小充分信息集——这就是上下文工程的新战场。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">faa261102e46c7f090a2402a49000ffae18c5dd6-2292x1290

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">2. 有效上下文工程剖析

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">提示应清晰、简洁且直接,避免过度复杂的 if-else 逻辑或假设共享上下文。我们建议将提示组织成不同部分(如背景信息、指令等),并用简单的标记语言(如 XML 或 Markdown)加以区分。随着模型功能增强,格式可能变得不那么重要。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">要用最少的信息概括预期行为,这并不等于简短,而是精确。通过初步测试模型的反应,识别问题并调整提示以提高性能。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;text-align: left;text-indent: 0px;text-transform: none;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration: none;">至关重要,既能提升效率,又能避免功能过多导致决策模糊。为 AI智能体构建一个简洁、功能明确的工具集有助于长期稳定地管理上下文。

在提供示例时,应避免过度列举边缘情况,转而通过少量多样的标准示例有效引导模型行为。

总的来说,上下文应简明、具体且充实,以确保代理行为符合预期。

3. 上下文检索和Agentic检索

在《Building effective agents》中,他们定义了智能体为能在循环中自主使用工具的 LLM。随着模型功能的提升,Agent的自主性逐渐增强,能够独立探索问题并从错误中恢复。如今,许多 AI 应用采用基于RAG的方法为Agent提供重要的推理上下文。

“即时”情境策略不需要预先处理所有数据,而是通过维护轻量级标识符(如文件路径、查询、Web 链接)来动态加载数据。这种方法让Agent像人类一样按需检索信息,而不是记住全部数据。通过引用元数据(如文件夹层级、命名约定、时间戳等),Agent能够有效优化行为并逐步发现相关情境。

虽然运行时探索比预检索数据要慢,但合理的工具设计和启发式方法能提高效率。在某些任务中,混合策略(如预检索部分数据并进一步自主探索)可以更有效地平衡速度与自主性。Claude Code 就是采用这种方法,通过预加载文件并实时检索来避免过时索引和复杂语法问题。

所以这就是我一直推崇使用Cline式的主动探索式构建RAG的原因,虽然会牺牲实时性,但是只要前端有一定的反馈,用户体验式不会差的。

对于长期任务,Agent需要跨越上下文窗口的限制。压缩、结构化笔记和多智能体架构是应对这一挑战的技术。

压缩通过总结上下文历史,避免信息过载。

结构化笔记允许代理在上下文窗口外记录关键信息,保持任务一致性。

子代理架构则通过分配任务给专门的子代理,避免单个代理维护过多状态,提高任务处理效率。

这些技术可以根据任务需求灵活选择:压缩适用于对话任务,笔记记录适合迭代开发,而多代理架构则在复杂研究任务中表现优异。

总结

上下文工程代表了我们构建 LLM 时的根本转变。随着模型能力的提升,挑战不再仅仅是设计完美的提示,而是如何精心挑选每一步输入模型的关键信息,以最大化结果的可能性。不论是处理长周期任务的压缩、设计高效的工具,还是让代理按需探索环境,核心原则始终不变






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5