很多人以为Anthropic这段时间推出《Equipping Agents for the real world with Agent Skills》的 Agent Skills只是 Tool Calling 的升级版。
很多人以为Anthropic这段时间推出《Equipping agents for the real world with Agent Skills》的 Agent Skills只是 Tool Calling 的升级版。然后也能取代MCP。
但这是一个巨大的误解。
如果说 Skills 是教 AI "如何做"某事,那么 MCP 就是给 AI "访问做这件事所需的东西"。
本文将从第一性原理出发,剖析 Anthropic 如何通过“动态认知注入”,解决传统 Agent 的上下文污染与能力僵化问题,并预测未来“提示词包管理(PPM)”的新时代。
在 Agent 开发圈子里,我们习惯了给模型“装义肢”,
但目前的Agent Skills模式其实展示了一种完全不同的野心。
它不再只是给模型“手脚”,而是试图在运行时,给模型临时植入一位领域专家的“大脑”。
这不是工具能力的升级,这是提示词架构(Prompt Architecture)的革命。
在 Skills 出现之前,我们构建复杂 Agent 时往往面临三个无解的死循环:
Agent Skills 的核心理念可以概括为:按需、临时、可回收地注入高权限上下文。
如果把 LLM 比作一个智商 200 的天才实习生,那么 Skills 就是一份份资深专家的“记忆切片”。
这种“运行时重构模型认知状态”,才是 Skills 的本质。
首先,我们创造的Skill,要包含这个Skill.md文件,头部使用yaml格式,简单说明这个skill即可。这一段是要注入给System Prompt的,其它的不需要。只有在LLM判断,需要执行这个Skill时,才会去通读这个文件。
Skill.md的内容中,也可以包含更细分的内容,说明每种情况又应该如何应对。
这样,在整个Agent工作流程中,保持的上下文会非常清爽。
通过分析 Anthropic 官方提供的 Skills 文件,
https://github.com/anthropics/skills
我们可以清晰地看到这种“认知注入”是如何运作的。
如果你让普通 LLM 写一个生成艺术的代码,它通常会写一个简单的随机圆圈。
但在 algorithmic-art Skill 中,Anthropic 并没有直接给绘图函数,而是注入了“艺术家的灵魂”。
在 SKILL.md 中,它强制要求模型遵循以下步骤:
这不仅仅是调用绘图库,这是通过 Prompt 改变了模型的人格设定,让它从“程序员”变成了“数字艺术家”。
处理企业文档最怕弄坏文件结构。在 docx Skill 中,我们可以看到极其严格的“防御性编程”思维注入。
docx-js.md 或 ooxml.md。这意味着,模型在处理文档的那一刻,不仅拥有了工具,还临时“阅读并背诵”了数百行的最佳实践文档。
新手测试员常犯的错误是不等待页面加载完成就去抓元素。webapp-testing Skill 直接将 QA 专家的经验固化为流程:
networkidle 就检查 DOM”的行为。现在在企业落地Agent的过程中,业务人员和开发人员的工作是耦合起来的。业务人员需要将自己的业务梳理清楚,并让开发人员理解,这样才能落地一个Agent可以调用的Tool,或者在System里硬编码个Prompt来说明流程。
但目前Skill的模式,将这种情况解耦出来了,业务人员可以专心的编写文档,开发人员只需要针对文档内容,提取自动化的部分,编写程序即可。
这样大大降低了Agent落地的门槛,提升了效率。
基于 Anthropic 的开源案例,我们可以总结出构建高质量 Skills 的黄金法则:
SKILL.md 应该只是一个路由表。具体的 API 文档、Schema 定义,应该放在子文件夹中,让模型在需要时通过“读取工具”去获取。例如 DOCX Skill 就把具体的 XML 规范放在了单独的 Markdown 文件中。⚠️ STEP 0、CRITICAL)。预判模型可能犯的愚蠢错误(如死循环、文件损坏、版权问题),并提前在 Prompt 中设立围栏。当然,Skills 并非没有挑战:
其实目前的测试中,就已经发现了很多问题。使用Claude的模型,正确选择Skill的正确率大概有90%,但是使用别的模型,这个正确率会下降很多。
但展望未来,Claude Skills 预示着 Agent 开发正从“代码工程”转向“模因工程(Memetic Engineering)”。
我们可以预见 Prompt Package Manager (PPM) 的诞生。未来,在这个 Marketplace 中,你不再是下载代码库,而是下载“思维包”:
npm install legal-reasoning-skill,你的 Agent 瞬间拥有 10 年律师经验。npm install pandas-expert-skill,你的 Agent 瞬间学会最佳的数据处理范式。实际上,目前已经有很多开源的Skill包放出来了,比如这个项目:
https://skillsmp.com/zh
开发者们已经贡献了33132个可用技能。甚至还有create skill的skill。
Agent 将不再是一个固定的人格,而是一种流体智能,根据任务的不同,实时装载不同的 Skills,上一秒是疯狂的艺术家,下一秒是严谨的审计员。
这,才是 Agent 的终极形态。
| 欢迎光临 链载Ai (http://www.lianzai.com/) | Powered by Discuz! X3.5 |