Claude Skills 第一性原理：从「给工具」到「注入灵魂」，Agent 开发范式的真正革命

显示全部楼层

很多人以为Anthropic这段时间推出《Equipping Agents for the real world with Agent Skills》的 Agent Skills只是 Tool Calling 的升级版。

很多人以为Anthropic这段时间推出《Equipping agents for the real world with Agent Skills》的 Agent Skills只是 Tool Calling 的升级版。然后也能取代MCP。

但这是一个巨大的误解。

如果说 Skills 是教 AI "如何做"某事，那么 MCP 就是给 AI "访问做这件事所需的东西"。

To activate skills, all you need to do is write a SKILL.md file with custom guidance for your agent.

本文将从第一性原理出发，剖析 Anthropic 如何通过“动态认知注入”，解决传统 Agent 的上下文污染与能力僵化问题，并预测未来“提示词包管理（PPM）”的新时代。

在 Agent 开发圈子里，我们习惯了给模型“装义肢”，

给它一个计算器工具，它就会算数；
给它一个搜索工具，它就会联网。

但目前的Agent Skills模式其实展示了一种完全不同的野心。

它不再只是给模型“手脚”，而是试图在运行时，给模型临时植入一位领域专家的“大脑”。

这不是工具能力的升级，这是提示词架构（Prompt Architecture）的革命。

一、痛点：传统 Agent 的“全知全能”陷阱

在 Skills 出现之前，我们构建复杂 Agent 时往往面临三个无解的死循环：

System Prompt 的无限膨胀（上下文污染）为了让 Agent 既懂写代码，又懂法律合同，还得会画图，我们将成千上万字的 SOP（标准作业程序）塞进 System Prompt。结果是模型的注意力被稀释，处理简单任务时也会因为复杂的规则产生幻觉。
过程幻觉模型知道“目标（Goal）”，但往往选错“路径（Path）”。比如让它修改 Word 文档，它可能会尝试用正则去暴力替换 XML，而不是调用安全的库。因为它只有通识，没有“专家经验”。
能力僵化硬编码的 Chain（链式调用）虽然稳定，但缺乏灵活性。一旦任务稍微偏离预设流程，Agent 就不知道如何回退或重试。

二、第一性原理：动态的认知注入

Agent Skills 的核心理念可以概括为：按需、临时、可回收地注入高权限上下文。

如果把 LLM 比作一个智商 200 的天才实习生，那么 Skills 就是一份份资深专家的“记忆切片”。

传统 Tool Calling：传统的Tool Calling方式，需要将可调用的Tool的所有Description都塞进System Prompt中，这就好比，这位天才实习生，刚入职，你就把公司的手册塞给他，并且让他今天就背完。
Agent Skills：而Agent Skills不一样。它并不会将让实习生在接任务时，读所有的手册，而是在接任务的时候，交给他一个目录，让他根据目录去动态寻找任务所需要的知识。就好比，让他去做财务报销，他从目录中找到了报销流程后，就直接按照这个流程去执行，这个任务完成后，这段记忆就卸载掉，恢复成通用状态。等什么时候再需要，就重新加载即可。

这种“运行时重构模型认知状态”，才是 Skills 的本质。

Skill.md的具体示例

首先，我们创造的Skill，要包含这个Skill.md文件，头部使用yaml格式，简单说明这个skill即可。这一段是要注入给System Prompt的，其它的不需要。只有在LLM判断，需要执行这个Skill时，才会去通读这个文件。

Skill.md的内容中，也可以包含更细分的内容，说明每种情况又应该如何应对。

这样，在整个Agent工作流程中，保持的上下文会非常清爽。

三、实战解析：Skills 是如何改变模型的？

通过分析 Anthropic 官方提供的 Skills 文件，

https://github.com/anthropics/skills

我们可以清晰地看到这种“认知注入”是如何运作的。

1. 注入“审美与哲学”：Algorithmic Art Skill

如果你让普通 LLM 写一个生成艺术的代码，它通常会写一个简单的随机圆圈。

但在 algorithmic-art Skill 中，Anthropic 并没有直接给绘图函数，而是注入了“艺术家的灵魂”。

在 SKILL.md 中，它强制要求模型遵循以下步骤：

哲学先行：在写任何代码前，必须先撰写一份“算法哲学（Algorithmic Philosophy）”文档。
强调工艺：Prompt 显式要求模型重复强调“精湛的工艺（Expert Craftsmanship）”，必须表现得像“处于领域顶端的专家”。
禁止抄袭：明确指令“Create original algorithmic art rather than copying existing artists' work”。

这不仅仅是调用绘图库，这是通过 Prompt 改变了模型的人格设定，让它从“程序员”变成了“数字艺术家”。

2. 注入“合规与安全”：DOCX Skill

处理企业文档最怕弄坏文件结构。在 docx Skill 中，我们可以看到极其严格的“防御性编程”思维注入。

决策树（Decision Tree）：Skill 开头就定义了逻辑——是新建？是简单修改？还是红线修订？不同任务走不同路径。
强制阅读（Mandatory Reading）：最精彩的部分在于，Skill 包含指令 “MANDATORY - READ ENTIRE FILE”，强迫模型在操作前先通读 docx-js.md 或 ooxml.md。

这意味着，模型在处理文档的那一刻，不仅拥有了工具，还临时“阅读并背诵”了数百行的最佳实践文档。

3. 注入“方法论”：Webapp Testing Skill

新手测试员常犯的错误是不等待页面加载完成就去抓元素。webapp-testing Skill 直接将 QA 专家的经验固化为流程：

侦察-行动模式：强制模型遵循“先截图/检查DOM -> 再行动”的流程。
避免竞态条件：明确禁止“不等待 networkidle 就检查 DOM”的行为。

四、对于Agent开发的最大意义

现在在企业落地Agent的过程中，业务人员和开发人员的工作是耦合起来的。业务人员需要将自己的业务梳理清楚，并让开发人员理解，这样才能落地一个Agent可以调用的Tool，或者在System里硬编码个Prompt来说明流程。

但目前Skill的模式，将这种情况解耦出来了，业务人员可以专心的编写文档，开发人员只需要针对文档内容，提取自动化的部分，编写程序即可。

这样大大降低了Agent落地的门槛，提升了效率。

五、最佳实践：如何构建你的 Skills？

基于 Anthropic 的开源案例，我们可以总结出构建高质量 Skills 的黄金法则：

渐进式披露（Progressive Disclosure）不要把所有知识塞进一个文件。SKILL.md 应该只是一个路由表。具体的 API 文档、Schema 定义，应该放在子文件夹中，让模型在需要时通过“读取工具”去获取。例如 DOCX Skill 就把具体的 XML 规范放在了单独的 Markdown 文件中。
防御性指令（Defensive Instructions）使用强烈的语气词（如 ⚠️ STEP 0、CRITICAL）。预判模型可能犯的愚蠢错误（如死循环、文件损坏、版权问题），并提前在 Prompt 中设立围栏。
模块化与自包含一个 Skill 就是一个完整的文件夹，包含它所需的所有脚本、模版和文档。这使得 Skill 像乐高积木一样，可以在不同的 Agent 之间复用。

六、挑战与未来

当然，Skills 并非没有挑战：

路由歧义：如果 Skill 描述不清，模型可能不知道何时加载它。
Token 消耗：动态加载大量文档会增加 Token 成本和延迟。

其实目前的测试中，就已经发现了很多问题。使用Claude的模型，正确选择Skill的正确率大概有90%，但是使用别的模型，这个正确率会下降很多。

但展望未来，Claude Skills 预示着 Agent 开发正从“代码工程”转向“模因工程（Memetic Engineering）”。

我们可以预见 Prompt Package Manager (PPM) 的诞生。未来，在这个 Marketplace 中，你不再是下载代码库，而是下载“思维包”：

想做法律分析？npm install legal-reasoning-skill，你的 Agent 瞬间拥有 10 年律师经验。
想做数据清洗？npm install pandas-expert-skill，你的 Agent 瞬间学会最佳的数据处理范式。

实际上，目前已经有很多开源的Skill包放出来了，比如这个项目：

https://skillsmp.com/zh

开发者们已经贡献了33132个可用技能。甚至还有create skill的skill。

Agent 将不再是一个固定的人格，而是一种流体智能，根据任务的不同，实时装载不同的 Skills，上一秒是疯狂的艺术家，下一秒是严谨的审计员。

这，才是 Agent 的终极形态。

Claude Skills 第一性原理：从「给工具」到「注入灵魂」，Agent 开发范式的真正革命

一、 痛点：传统 Agent 的“全知全能”陷阱

二、 第一性原理：动态的认知注入