ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-align: justify;text-indent: 0em;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);color: rgb(34, 34, 34);line-height: 1.8em;letter-spacing: 0em;border-style: none none none solid;border-width: 1px 1px 1px 5px;border-color: rgb(0, 0, 0) rgb(0, 0, 0) rgb(0, 0, 0) rgb(248, 57, 41);border-radius: 0px;align-items: unset;box-shadow: none;flex-direction: unset;float: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;visibility: visible;">一、MCP 之后,我们还需要什么?ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">MCP(Model Context Protocol)由 Anthropic 团队提出,其核心设计理念是标准ingFang SC", system-ui, -apple-system, system-ui, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 1px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;caret-color: rgb(30, 30, 30);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;float: none;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;display: inline !important;">化智能体与外部工具/资源的通信方式。想象一下,你的智能体需要访问文件系统、数据库、GitHub、Slack 等各种服务。传统做法是为每个服务编写专门的适配器,这不仅工作量大,而且难以维护。MCP 通过定义统一的协议规范,让所有服务都能以相同的方式被访问。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">MCP 的设计哲学是"上下文共享"。它不仅仅是一个远程过程调用协议,更重要的是它允许智能体和工具之间共享丰富的上下文信息。让我们回顾一个典型的 MCP 使用场景:fromhello_AgentsimportReActAgent, HelloAgentsLLM fromhello_agents.toolsimportMCPTool
llm = HelloAgentsLLM() agent = ReActAgent(name="数据分析助手", llm=llm)
# 连接到数据库 MCP 服务器 db_mcp = MCPTool(server_command=["python","database_mcp_server.py"]) agent.add_tool(db_mcp)
# 智能体现在可以访问数据库了 response = agent.run("查询员工表中薪资最高的前10名员工")
ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">这段代码工作得很好,智能体成功连接到了数据库。但当你尝试处理更复杂的任务时,会发现一些微妙的问题:# 一个更复杂的需求 response = agent.run(""" 分析公司内部谁的话语权最高? 需要综合考虑: 1. 管理层级和下属数量 2. 薪资水平和涨薪幅度 3. 任职时长和稳定性 4. 跨部门影响力 """)
ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">这个任务需要执行多次数据库查询,每次查询的结果会影响下一次查询的策略。更关键的是,它需要智能体具备领域知识:知道如何衡量"话语权",知道应该从哪些维度分析数据,知道如何组合多个查询结果得出结论。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">此时,你会遇到两个根本性的问题:ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">第一个问题是上下文爆炸。为了让智能体能够灵活查询数据库,MCP 服务器通常会暴露数十甚至上百个工具(不同的表、不同的查询方法)。这些工具的完整 JSON Schema 在连接建立时就会被加载到系统提示词中,可能占用数万个 token。据社区开发者反馈,仅加载一个 Playwright MCP 服务器就会占用 200k 上下文窗口的 8%,这在多轮对话中会迅速累积,导致成本飙升和推理能力下降。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">第二个问题是能力鸿沟。MCP 解决了"能够连接"的问题,但没有解决"知道如何使用"的问题。拥有数据库连接能力,不等于智能体知道如何编写高效且安全的 SQL;能够访问文件系统,不意味着它理解特定项目的代码结构和开发规范。这就像给一个新手程序员开通了所有系统的访问权限,但没有提供操作手册和最佳实践。ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;clear: both;min-height: 1em;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(255, 255, 255);align-items: unset;border-style: none;border-width: 1px;border-color: rgb(0, 0, 0);border-radius: 0px;box-shadow: none;flex-direction: unset;height: auto;justify-content: unset;overflow: unset;text-shadow: none;transform: none;width: auto;-webkit-box-reflect: unset;line-height: 2em;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">这正是Agent Skills要解决的核心问题。2025年初,Anthropic 在推出 MCP 之后,进一步提出了 Agent Skills 的概念,引发了业界的广泛关注。有开发者评论说:"Skill 和 MCP 是两种东西,Skill 是领域知识,告诉模型该如何做,本质上是高级 Prompt;而 MCP 对接外部工具和数据。" 也有人认为:"从 Function Call 到 Tool Call 到 MCP 到 Skill,核心大差不差,就是工程实践和表现形式的优化演进。"那么,Agent Skills 到底是什么?它与 MCP 有何本质区别?两者是竞争关系还是互补关系?本章将深入探讨这些问题。 二、什么是 Agent Skills?1. 核心设计理念Agent Skills 是一种标准化的程序性知识封装格式。如果说 MCP 为智能体提供了"手"来操作工具,那么 Skills 就提供了"操作手册"或"SOP(标准作业程序)",教导智能体如何正确使用这些工具。 这种设计理念源于一个简单但深刻的洞察:连接性(Connectivity)与能力(Capability)应该分离。MCP 专注于前者,Skills 专注于后者。这种职责分离带来了清晰的架构优势: - MCP 的职责:提供标准化的访问接口,让智能体能够"够得着"外部世界的数据和工具
- Skills 的职责:提供领域专业知识,告诉智能体在特定场景下"如何组合使用这些工具"
用一个类比来理解:MCP 像是 USB 接口或驱动程序,它定义了设备如何连接;而 Skills 像是软件应用程序,它定义了如何使用这些连接的设备来完成具体任务。你可以拥有一个功能完善的打印机驱动(MCP),但如果没有告诉你如何在 Word 里设置页边距和双面打印(Skill),你仍然无法高效地完成打印任务。2. 渐进式披露:破解上下文困境Agent Skills 最核心的创新是渐进式披露(Progressive Disclosure)机制。这种机制将技能信息分为三个层次,智能体按需逐步加载,既确保必要时不遗漏细节,又避免一次性将过多内容塞入上下文窗口。 图 1 Agent Skills 渐进式披露三层架构 第一层:元数据(Metadata)在 Skills 的设计中,每个技能都存放在一个独立的文件夹中,核心是一个名为SKILL.md的 Markdown 文件。这个文件必须以 YAML 格式的 Frontmatter 开头,定义技能的基本信息。 当智能体启动时,它会扫描所有已安装的技能文件夹,仅读取每个SKILL.md的 Frontmatter 部分,将这些元数据加载到系统提示词中。根据实测数据,每个技能的元数据仅消耗约100 个 token。即使你安装了 50 个技能,初始的上下文消耗也只有约 5,000 个 token。 这与 MCP 的工作方式形成了鲜明对比。在典型的 MCP 实现中,当客户端连接到一个服务器时,通常会通过tools/list请求获取所有可用工具的完整 JSON Schema,可能立即消耗数万个 token。 第二层:技能主体(Instructions)当智能体通过分析用户请求,判断某个技能与当前任务高度相关时,它会进入第二层加载。此时,智能体会读取该技能的完整SKILL.md文件内容,将详细的指令、注意事项、示例等加载到上下文中。 此时,智能体获得了完成任务所需的全部上下文:数据库结构、查询模式、注意事项等。这部分内容的 token 消耗取决于指令的复杂度,通常在 1,000 到 5,000 个 token 之间。 第三层:附加资源(Scripts & References)对于更复杂的技能,SKILL.md可以引用同一文件夹下的其他文件:脚本、配置文件、参考文档等。智能体仅在需要时才加载这些资源。 例如,一个 PDF 处理技能的文件结构可能是: skills/pdf-processing/ ├── SKILL.md # 主技能文件 ├── parse_pdf.py # PDF 解析脚本 ├── forms.md # 表单填写指南(仅在填表任务时加载) └── templates/ # PDF 模板文件 ├── invoice.pdf └── report.pdf
在SKILL.md中,可以这样引用附加资源: - 当需要执行 PDF 解析时,智能体会运行
parse_pdf.py脚本 - 当遇到表单填写任务时,才会加载
forms.md了解详细步骤
这种设计有两个关键优势: 无限的知识容量:通过脚本和外部文件,技能可以"携带"远超上下文限制的知识。例如,一个数据分析技能可以附带一个 1GB 的数据文件和一个查询脚本,智能体通过执行脚本来访问数据,而无需将整个数据集加载到上下文中。 确定性执行:复杂的计算、数据转换、格式解析等任务交给代码执行,避免了 LLM 生成过程中的不确定性和幻觉问题。
3. 渐进式披露的效果:从 16k 到 500 Token社区开发者分享的实践案例充分证明了渐进式披露的威力。在一个真实场景中: - 传统 MCP 方式:直接连接一个包含大量工具定义的 MCP 服务器,初始加载消耗16,000 个 token
- Skills 包装后:创建一个简单的 Skill 作为"网关",仅在 Frontmatter 中描述功能,初始消耗仅500 个 token
当智能体确定需要使用该技能时,才会加载详细指令并按需调用底层的 MCP 工具。这种架构不仅大幅降低了初始成本,还使得对话过程中的上下文管理更加精准和高效。 三、Agent Skills vs MCP:本质区别与协作关系现在,我们可以系统地比较这两种技术的本质区别了。 图 2 MCP 与 Agent Skills 设计哲学对比 1. 从工程视角理解差异让我们通过一个具体的例子来理解这种差异。假设你要构建一个智能体来帮助团队进行代码审查: MCP 的职责: # MCP 提供对 GitHub 的标准化访问 github_mcp = MCPTool(server_command=["npx","-y","@modelcontextprotocol/server-github"])
# MCP 暴露的工具(简化示例): # - list_pull_requests(repo, state) # - get_pull_request_details(pr_number) # - list_pr_comments(pr_number) # - create_pr_comment(pr_number, body) # - get_file_content(repo, path, ref) # - list_pr_files(pr_number)
MCP 让智能体"能够"访问 GitHub,能够调用这些 API。但它不知道"应该"做什么。 Skills 的职责: --- name: code-review-workflow description: 执行标准的代码审查流程,包括检查代码风格、安全问题、测试覆盖率等 ---
# 代码审查工作流
## 审查清单
当执行代码审查时,按以下步骤进行:
1.**获取 PR 信息**:调用`get_pull_request_details`了解变更背景 2.**分析变更文件**:调用`list_pr_files`获取文件列表 3.**逐文件审查**: -对于`.py`文件:检查是否符合 PEP 8,是否有明显的性能问题 -对于`.js/.ts`文件:检查是否有未处理的 Promise,是否使用了废弃的 API -对于测试文件:验证是否覆盖了新增的代码路径 4.**安全检查**: -是否硬编码了敏感信息(密钥、密码) -是否有 SQL 注入或 XSS 风险 5.**提供反馈**: -严重问题:使用`create_pr_comment`直接评论 -建议改进:在总结中提出
## 公司特定规范
-所有数据库查询必须使用参数化查询 -API 端点必须有权限验证装饰器 -新功能必须附带单元测试(覆盖率 > 80%)
## 示例评论模板
**严重问题**:
⚠️ 安全风险:第 45 行直接拼接 SQL 字符串,存在注入风险。 建议改用参数化查询:`cursor.execute("SELECT * FROM users WHERE id = ?", (user_id,))`
Skills 告诉智能体"应该"做什么、如何组织审查流程、需要关注哪些公司特定的规范。它是领域知识和最佳实践的容器。 2. 上下文管理策略的本质差异图 3 MCP 急切加载 vs Skills 惰性加载对比 3. 互补而非竞争:Skills + MCP 的混合架构理解了两者的差异后,我们会发现:Skills 和 MCP 不是竞争关系,而是互补关系。最佳实践是将两者结合,形成分层架构: 图 4 Skills + MCP 混合架构设计 典型工作流:- Skills 层识别这是一个数据分析任务,加载
mysql-employees-analysis技能 - Skills 层根据技能指令,将任务分解为子步骤:查询管理关系、薪资对比、任职时长等
- Skills 层根据技能中的领域知识,解读数据并生成综合分析
这种架构的优势是: - 关注点分离:MCP 专注于"能力",Skills 专注于"智慧"
- 可维护性:业务逻辑(Skills)与基础设施(MCP)解耦
- 复用性:同一个 MCP 服务器可以被多个 Skills 使用
四、技术实现:如何创建和使用 Skills1. SKILL.md 规范详解让我们深入了解SKILL.md文件的标准结构: --- # === 必需字段 === name: skill-name # 技能的唯一标识符,使用 kebab-case 命名
description: > 简洁但精确的描述,说明: 1.这个技能做什么 2.什么时候应该使用它 3.它的核心价值是什么 # 注意:description 是智能体选择技能的唯一依据,必须写清楚!
# === 可选字段 === version: 1.0.0 # 语义化版本号
allowed_tools: [tool1, tool2] # 此技能可以调用的工具列表(白名单)
required_context: [context_item1] # 此技能需要的上下文信息
license: MIT # 许可协议
author: Your Name<email@example.com> # 作者信息
tags: [database, analysis, sql] # 便于分类和搜索的标签 ---
# 技能标题
## 概述 (对技能的详细介绍,包括使用场景、技术背景等)
## 前置条件 (使用此技能需要的环境配置、依赖项等)
## 工作流程 (详细的步骤说明,告诉智能体如何执行任务)
## 最佳实践 (经验总结、注意事项、常见陷阱等)
## 示例 (具体的使用案例,帮助智能体理解)
## 故障排查 (常见问题和解决方案)
2. 编写高质量 Skills 的原则根据 Anthropic 官方文档和社区最佳实践,编写有效的 Skills 需要遵循以下原则: 1. 精准的 Descriptiondescription是智能体决策的关键。它应该:
- 精确定义适用范围:避免模糊的描述如"帮助处理数据"
❌不好的 description: description:处理数据库查询
✅好的 description: description:> 将中文业务问题转换为 SQL 查询并分析 MySQL employees 示例数据库。 适用于员工信息查询、薪资统计、部门分析、职位变动历史等场景。 当用户询问关于员工、薪资、部门的数据时使用此技能。
2. 模块化与单一职责一个 Skill 应该专注于一个明确的领域或任务类型。如果一个 Skill 试图做太多事情,会导致: 建议:与其创建一个"通用数据分析"技能,不如创建多个专门的技能: mysql-employees-analysis:专门分析 employees 数据库sales-data-analysis:专门分析销售数据user-behavior-analysis:专门分析用户行为数据
3. 确定性优先原则对于复杂的、需要精确执行的任务,优先使用脚本而不是依赖 LLM 生成。例如,在数据导出场景中,与其让 LLM 生成 Excel 二进制内容(容易出错),不如编写一个专门的脚本来处理这个任务,SKILL.md 中只需要指导智能体何时调用这个脚本即可。 4. 渐进式披露策略合理利用三层结构,将信息按重要性和使用频率分层: - 附加文档(如
advanced.md):放置高级用法、边缘情况
五、行业动态与生态演进
1. 标准化进程与厂商支持Agent Skills 虽然由 Anthropic 提出,但其设计理念正在影响整个行业。 Anthropic Claude: - Claude Desktop 和 Claude Code 原生支持 Skills
OpenAI 的响应:虽然 OpenAI 尚未官方采用 "Skills" 这个术语,但在 2025 年 3 月的更新中,ChatGPT 引入了类似的概念: - Custom Instructions 增强:支持更复杂的多步骤指令
- Memory 与 Context Profiles:允许用户保存和复用特定领域的知识
- GPTs 的"知识库"功能:可以附加文档和脚本,按需加载
这些功能本质上是 Skills 理念的不同实现形式。 Google Vertex AI: Google 在 Gemini 模型中引入了"Grounding with Functions",允许开发者定义"函数包"(Function Packages),每个包包含: - 使用指南(类似 Skills 的 instructions)
这种设计与 Skills + MCP 的混合架构高度相似。 2. 分层架构的必然性综合各方观点,我们认为:Skills 和 MCP 代表了智能体架构中两个必然分离的层级。随着智能体系统的复杂度增加,这种分层是不可避免的: 应用层(Application Layer) ↓ Agent Skills ↓ 领域知识、工作流、最佳实践
传输层(Transport Layer) ↓ MCP ↓ 标准化接口、工具调用、资源访问
基础设施层(Infrastructure Layer) ↓ 数据库、API、文件系统、外部服务
这与传统软件架构的演进路径完全一致(从单体到分层到微服务),只是在 AI 领域重新演绎了一遍。 3. 标准化的趋势随着行业对智能体技术的重视,我们预见以下趋势: 1. 协议融合 未来可能出现统一的智能体能力描述协议,融合 MCP 的连接性和 Skills 的知识表达: # 未来的统一协议示例(假想) apiVersion:agent.io/v1 kind:Capability metadata: name:enterprise-data-analysis spec: transport: protocol:mcp server:database-mcp-server tools:[query,schema] knowledge: type:skill workflow:data-analysis-workflow.md examples:examples/
2. 市场化与生态系统 类似于 NPM、PyPI,未来可能出现智能体能力的包管理系统: # 假想的未来命令 agent-cli install @anthropic/frontend-design-skill agent-cli install @google/data-analysis-suite agent-cli install @openai/code-review-assistant
开发者可以发布、分享、售卖自己的 Skills 和 MCP 服务器,形成繁荣的生态系统。 3. 自动化能力发现 智能体可能发展出自动发现和学习新能力的机制: # 未来的智能体可能具备自主学习能力 agent = SelfEvolvingAgent()
# 智能体在执行任务时发现缺少某种能力 response = agent.run("生成 3D 建模文件")
# 智能体自动搜索并安装相关 Skill # [内部日志] 检测到未知任务类型:3D建模 # [内部日志] 搜索技能库...发现 "blender-3d-modeling" skill # [内部日志] 请求用户授权安装...已授权 # [内部日志] 技能安装完成,重新执行任务
六、挑战与风险与此同时,我们也需要警惕潜在的风险: 安全性挑战: 上下文污染: - 随着 Skills 数量增加,即使是元数据也可能占用大量上下文
碎片化风险: - 虽然 MCP 正在标准化,但 Skills 格式尚未统一
七、Agent Skills 和 MCP 总结与选型Agent Skills 和 MCP 代表了智能体技术栈中两个关键的抽象层: - MCP(Model Context Protocol):解决"连接性"问题,是智能体与外部世界交互的标准化接口,相当于"神经系统"或"双手"
- Agent Skills:解决"能力"问题,是领域知识和工作流的封装,相当于"大脑皮层"或"操作手册"
两者不是竞争关系,而是互补关系: 图 5 MCP 与 Agent Skills 全面对比总结 关键洞察: 分层架构是必然趋势:随着智能体系统复杂度增加,"连接层"和"知识层"的分离是不可避免的 上下文效率是核心矛盾:Skills 的渐进式披露机制将 token 消耗降低 90% 以上,这是其最大的技术优势 领域知识的民主化:Skills 让非开发者也能贡献智能体能力,这将极大拓展 AI 应用的边界 混合架构是最佳实践:在企业级应用中,MCP 提供基础设施连接,Skills 提供业务逻辑,两者结合才能构建高效、可维护的智能体系统
实践建议: - 对于外部服务连接(数据库、API、云服务),优先使用 MCP
- 对于复杂工作流(多步骤任务、领域专业知识),优先使用 Skills
- 在上下文受限的场景(长对话、大量工具),使用 Skills 进行渐进式管理
- 构建企业级智能体时,采用 MCP + Skills 的分层架构
智能体技术仍在快速演进中。MCP 已成为连接层的事实标准,Skills 的理念也在影响整个行业。掌握这两种技术,将帮助你在 AI 浪潮中构建更强大、更实用的智能体应用。 |