非技术文章,技术小白可放心食用
最近有个在技术圈很火的Agent设计标准:Agent skills,这是Anthropic在上个月开源的Agent标准,它的设计目的是把专家经验、流程、工具调用、示例等“教给”大模型,而不是每次拼prompt。 这个看似只是一个技术框架,但把时间线拉长到最近2年多看(function call、MCP..),发现一个极其重要的信号:Agent的设计范式正在变得统一。 Agent skill解决了2个极度影响Agent商用的问题: 1、Token浪费问题(导致Agent成本爆炸); 2、注意力跑偏问题(影响Agent的指令遵循率); 这两个问题的解决(或大幅缓解),让Agent商用价值显著提升:Agent skills采用“渐进式披露”机制,只在启动时扫描一遍技能的元数据(每个skill的名称,技能描述,通常几百个token),具体调用skill时才加载完整指令和资源。这避免了上下文膨胀问题,大幅减少输入token成本。 在20轮的对话中,预估Agent Skill模式能将输入Token的消耗降低60% - 80%
第二,“智商”更稳定 大模型有个常见的缺陷叫“中间迷失现象”:当上下文超过15k tokens时,模型对处于文档中间位置指令的遵循率会从95%降低至65%左右。 Agent Skill通过将上下文始终控制在4k - 8k的区间范围,能维持指令的遵循率不会大幅下降,维持注意力的稳定性。 第三,SOP即资产 Agent Skill范式下,资产被重新定义,就像有很多搭建各种智能体售卖一样,SKILL可以被当成资产来售卖(相当售卖自己的工作经验)
我认为现在是Agent规范从混沌到统一的末期阶段,对创业者来说是机会窗口。就像App store才出来那会,早期ios APP开发者红利吃到饱。 未来几年,谁能最快把手头的业务SOP转化成高质量的Skill,谁就能在Agent爆发的前夜,拿到第一张船票。 |