链载Ai

标题: 小语言模型才是Agentic AI的未来？ [打印本页]

作者: 链载Ai 时间: 昨天 14:01
标题: 小语言模型才是Agentic AI的未来？

分享一个Nvidia的呼吁：

先说主基调：能用大模型谁还需要用小模型？就是因为大模型用不起（包括设备，延时等等）。那剩下的问题就是小模型到底能不能抗住用户的需求？

作者认为，小型语言模型（SLMs）在很多场景下比大型语言模型（LLMs）更适合用于构建“代理式人工智能系统”（Agentic AI Systems），因为它们：

Agentic AI 是指能够自主执行任务的 AI 系统，比如智能客服、代码代理、办公自动化助手等。虽然目前主要依赖大型语言模型（如 GPT-4），但作者认为这不是最优方案。

作者定义 SLM 为“能在普通消费级设备上低延迟运行的模型”（通常参数量低于 10B），并提出立场：

小型语言模型在能力、适配性和成本方面，普遍优于 LLM，是 Agentic AI 的未来。

文章最后提出了一个具体的“LLM → SLM 转换算法”，帮助开发者将现有使用 LLM 的代理系统迁移到 SLM，包括数据收集、任务聚类、模型选择、微调等步骤。

作者分析了三个开源代理系统（MetaGPT、Open Operator、Cradle），并估计它们有40%–70% 的任务可用 SLM 替代LLM，有效降低运行成本。

最后在实际工业场景中，需要大模型处理的时候让大模型来，不需要，或者有更多很简单的方式来实现的就直接实现了。端到端固然好，但是落地归落地，paper归paper，一码归一码。

欢迎光临链载Ai (https://www.lianzai.com/)