链载Ai

标题: 小语言模型才是Agentic AI的未来? [打印本页]

作者: 链载Ai    时间: 昨天 14:01
标题: 小语言模型才是Agentic AI的未来?
分享一个Nvidia的呼吁:
先说主基调:能用大模型谁还需要用小模型?就是因为大模型用不起(包括设备,延时等等)。那剩下的问题就是小模型到底能不能抗住用户的需求?

作者认为,小型语言模型(SLMs)在很多场景下比大型语言模型(LLMs)更适合用于构建“代理式人工智能系统”(Agentic AI Systems),因为它们:

  1. 能力足够:在许多实际任务中,小模型已经足以胜任,甚至能匹配更大模型的效果。

  2. 操作更高效:运行成本低、响应更快、更适合模块化系统。

  3. 更经济可持续:部署成本、能耗更低,更适合大规模应用和边缘设备部署。

1.背景介绍

Agentic AI 是指能够自主执行任务的 AI 系统,比如智能客服、代码代理、办公自动化助手等。虽然目前主要依赖大型语言模型(如 GPT-4),但作者认为这不是最优方案。

2.提出立场

作者定义 SLM 为“能在普通消费级设备上低延迟运行的模型”(通常参数量低于 10B),并提出立场:

小型语言模型在能力、适配性和成本方面,普遍优于 LLM,是 Agentic AI 的未来。

3.论据支持

4.反对观点及回应

5.现实障碍

6.转换建议

文章最后提出了一个具体的“LLM → SLM 转换算法”,帮助开发者将现有使用 LLM 的代理系统迁移到 SLM,包括数据收集、任务聚类、模型选择、微调等步骤。

7.案例研究

作者分析了三个开源代理系统(MetaGPT、Open Operator、Cradle),并估计它们有40%–70% 的任务可用 SLM 替代LLM,有效降低运行成本。

最后在实际工业场景中,需要大模型处理的时候让大模型来,不需要,或者有更多很简单的方式来实现的就直接实现了。端到端固然好,但是落地归落地,paper归paper,一码归一码。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5