4 月 18 日周五晚,字节的 Agent 产品 “扣子空间(space.coze.cn) ” 开启内测。团队为此准备不少算力资源,但短短几小时内,服务器就被涌入的用户挤爆。
超出预期的用户热情,让扣子团队再次验证一个判断:用户一直在等待能用的 AI 产品,去解决工作中的问题。
ChatGPT 让聊天窗成为大模型应用首选的交互界面。理由是当 AI 足够聪明,似乎就不需要用户学习,不用熟悉按钮和菜单、只用自然语言下命令就够了。
字节在 2023 年下半年搭起 AI 应用开发平台 “扣子(Coze)”,让开发者不需要熟悉复杂的技术能力,就能将自己的数据接入最前沿的大模型,做各式各样的应用。到 2024 年中,扣子团队发现,尽管聊天机器人应用成千上万地出现,从知识问答到情感陪伴,覆盖几乎所有热门的场景,但大多面临相同的问题:用户增长难,留存更难。
这是一个产品形态与用户真实需求形成偏差的案例。聊天界面简单易用,但对大模型要求极高,导致不论中美都是一两个通用 AI 聊天应用断层式领先。扣子团队发现,平台上有一类应用的增长和留存明显更好——嵌入到用户工作流的大模型应用,针对具体工作场景解决具体问题。
这成为他们去年下半年的工作重点。用大模型改造工作流,在工作场景中完成繁琐的任务,正是当下行业热议的 Agent 初始形态。
随着 o1、Claude 3.5 等模型发布,Cursor、Devin 等编程 Agent 工具验证用户对解决复杂任务的 AI 产品有强烈需求。Google、OpenAI 推出 Deep Research 产品,创业公司的 Agent 产品 Manus、Genspark 接连发布,围绕 “复杂任务 Agent” 的竞争日益激烈。
扣子团队春节后就在考虑开发类似产品,也就是上周五开启内测的扣子空间。延续过去积累的经验,他们重点关注 Agent 解决工作场景复杂问题的能力,产品定位 “与 Agent 一起,开始你的工作”。
这款产品由字节自研的豆包等国产大模型驱动,提供通用 Agent 入口,支持 MCP(Model Context Protocol)协议,引入多款可以调用的工具,包括飞书云文档、飞书表格等,强化解决工作任务的能力。此外,扣子空间引入专家 Agent 体系。
我们第一时间获得扣子空间的内测码,测试了数十个任务,并从扣子团队内部获悉了他们开发扣子空间的开发理念和迭代方向。
扣子团队将这次发布的产品视作 “打样” 版本,展示 Agent 如何在工作中解决问题。他们的长期目标是打造一个开放的 Agent 系统:用户提出需求时,系统能自动调度最合适的一位或多位专家 Agent 协同完成任务。
现在内测的扣子空间 Beta 版,已经可以为用户解决工作中的问题,但它还是一个初级形态。