同时,作为能力底座的基础大模型打破了移动互联网时代C端与B端的界限。谭待认为,「大模型的C端和B端背后其实都是同一个东西,就是那个模型本身,因为所有的能力都是内化到其中了。」这意味着,依托基础大模型能力进行的场景AI化实践,未来有可能会被聚合到一个跨越C端与B端的门户中。
目前看来,通用助手更有可能成为这个在基础大模型之上,负责连接一切需求与能力、虚拟与现实的门户,也是一个像移动互联网时代的微信、Google搜索一样的超级入口。如果豆包助手能够成为这个门户,那字节就拥有了在移动互联网时代几番追求而不得的更为底层的入口。
就像公众号《信息平权》在文章中分析的:过去,字节的边界局限于头条和抖音,图文和短视频信息流为主要形态,基于此去拓展商业化,发现即便是帝国也有边界。而AI有潜力成为字节拓展其边界的抓手,可与千行百业、线上线下、软件硬件链接。
也正是在「掌控新一代超级入口」的诱惑下,做搜索引擎的Google与做新能源汽车的理想,都将AI助手视为未来业务的关键点。
Pichai将Gemini应用升级,确定为Google实施全面领先战略的关键支柱之一。Google认为,Gemini不仅是一个聊天机器人,更是一个具有多种功能的AI工具,是未来业务增长的重要引擎。
在李想看来,助手还处在非常初期的阶段,大家如今在做的种种尝试,都是想将AGI的L3阶段的门票拿在手里。所谓的AGI的L3阶段,就是人人可用的to C智能体出现。
谁能在B端整合更多能力,创造出更多Agents,同时在C端连接更多用户,谁就可能在围绕通用助手进行的入口之争中,建立更大的优势。
豆包助手之于字节的重要性,与Gemini之于Google一样,要远高于聊天机器人的价值。
《智能涌现》接触到的知情人士表示,豆包助手目前的用户互动时长、互动轮次都不算高,且在过去一年中增长幅度不明显,有管理层提出,这种基于文本的对话类产品,大概率不是最理想的产品形态。但我们认为,这依然是站在聊天机器人的定位上,对豆包助手作出的评价和判断。
聊天机器人只是豆包助手的一项能力,随着连接的不断丰富,字节大概率会为豆包助手会在聊天之外,注入更加丰富的能力,让其向Agents阶段迈进。
一方面,豆包助手会继续整合视频生成、视频理解等大模型的创新成果,拓展基础能力的边界。这一点在不久前豆包助手电脑版的更新上有比较明确的体现。相比之前的版本,新版的豆包助手电脑版变成了一款具备AI搜索、视频生成、文本创作、图像生成能力的工具集合。