做模型研发的 Seed 目前由朱文佳和今年 2 月正式加入字节的吴永辉共同负责,该板块负责 “探索智能上限”,尤其是吴永辉带队的大模型研发环节。
吴永辉是继 2022 年加入的 CFO 高准之后,最新一位直接空降到 CEO-1 级别的高管。相比 2015 年加入,历任 TikTok 产品技术负责人,也主管字节 AI 搜索的朱文佳,吴永辉的研发经历更聚焦 AI。
他在 2008 年获加州大学河滨分校博士学位后就进入 Google,17 年间主导了神经机器翻译(GNMT)、RankBrainn 等项目,论文引用次数超 4 万次。2023 年,吴永辉成为 “Google Fellow”,这是 Google 授予技术领域作出突出贡献专家的最高荣誉。
吴永辉之下,Seed 的模型研发主要有 4 个方向,分别是:大语言模型,视觉模型,语音模型,多模态 & 世界模型。字节 AI Lab 负责人李航也从向朱文佳汇报转为向吴永辉汇报。
据《AI 科技评论》,吴永辉近期调整了 Seed 架构,新设立不在正式组织结构中的若干虚拟小组,更扁平的汇报体系正在形成,一些原本汇报关系为吴永辉 -2 的人,目前也直接向吴永辉汇报。如据我们了解,字节 AI for Science 负责人、此前汇报给李航的顾全全现在也虚线汇报给吴永辉。
一位接触多位字节技术人员的投资人的观察是,在核心研发环节,字节正在用吴永辉这样的 “AI-native(AI 原生)” 技术人才替换之前从搜推广部门调来的人员。
今年 1 月启动的 Seed Edge 目前的主要技术负责人,也是 2024 年加入的字节新人。这个研究计划是 Seed 之中更关注智能上限前沿探索的部分,瞄准那些短期看不到明显收益,但有可能引领长期 AI 发展的研究,如下一代模型设计、下一代学习范式、下一个 Scaling 方向等。
在吴永辉加入后,朱文佳的重心调整为研发与体验更相关的模型应用能力,如问答、创作、解题、代码和 AI 使用工具的能力等。
这些能力是不同 AI 应用需要的共通模块。相当于一层连接模型和应用的 “能力中台”。字节过去也这么做过:2013 年,字节成立第二年就开始分设算法、工程等中台,封装通用技术和功能供一线产品团队取用。这是后来字节能在短视频等机会节点,快速搭建多个产品的基础。
做 AI 产品的 Flow 和做产品后端研发支持的 Stone 则主要与 3 大目标中的另外两个相关:探索新的 UI 交互方式,和加强规模效应。
新交互方式包括新硬件终端和推进与手机厂商的合作。比如去年 10 月,字节以收购的 Oladance 团队为基础,推出了智能耳机 Ola Friend,字节也正在研发 AI 眼镜。
加强规模效应的重点则是字节 AI 主力产品豆包。豆包最早由 Flow 总负责人朱骏于 2023 年 3 月带队开发,当时代号为 Grace。作为字节立项最早的新 AI 产品,豆包相关进展一直是朱骏 OKR 里的第一条。
豆包之外,字节的 AI 探索几乎涵盖当前 AI 产品的各个方向:有智能角色互动产品猫箱、图片生成产品星绘、AI 数学教育出海产品 Gauthmath、面向小初高学生的 AI 教育产品豆包爱学(此前叫河马爱学)。
与开发者直接相关的产品,如 Agent 平台 Coze 和今年 1 月刚上线的字节 AI coding 产品 Trae,则归属到了去年下半年从 Flow 中独立的产品研发团队 Stone 之下。Stone 负责人是字节工程技术负责人洪定坤。
基于文生图/视频的内容分享平台即梦是字节另一个重要的 AI 产品出口,它不属于 Flow,而由负责剪映的张楠主管。据了解,相比剪映,张楠其实花了更多精力在即梦上。
在这些 AI 新应用上,字节延续了过去的习惯:启用有丰富经验的连续创业者和在字节打过胜仗的产品负责人,汇集了字节的多位 “功臣”。
如 Flow 总负责人朱骏曾是短视频产品 Musical.ly 的创始人之一,后任 TikTok 产品负责人。即梦负责人张楠曾是图片社区产品图吧的创始人,2016 年,曾从 0 到 1 推出抖音、火山等产品,后担任抖音 CEO。负责豆包桌面版的齐俊元曾创立任务管理工具 Teambition。负责 AI 耳机和眼镜和手机厂商合作的 Kayden 为人熟知的身份是 36 氪创始人,其实他也有平板等硬件创业经验。朱骏的 -2 中也不乏有创业经历的人。
在豆包这个主力产品上,字节寄托了更多战略目标:加强 AI 产品的规模效应和打造大规模用户反馈到模型实际使用体验提升的优化闭环。
目前豆包已从最初的聊天机器人发展为结合了聊天对话、搜索、图片生成和 AI 浏览器的综合应用。字节对豆包的规模目标很激进:在去年第三季度,豆包的 DAU 的增长目标是 30%,四季度这个数字变成了 150%;我们了解到,今年豆包的 DAU 目标是超过 5000 万。
而在其它产品探索方向上,字节呈现了模型的归模型,产品的归产品的状态。多个字节 AI 产品并不排斥使用其他公司开发的模型,以追求更好的体验和增长。
即梦、Coze、Trae、剪映都已接入 DeepSeek。Coze 在 2024 年初上线后不久,就在海外版中给开发者提供 GPT-4 模型。Trae 也在近期使用了目前编程能力最强的 Claude 3.7 模型,原版模型要付费,而 Trae 则免费给大家用 Calude 3.7,这是一个强力拉新手段,一度导致大量用户排队。
配合强大的人才阵容,字节全集团也给 AI 板块调集了创业公司难以企及的资源。它可以让抖音为我所用:从去年 4 月开始,其它 AI 产品一度不被允许在抖音等字节体系里投放广告,后又开放了投放。
它有丰富的算力储备。2023 年时,字节的储备的 GPU 已超过 10 万张;仅在 2023 年上半年,字节就向英伟达订购超过 10 亿美元的 GPU。外媒报道,2025 年字节的 AI 算力采购预算至少有 900 亿元人民币。
我们也了解到,字节现在会优先将高端 GPU 供大模型团队使用,而在相对稳定但对业务很重要的推荐系统中,则更多使用一些国产 AI 芯片或 GPU。
字节内部也出现了一些因为团队、资源和方向太多而带来的摩擦和流程迟滞。
“这里有能力的人太多了,每个人都有自己的想法,想法光是达成共识就要一段时间,产品进化就会慢。” 一位字节 AI 产品的人士说。
一位字节模型侧人士说,因为要对接不同产品团队,所以经常同一段话,一天内要给几个不同团队各说一遍。
最近高层和汇报线的调整也让一些员工感到不安,难以静心。更容易做的成果已探索得差不多了,再想要进展,就需要更大投入。这导致,在总资源很多的情况下,一些研发人员的体感是卡不够用,部分团队需要排队等,“各凭本事”。
不管是外部竞争的快速变化,还是大公司做新业务时难以避免的组织张力,都不太会影响字节对 AI 的态度。字节做 AI 的方法和字节做其他新业务也没有太大区别:依然是从人才到基建的饱和式投入,穷尽所有业务方向,不放过任何可能性。
一些人怀疑这件事的持续性。在 AR、教育和游戏上,字节也曾密集投入,铩羽而归。但不用怀疑的是,AI 的带来的变革绝非 AR 或游戏可以相比,长期看,它创造的价值将超越移动互联网。
当一个用过去 13 年,成长为中国最大互联网公司的组织又遇到一局上限足够高的新游戏,他们不可能放过这个机会。