这只是大模型能力应用在我们日常生活中的一个小小例子。前面谭待提到的火山引擎云上的各种大模型,它们不只是跑服务器上的一堆代码,而是需要找到最适合的应用形态,以足够自然的交互形式,才能让更多用户用起来,而且愿意用。
过去一年,字节也在大模型的产品形态上做了比较多的学习和摸索。和AI时代之前做产品设计比较,我的个人感受是既有共性又有很大的差异。共性是用户的核心需求还是那些,比如:用最高效、最方便的方式获取信息的需求,给工作提效的需求,自我表达和创作的需求,让自己变好看点的需求,社交娱乐和教育学习的需求等等,都没有变。差异点是,以前是在成熟的技术上想应用,只要用同理心去理解用户的需求和使用体验,就能做出一个还不错的产品。现在有了新的难度,因为产品底下的技术不再是一个稳定的地基了。大模型的能力目前很多维度上让人惊叹,但也在很多维度上有缺陷,同时又在快速演进,每隔三个月、半年都会发生很大的变化。而且它的能力改进往往不是线性的,隔一段时间可能就会出现一个跃迁。
所以做大模型应用一个很大的挑战是,在这个动态发展的过程中,不仅要判断大模型现在能解决好什么任务,同时可能更重要的是要尝试预测半年、一年后大概能把什么样的任务解决好。一个任务如果解决到20分、50分可能都是一个不太可用的状态,但是它一旦达到60分,可能使用率就突然能上来了。以搜索任务为例,去年上半年大模型回答问题时10道题可能错6道,那就是实际不可用的状态。但随着模型能力提升,幻觉大幅降低,再配合搜索引擎做知识增强,现在就达到了可用的状态。当然后面提升的空间还非常非常大,比如解决各种垂直搜索、更复杂问题的回答,甚至是用户今天在搜索引擎里都回答不了的问题。
所以做大模型产品的挑战和乐趣是,需要在这种持续动态的技术发展中,不断去判断下一个产品的PMF (产品市场匹配点)可能是什么。
去年我们一个重点投入的方向是豆包App,我想分享一下对豆包这个产品的一些思考,希望对于计划在字节大模型上做应用开发的开发者,也能起到一点点参考作用。
首先,为什么名字叫豆包?很多人都问我:豆包这个名字好像跟AI没有什么关系,难道不应该用一个更有科技含量、更凸显智能的名字吗?
豆包的名字背后也有一个小故事。我们去年6月在给产品起名时,首先确定下来产品起名的通用原则是,简单、好读、好记。
与此同时我们也为豆包这类产品定义了三个产品设计原则。第一条就是“拟人化”。