做过大厂研发,搞过出海硬件,现在每天都在琢磨 AI 到底能怎么落地。
前段时间,OpenAI CEO ,Sam Altman接受采访时做了一个很有意思的比喻。他说,现在的智能手机就像是时代广场,到处是霓虹灯和噪音,在拼命抢夺你的注意力。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">那个设计了 iPhone 的男人——Jony Ive(乔纳森·艾维),则承认创新总会带来意外的后果,例如过度的使用,所有人在路上都低头看手机。这也是他后来离开苹果、创立 LoveFrom 并探索非屏幕交互的核心动力。他希望新的设计能减少这种社会性的隔绝。艾维和 奥特曼 正在秘密研发的新硬件,OpenAI首款硬件产品代号“Sweetpea”(甜豌豆),最近曝光了,已进入研发冲刺阶段,预计2026年面世,目的是打造一间“湖畔小屋”。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">我看了一下曝光出来的介绍,发现这不是普通的蓝牙耳机。据爆料,它拥有两颗“胶囊式”机身,搭载手机级2nm芯片,甚至可能配备摄像头。这是一台mini电脑啊!OpenAI给富士康下了死命令:2028年量产,预留每年4000-5000万台的产能。它的核心逻辑只有一条:让 AI 像空气一样存在,而不是把你困在屏幕里。
这个概念让我思考了很久:未来的 AI 硬件, 会让我们用怎样的方式跟AI交互?
01 屏幕是上一代的枷锁
作为研发出身,我深知硬件的每一次迭代,本质上都是在给人类减负。
键盘鼠标让我们摆脱了打孔纸带,触控屏让我们摆脱了键盘。而现在,当 AI 的理解能力已经足够强的时候,屏幕反而成了一种低效的累赘。
试想一个场景:你在拥挤的地铁上,突然接到老板的电话会议需求。
在屏幕时代,你需要手忙脚乱地掏出手机、找会议软件、打字记录、还要时刻担心信号断连。你的眼睛、双手、耳朵全被占用了。
但在 Jony Ive 构想的无屏时代,你只需要动动嘴,或者仅仅是戴着设备听,AI 就能帮你处理完一切。
OpenAI 许诺的是2028年量产。但很多人没注意到的是,在用声音重构交互这条路上,国内其实有一家公司,已经默默走了四年。
02 把 AI 装进耳朵里,而不是装进手机里
在硅谷还在画饼的时候,我看了一圈国内的 AI 硬件赛道。虽然大家都盯着 AI 眼镜,但我个人认为,现阶段最成熟的 AI 器官,其实是耳朵。
为什么?因为这是唯一一个我们本来就习惯全天佩戴,且完全不侵占社交距离的设备。
AI耳机选哪个呢?我看了一些博主总结的最受欢迎AI耳机榜单,最后选择了排名第一的讯飞AI会议耳机,我想深度体验下这种围绕办公会议场景设计的AI 会议耳机到底怎么样。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">说实话,刚拿到手时,我以为它只是个加了语音助手的蓝牙耳机。但真正跟美国同事开了一场会之后,我理解了它想做的事情——挂在耳边的会议助手。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">它的实时翻译很强大,包括同传听译、面对面翻译、通话翻译、离线翻译、嘴替翻译多种模式。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">支持32种语言、12种方言、10种行业术语和2种民族语言的转译与转写。这其中还有两个瞬间,让我觉得非常丝滑:
第一个瞬间是甚至不需要摘下。
它的 Air2 采用了开放式设计。轻量级、贴合耳朵,材料亲肤透气,这意味着你可以把它当成眼镜一样,挂一整天。
这符合了“湖畔小屋”的定义:设备不该刷存在感,它应该隐形。
第二个瞬间是“信息流的掌控感”。
我是做技术的,会议里充斥着中英文夹杂的术语。以前我必须全神贯注记录,生怕漏掉什么。
但讯飞AI会议耳机配合 viaim AI,把录音、转写、区分说话人全部自动化了。
我在会议中途摸鱼,走了个神,看了一眼窗外的风景。回过神来,看一眼手机生成的实时摘要,立刻就能接上话。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">甚至在不方便说话的场合,它的AI 嘴替功能,能让我打字,然后用我的音色在会议里发言。那一刻我意识到,这才是 AI 该有的样子:它不是来替代你的,它是来还给你自由的。
2021年底,马啸带着20多人的团队创立了未来智能。仅用了几年时间,就定义了一个AI会议耳机的新品类,还把这条路走通了。据报道,未来智能的讯飞AI会议耳机,出货量已达百万级。03 通用 vs 垂直:中国企业的务实智慧
OpenAI 的Sweetpea野心很大,它想做通用的 AI 计算机,想接管你的全部生活。这很宏大,也很漫长。
而未来智能这家公司,极其聪明地切了一个窄而深的口子——办公会议。
CEO马啸说:耳机是大模型天然能够落地的场景,是大模型的“耳朵”。
在职场这个高压场域里,用户不需要一个会写诗的 AI,需要的是一个能精准记录每一个 Action Item、能听懂行业黑话、能帮他节省1小时整理纪要时间的工具。
这不仅需要硬件与软件的紧密协同,更需要对办公场景的深刻理解与长期数据积累——从会议流程、发言习惯、行业术语,到不同角色(如项目经理、销售、研发)的关注焦点,都需要被系统性地学习和建模。
举个例子,一场会议中,讯飞AI会议耳机不仅能多语种实时转写,更能借助场景化AI能力,自动区分讨论、决策与待办事项,生成结构清晰的会议脑图、职业定制化的摘要,并同步导出待办。
会后,用户还可通过viaim AI随时追问:“关于第三点方案,当时有哪些反对意见?”“本次会议推迟了哪个项目的 deadline?”——这些深度交互与总结,并非简单语音转写所能实现。
这种对场景的极致打磨,不是靠砸钱买算力能解决的,而是靠这几年在数万场会议数据中滚出来的。正是在垂直场景中不断积累的“理解力”,构成了未来智能难以被通用型AI快速复制的护城河。
04 写在最后
我不知道 OpenAI 的新硬件能不能成为下一个 iPhone。
但在它真正面世之前的这几年空窗期里,中国玩家不会坐以待毙。
在这个 AI 重构硬件的浪潮中,有两种流派:
一种是像 OpenAI 那样,仰望星空,试图重新定义计算平台;
一种是像未来智能这样,脚踏实地,先把最痛的那个场景(开会)给彻底解决了。
作为用户,我们不需要站队。
但如果现在的你,正被无休止的会议和屏幕信息轰炸得喘不过气,或许不需要等到2028年。
那个能让你获得片刻“湖畔小屋”宁静的设备,现在其实已经触手可及了。