「Z计划」 是智谱 AI 面向未上市初创企业与优秀独立开发者/团队,提供 Tokens 赞助、投资支持和技术支持等资源的创新加速计划。面向全球,持续招募中!(点击报名)「Z沙龙」是支持该计划的面向大模型领域的线下活动品牌。为鼓励自由发言,人人发言,我们暂时不披露参与者个人信息。本文不代表智谱公司认同文中任何观点。
目录 建议结合要点进行针对性阅读。?
0、AI native产品一览
一、大模型与现有终端融合形态探讨,AI 手机、AIPC、AI XR、AI 可穿戴设备、AloT、AI 座舱,有什么有意思的形态?
1、前创业者分享:2C 端硬件的阻碍与难点,可穿戴及贴近需求的硬件:
2、某手机厂商分析师:AI 生态的理想状态,未来趋势及现有终端设备的作用:
3、另一位手机厂商专家:手机行业的内卷和对于 VR 的探索
4、某大厂 VR 眼镜从业者分享及相关讨论:从几个维度解释为什么 XR 眼镜相对手机来说,更适合 AI 的形态
5、投资人+大厂人:端侧的大模型学习人的手机操作等方向畅想
6、大厂自动驾驶从业者:自动驾驶的类比
7、智能驾驶、整车硬件、座舱从业者与投资人分享:智能座舱讨论
二、芯片、成本以及数据隐私安全角度,端侧小模型有什么要求?
1、某实验室研究人员:科研领域的尝试
2、某创业者:芯片成本和数据隐私安全的角度分享
3、某创业者:未来 AI 模型与硬件的三种部署方式畅想:
4、大厂人+连续创业者:硬件成本问题讨论
5、连续创业者:时延问题讨论
三、如何解决端侧硬件能耗、存储、算力在 AI 硬件使用场景需求下的平衡?
1、主题分享与讨论:关于 AI native 创业观察
2、讨论:端侧硬件能耗、存储算力,在 AI 硬件上的一些基础上的一些平衡
3、AR 使用体验分享
4、科研人员分享
四、AI native 硬件头脑风暴,对现有产品吐槽,AI native 硬件杀手级场景会在什么地方?
1、讨论:VR 究竟能成吗、什么时候能成?
2、讨论:定制化 AR 芯片 or 等技术成熟后组合创新
3、AI 硬件杀手型场景
4、OpenAI 会下场做硬件吗?
5、AI native 创业是更容易了还是更难了?
在开始之前,我们先来看看今年很火的几款AI native 硬件:
1、Rewind Pendant :Rewind Pendant 是一款可穿戴设备,可以捕捉您在现实世界中所说和听到的内容,然后将其转录、加密并完全存储在您的手机本地。
Rewind Pendant可以为你进行:录音转录、数据加密和本地存储。所有这些功能都在你的手机上完成,保障了绝对的安全性和隐私保护。
我们高度重视隐私问题,为此提供了一系列功能,确保不会未经他人同意记录他们的声音。https://www.rewind.ai/pendant
2、Rabbit R1:Rabbit R1 是一款新型人工智能驱动的移动设备,通过高级语音命令简化了应用程序的使用。
售价 199 美元,配备 360 度摄像头、触摸屏和 4G 连接。据其公司介绍,Rabbit OS 是首个建立在 Large Action Model(LAM 大动作模型)上的操作系统。
在 AI 功能层面,LAM 与 LLM 的区别在于,可以处理自然语言并转化为可执行任务。LAM 能与常见应用(如 Apple Music、Uber、eBay 和 Amazon 等)交互;
支持语音命令,代表用户执行复杂任务,如制定旅行行程、订票、购物、发送信息、控制音乐、回答查询等。
这个基础模型据称可以通过学习用户在使用特定应用程序时的意图和行为,来推断和建模人类在计算机界面上的操作,然后模仿和执行它们。
在不久的将来,用户可以教会自己的「rabbit」执行特定任务,比如使用图片编辑软件从照片中去除水印。https://www.rabbit.tech/
3、AI Pin:Humane 是一家由前苹果高管成立的硬件初创公司,他们做的可穿戴设备 AI Pin 于去年 11 月公开亮相。
4、TAB AI:Tab 是一个挂在您脖子上的小冰盘,可以聆听您(以及您周围的人)所说的一切。
5、OpenAI 和 Lovefrom 在软银 10 亿美元融资开发的备受期待的“人工智能 iPhone” 。好,看完现在有的产品,接下来是Z 沙龙 7th 的正文:
#1.
有什么有意思的形态?
编者按:AI 硬件是一个复杂的系统性工程,从最早的设计 PCB 线路板等电子设计流程,到编译后的 ic 烧录,再到通讯及互联设计;
因为现有的玩家自己就会去做这些 AI 的东西,作为一个创业公司来讲,不仅要打 AI 这张牌,基本功能也要做好,这并不容易,然后还要去打市场,这是非常非常难的。
b. 手机厂商在 XR 领域的潜力:
编者按:腾讯最近开源了个新的 Agent 项目:AppAgent,它是基于大语言模型构建的多模态 Agent,专门用来模拟人类用户操作智能手机中的各种应用程序。
编者注:PLAUD 致力于成为全球 AI 音频硬件领域的领航者。其旗舰产品 PLAUD NOTE 创新性地融合了双拾音技术,装备了三重麦克风系统:
编者按:2 月 1 日,面壁智能发布了旗舰端侧模型 MiniCPM,它以小博大的性能超越了 Mistral-7B,并在 MT-Bench 等榜单上表现出色。
编者按:
芯片、成本以及数据隐私安全角度,
端侧小模型有什么要求?
编者按:Rockchip 简称 RK,是一家总部位于福州的 SOC 设计公司。RK 基于 Arm cortex-A 内核设计的一系列 SOC ,在国内外的产业界和极客中很受欢迎。
编者注:DOF 是自由度 degree of free 的缩写是 VR 定位系统中的一部分,指的是物体在三维空间中的方式。目前 VR 中的 DOF 分为 3DOF 和 6DOF 两种。
3DOF 即 3 自由度,只有旋转坐标没有位移坐标,只能以设定好的虚拟头部为中心点,观察的基点源于头部视角,就像固定在电线杆上的摄像头可以任意旋转,但无法上下左右前后离开电线杆。
6DOF 即 6 自由度,在 3DOF 基础上再增加“上下、前后、左右”等 3 个位置相关的自由度。
头部从 3DOF 只能检测到头部转动姿态到 6DOF 伸头缩头等姿态,还可以检测身体移动上下前后左右位移的变化。所以 6DOF 更加符合人体体验,更具沉浸感。
#3.
背景补充-导盲机器人 Glide
Anki 成立于 2010 年的人工智能机器人公司,由三位卡内基梅隆大学的机器人专家创立。该公司致力于开发能够与人互动、学习和成长的智能机器人产品。
背景补充-Nomi
背景补充-Disney Robot
背景补充-Dyna Bert
#4.
当前可见的AI硬件产品吐槽,
背景补充 - VST 技术
—end—
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |