继 OpenAI 发布会,间隔一天,也迎来了 Google I/O 大会。
我们先来看看之前引发大家剧烈讨论的传闻:
>>> 据传闻 iPhone 原打算接入 Google Gemini 大模型,却给 OpenAI 半路截胡
>>>与 GPT-4o 不同的是,谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为“Pixie”的多模式 Google Assistant 替代品,它可以通过设备的摄像头查看物体,并执行诸如购买地点或提供使用说明等操作。
>>> Android 15 发布,将展示即将推出的 Android 15 移动操作系统的功能、通过 Android Auto 实现的更多车内集成以及智能手表软件 Wear OS等。
这次大会除了暖场的DJ(救命,完全看不懂啊,赛博DJ
),还有哪些精彩细节呢?一起来看看吧
BTW,如果你认真看了全直播,我建议下次来我们机智流看(哭死,看了OpenAI,完全看不下来这个)
Gemini pro 介绍
布局与局势
Gemini的系列应用
01
—
Geminipro 介绍
(纯纯炒冷饭,超长上下文+多模态,纯回顾,直接上图吧)
两百万 tokens 上下文
02
—
布局与局势
在硬件方面,第五代 TPU 是Google训练 Gemini 的基础,包括 Anthropic等在内的知名公司也在用Google的 TPU 来训练模型。
这次 I/O 大会上Google推出了第六代 TPU——Trillium,将在今年晚些时候开放云服务。
除了此前发布的 AlphaFold3,DeepMind 团队还在本次大会面向图像、音频、视频发布了三款模型/工具:Imagen3 [1]、Music AIsandbox[2] 和Veo[3]
Google搜索从最早的仅支持文本搜索,到后来的语音输入和图像搜索,已经产生了很大的变化。这次在I/O大会又推出了声称“search anything”的“AI+搜索”(有那么点大象转身的感觉不容易啊)
?你的 Google何必只是 search,还可以是 research、planning、reasoning......
不知道你是否有过遇到问题却不知道该如何描述问题的经历
Google的“ask the video”功能似乎希望将问答形式突破文字的桎梏,用有时包含了一切信息的图片、视频变成人机交互的新媒介。
好了好了,今晚的Goole I/O就先到这吧,不干不新,有点小失望,还是回味一下OpenAI吧。
[1]Imagen3:https://deepmind.google/technologies/imagen-3/
[2]MusicAISandbox:https://www.youtube.com/watch?v=-dPqc7l2zu8
[3]Veo:https://deepmind.google/technologies/veo/
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |