|
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ChatGPT发布以来,通用性人工智能的飞速发展,正在逐渐改变我们的生活。而在这一波AI浪潮中,Google好像一直都是略微被忽略的那一个。虽然作为当前大模型基础架构之一的Transformer架构最早是在Google诞生的,但是Google的AI却始终缺乏一个爆发点,不温不火的。前不久更是传出苹果试图在Safari中接入AI搜索时,Google的股价出现了相当幅度的下跌。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">而前几天的 Google I / O 2025 大会,似乎宣布了Google的王者归来。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Google 在 Google I / O 2025 大会中,发布了上面图片中的服务。提供对谷歌人工智能应用和服务的"最高级别访问",订阅费用为每月249.99美元。在这次发布会中,谷歌宣布全面AI化。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这篇文章会梳理一下,我认为比较有意思的一些更新。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">Gemini LiveingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">用户 可以与 Gemini 进行近乎实时的语音对话,同时将智能手机的摄像头或屏幕画面流式传输到人工智能模型。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">直接来看一个视频:ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">未来几周,Gemini Live还将更深入地与其他应用集成:很快就能提供谷歌地图的导航指引、在谷歌日历中创建事件,并通过谷歌任务生成待办事项列表。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">Deep ResearchingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">谷歌还表示,将更新Deep Research(Gemini生成详细研究报告的人工智能代理),允许用户上传自己的私人PDF和图像。同时,允许 Gemini 在用户授权下,从邮件和云端硬盘中提取相关数据,进行多文档比对与智能回答。这次更新,将大大提高谷歌在办公场景(邮件、Google Doc)下的AI化能力,全面提升办公效率。 Veo 3视频生成人工智能模型谷歌推出的Veo 3可以生成音效、背景噪音甚至对话来配合其创建的视频。谷歌表示,Veo 3在生成视频的质量方面比其前身Veo 2有所提升。从本次大会开始,订阅谷歌每月249.99美元AI Ultra计划的用户可在Gemini聊天机器人应用中使用Veo 3,用户可以通过文本或图像进行提示。 我从互联网上找了一个其他用户生成的视频: Imagen 4人工智能图像生成器谷歌表示,Imagen 4的速度比Imagen 3更快,而且很快会变得更快。在不久的将来,谷歌计划发布一个比Imagen 3快10倍的Imagen 4变体。 据谷歌介绍,Imagen 4能够渲染织物、水滴和动物皮毛等"精细细节",可以处理写实和抽象风格,生成各种纵横比、最高2K分辨率的图像。 Flow人工智能电影制作应用谷歌推出了一款全新的AI电影创作应用程序Flow。该工具结合了Veo、Imagen和Gemini技术,能够根据文字提示或图像生成时长约八秒的AI视频片段。Flow同时配备了场景构建工具,用户可以将多个片段拼接组合,创作出更长、更具连贯性的AI影片,从而大幅提升创作效率与表达自由度。 Project MarinerProject Mariner是谷歌的实验性AI Agent,可浏览和使用网站。谷歌表示,已大幅更新其工作方式,允许代理一次处理近十二项任务,目前正在向用户推出。 例如,Project Mariner用户无需访问第三方网站,即可购买棒球比赛门票或在线购买杂货,只需与谷歌的人工智能代理聊天,它就会访问网站并代用户执行操作。 Google 虚拟试衣工具用户可以上传一张自己的照片,AI会生成你穿上衣服后的效果图。 Chrome中的AIChrome浏览器,也全面转向AI化。Chrome推出了Gemini,帮助用户快速理解网页内容并完成任务。 我在一次开发中,还偶然发现Chrome的Devtool中,也可以直接ask AI了。不过当前功能不对中国地区的账号开放(sad)。根据官方介绍,选中后,AI会自动帮助你解读分析网络请求,解决问题。 Google Search 的 AI mode当AI搜索正在逐步抢占传统的搜索时,Google 自己也推出了 AI Search 其他此外,在本次发布会中,Google 还发布了一些硬件设备,包括 Google Beam(原Project Starline),Project Astra与XR眼镜等,还有一些其他的更新,比如 Gmail智能回复升级、Google Meet实时翻译、NotebookLM 更新,等等。 凭借Google强大的生态,再加上AI的全面赋能,Google 这一次能否上演王者归来呢?让我们拭目以待。 |