链载Ai

标题: 谷歌大招来了!!Gemini 2.0 原生多模态输入输出 [打印本页]

作者: 链载Ai    时间: 昨天 11:57
标题: 谷歌大招来了!!Gemini 2.0 原生多模态输入输出

谷歌的大招终于来了,发布了 Gemini 2.0 Flash 应该是第一家实现原生多模态输入输出的模型,而且还有新的编码代理,这些代理将通过替代开发人员采取行动来增强工作流程。

ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;letter-spacing: 0.578px;margin-bottom: 8px;font-size: 22px;padding-bottom: 12px;">Gemini 2.0 Flash

ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;color: rgb(31, 35, 41);margin-bottom: 4px;word-break: break-all;min-height: 20px;">Flash 2.0 的速度是 1.5 Pro 的两倍,同时实现了更强的性能,包括新的多模式输出,并附带原生的工具使用。 

    ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;font-size: 15px;line-height: 30px;padding-left: 20px;" class="list-paddingleft-1">
  1. 更好的性能:Gemini 2.0 Flash 比 1.5 Pro 更强大,同时仍然提供开发人员期望的 Flash 速度和效率。它还在关键基准测试中改进了多模式、文本、代码、视频、空间理解和推理性能。改进的空间理解可以在杂乱图像中的小对象上生成更准确的边界框,以及更好的对象识别和描述。

  2. 原生多模态输出:Gemini 2.0 Flash 生成包含文本、音频和图像的集成响应 - 所有这些都通过单个 API 调用实现。这些新的输出模式可供早期测试人员使用,预计明年将更广泛地推出。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5