链载Ai

标题: OpenAI o3 和 o4-mini 多模态推理新模型重磅来袭 [打印本页]

作者: 链载Ai 时间: 昨天 20:40
标题: OpenAI o3 和 o4-mini 多模态推理新模型重磅来袭

就在刚刚，OpenAI 发布了其 o 系列模型的最新成员o3 和 o4-mini，这两款模型被认为是 OpenAI迄今为止最智能的模型。它们经过训练后能够在做出反应前进行更长时间的思考，并且首次具备智能地使用和组合 ChatGPT 的所有工具的能力，包括网页搜索、Python 分析、视觉推理和图像生成。

模型能够自主判断何时以及如何使用这些工具，从而以正确的格式生成详细且周到的答案，更有效地处理复杂问题。这一突破性的推理能力与完全的工具访问权限相结合，使得新模型在学术基准测试和实际应用中都展现出显著的性能提升。

o3 在编码、数学、科学和视觉感知等领域打破了多项基准记录。

它尤其擅长处理需要多方面分析的复杂查询，并在分析视觉信息方面表现出色。专家评估显示，相比 o1，o3 在困难的现实任务中重大错误减少了 20%，尤其在编程、商业咨询和创意构思方面。

o4-mini 作为更小、更高效的模型，o4-mini 在保持卓越性能的同时，实现了快速且经济高效的推理，尤其在数学、编程和视觉任务方面表现突出，并为 AIME 设定了新的 SOTA。专家评估还显示，o4-mini 在非 STEM 任务和数据科学领域超越了其前身 o3-mini。由于其高效率，o4-mini 拥有更高的使用限制，适合高容量、高吞吐量的推理需求。

o3 侧重于强大的综合能力，而 o4-mini 则强调效率和速度，这两个模型与之前的推理模型相比，它们的体验也更加自然和更具对话性，尤其在参考记忆和历史对话时，响应更加个性化和相关。

同时，OpenAI 推出了一个名为 Codex CLI 的全新实验性工具，这是一个可在终端运行的轻量级编码代理，旨在将前沿推理能力带到命令行。

终端中的强大推理：
Codex CLI 旨在充分利用 o3 和 o4-mini 等模型的推理能力，并计划支持更多 API 模型，如 GPT-4.1。
本地多模态推理：
该工具的独特之处在于能够通过传递屏幕截图或低保真草图，在本地命令行环境中实现多模态推理，并能访问本地代码。
极简连接接口：
OpenAI 将其视为一个将模型直接连接到用户及其计算机的极简接口。
完全开源：
Codex CLI 已完全开源，代码可在获取。
百万美元资助计划：
OpenAI 还宣布启动一项 100 万美元的计划，以支持使用 Codex CLI 和 OpenAI 模型进行的项目。资助将以 API 积分的形式发放，每笔最高 2.5 万美元。提案可以通过提供的链接提交。

总之，Codex CLI 是一个创新的开源工具，旨在将 OpenAI 最先进的推理能力直接带到开发者的终端，并支持通过多模态输入进行交互。

欢迎光临链载Ai (https://www.lianzai.com/)