链载Ai

标题: OpenAI o3 和 o4-mini 多模态推理新模型重磅来袭 [打印本页]

作者: 链载Ai    时间: 昨天 20:40
标题: OpenAI o3 和 o4-mini 多模态推理新模型重磅来袭
就在刚刚,OpenAI 发布了其 o 系列模型的最新成员o3 和 o4-mini,这两款模型被认为是 OpenAI迄今为止最智能的模型。它们经过训练后能够在做出反应前进行更长时间的思考,并且首次具备智能地使用和组合 ChatGPT 的所有工具的能力,包括网页搜索、Python 分析、视觉推理和图像生成。
模型能够自主判断何时以及如何使用这些工具,从而以正确的格式生成详细且周到的答案,更有效地处理复杂问题。这一突破性的推理能力与完全的工具访问权限相结合,使得新模型在学术基准测试和实际应用中都展现出显著的性能提升。
o3 在编码、数学、科学和视觉感知等领域打破了多项基准记录
它尤其擅长处理需要多方面分析的复杂查询,并在分析视觉信息方面表现出色。专家评估显示,相比 o1,o3 在困难的现实任务中重大错误减少了 20%,尤其在编程、商业咨询和创意构思方面。
o4-mini 作为更小、更高效的模型,o4-mini 在保持卓越性能的同时,实现了快速且经济高效的推理,尤其在数学、编程和视觉任务方面表现突出,并为 AIME 设定了新的 SOTA。专家评估还显示,o4-mini 在非 STEM 任务和数据科学领域超越了其前身 o3-mini。由于其高效率,o4-mini 拥有更高的使用限制,适合高容量、高吞吐量的推理需求。
o3 侧重于强大的综合能力,而 o4-mini 则强调效率和速度,这两个模型与之前的推理模型相比,它们的体验也更加自然和更具对话性,尤其在参考记忆和历史对话时,响应更加个性化和相关

同时,OpenAI 推出了一个名为 Codex CLI 的全新实验性工具,这是一个可在终端运行的轻量级编码代理,旨在将前沿推理能力带到命令行。


总之,Codex CLI 是一个创新的开源工具,旨在将 OpenAI 最先进的推理能力直接带到开发者的终端,并支持通过多模态输入进行交互。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5