返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

OpenAI o3 和 o4-mini 多模态推理新模型重磅来袭

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 20:40 |阅读模式 打印 上一主题 下一主题
就在刚刚,OpenAI 发布了其 o 系列模型的最新成员o3 和 o4-mini,这两款模型被认为是 OpenAI迄今为止最智能的模型。它们经过训练后能够在做出反应前进行更长时间的思考,并且首次具备智能地使用和组合 ChatGPT 的所有工具的能力,包括网页搜索、Python 分析、视觉推理和图像生成。
模型能够自主判断何时以及如何使用这些工具,从而以正确的格式生成详细且周到的答案,更有效地处理复杂问题。这一突破性的推理能力与完全的工具访问权限相结合,使得新模型在学术基准测试和实际应用中都展现出显著的性能提升。
o3 在编码、数学、科学和视觉感知等领域打破了多项基准记录
它尤其擅长处理需要多方面分析的复杂查询,并在分析视觉信息方面表现出色。专家评估显示,相比 o1,o3 在困难的现实任务中重大错误减少了 20%,尤其在编程、商业咨询和创意构思方面。
o4-mini 作为更小、更高效的模型,o4-mini 在保持卓越性能的同时,实现了快速且经济高效的推理,尤其在数学、编程和视觉任务方面表现突出,并为 AIME 设定了新的 SOTA。专家评估还显示,o4-mini 在非 STEM 任务和数据科学领域超越了其前身 o3-mini。由于其高效率,o4-mini 拥有更高的使用限制,适合高容量、高吞吐量的推理需求。
o3 侧重于强大的综合能力,而 o4-mini 则强调效率和速度,这两个模型与之前的推理模型相比,它们的体验也更加自然和更具对话性,尤其在参考记忆和历史对话时,响应更加个性化和相关

同时,OpenAI 推出了一个名为 Codex CLI 的全新实验性工具,这是一个可在终端运行的轻量级编码代理,旨在将前沿推理能力带到命令行。

  • 终端中的强大推理:
    Codex CLI 旨在充分利用 o3 和 o4-mini 等模型的推理能力,并计划支持更多 API 模型,如 GPT-4.1。
  • 本地多模态推理:
    该工具的独特之处在于能够通过传递屏幕截图或低保真草图,在本地命令行环境中实现多模态推理,并能访问本地代码。
  • 极简连接接口:
    OpenAI 将其视为一个将模型直接连接到用户及其计算机的极简接口。
  • 完全开源:
    Codex CLI 已完全开源,代码可在获取。
  • 百万美元资助计划:
    OpenAI 还宣布启动一项 100 万美元的计划,以支持使用 Codex CLI 和 OpenAI 模型进行的项目。资助将以 API 积分的形式发放,每笔最高 2.5 万美元。提案可以通过提供的链接提交。


总之,Codex CLI 是一个创新的开源工具,旨在将 OpenAI 最先进的推理能力直接带到开发者的终端,并支持通过多模态输入进行交互。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ