OpenAI发布o3与o4-mini，还开源两个项目

显示全部楼层

昨天晚上 OpenAI 发布了两款全新的人工智能模型：o3 和 o4-mini，算是首次赋予 AI “看图思考”的能力。

模型对比

o3：最强大推理模型，擅长复杂任务。

o4-mini：轻量快速，性价比高，适合日常任务。

定价策略：o3 比前代 o1 降价 33%，o4-mini 维持原价，体现出 OpenAI试图平衡性能与成本。

用户选择建议

建议科研/开发选 o3：需高级推理、工具调用或处理复杂图像（如科研图表

日常/轻量任务选 o4-mini：成本敏感型场景，且需基础视觉能力（如文档解析）

慎用场景：事实核查类任务因幻觉率升高，需人工校验。

核心突破

首次实现思维链中融合图像分析（如科学论文图表理解、几何图形解题），解决了传统多模态模型“看图说话”但无法深度推理的痛点。

功能升级：o3 支持 Python、浏览器、API 调用等工具链，任务完成度显著提升（如接入工具后 AIME 准确率从 91.6%→95.2%）

即刻体验：ChatGPT Plus/Pro/Team 用户可以体验 o3 和 o4-mini，普通用户免费试用 o4-mini。

开源 Codex 智能体项目

OpenAI 直播还开源一个Codex CLI 本地编码智能体项目，可把自然语言直接转换成可运行的代码。

只需告诉 Codex CLI 你想构建、修复或解释什么，它就能把你的创意变成现实。

Codex CLI 兼容所有 OpenAI 模型，包括 o3、o4‑mini 以及 GPT‑4.1。

Github：openai/codex

openai-fm 网站开源

今天早上还看到 OpenAI 把 openai fm 网站也给开源了，技术栈是 Nextjs + TailwindCSS + ShadcnUI

GitHub：openai/openai-fm

Codex 的由来

2020 年，OpenAI 发布了 GPT-3，其强大的语言生成能力令人印象深刻，但交互性和逻辑连贯性不如后来的 ChatGPT-3.5。

为了探索 LLM 在编程方面的潜力，OpenAI 基于 GPT-3 架构并用大量代码数据训练，研发出了辅助编程的 LLM，并命名为 Codex。

2021 年，GitHub 发布的 Copilot 背后就是 Codex LLM 支持的。在 Codex 的训练过程中，研究人员发现通过大量代码学习，LLM 的逻辑能力显著增强。

于是，OpenAI 调整了训练方法，结合海量文本、代码和 RLHF，最终开发出 ChatGPT-3.5，于 2022 年底惊艳世人。

Codex 是这一系列创新的开端，今天发布的开源小工具命名为 Codex，算是向这个开创性的模型致敬。