|
昨天晚上 OpenAI 发布了两款全新的人工智能模型:o3 和 o4-mini,算是首次赋予 AI “看图思考”的能力。o4-mini:轻量快速,性价比高,适合日常任务。定价策略:o3 比前代 o1 降价 33%,o4-mini 维持原价,体现出 OpenAI试图平衡性能与成本。建议科研/开发选 o3:需高级推理、工具调用或处理复杂图像(如科研图表日常/轻量任务选 o4-mini:成本敏感型场景,且需基础视觉能力(如文档解析)慎用场景:事实核查类任务因幻觉率升高,需人工校验。首次实现思维链中融合图像分析(如科学论文图表理解、几何图形解题),解决了传统多模态模型“看图说话”但无法深度推理的痛点。功能升级:o3 支持 Python、浏览器、API 调用等工具链,任务完成度显著提升(如接入工具后 AIME 准确率从 91.6%→95.2%)即刻体验:ChatGPT Plus/Pro/Team 用户可以体验 o3 和 o4-mini,普通用户免费试用 o4-mini。OpenAI 直播还开源一个Codex CLI 本地编码智能体项目,可把自然语言直接转换成可运行的代码。只需告诉 Codex CLI 你想构建、修复或解释什么,它就能把你的创意变成现实。Codex CLI 兼容所有 OpenAI 模型,包括 o3、o4‑mini 以及 GPT‑4.1。今天早上还看到 OpenAI 把 openai fm 网站也给开源了,技术栈是 Nextjs + TailwindCSS + ShadcnUI2020 年,OpenAI 发布了 GPT-3,其强大的语言生成能力令人印象深刻,但交互性和逻辑连贯性不如后来的 ChatGPT-3.5。为了探索 LLM 在编程方面的潜力,OpenAI 基于 GPT-3 架构并用大量代码数据训练,研发出了辅助编程的 LLM,并命名为 Codex。2021 年,GitHub 发布的 Copilot 背后就是 Codex LLM 支持的。在 Codex 的训练过程中,研究人员发现通过大量代码学习,LLM 的逻辑能力显著增强。于是,OpenAI 调整了训练方法,结合海量文本、代码和 RLHF,最终开发出 ChatGPT-3.5,于 2022 年底惊艳世人。Codex 是这一系列创新的开端,今天发布的开源小工具命名为 Codex,算是向这个开创性的模型致敬。 |