OpenAI发布GPT-4.1全新系列模型，性能全面超越GPT-4o

显示全部楼层

凌晨一点，OpenAI正式通过 API 形式发布了全新的 GPT-4.1 系列模型，没错，只有 API，没有网页可以使用，包括三个不同定位的版本：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。

这次的迭代是对现有旗舰模型 GPT-4o 的一次全面超越，尤其在编码、指令遵循和长上下文处理方面实现了显著飞跃。

OpenAI 官方宣称，新的 GPT-4.1 系列“几乎在各个方面”都优于备受好评的 GPT-4o。此次发布的核心提升聚焦于以下几个关键领域：

更强的智能与更低的延迟：整体性能得到提升，同时优化了响应速度。
卓越的编码能力：在软件工程基准测试（如 SWE-bench Verified）上表现突出，代码编辑能力（Aider's Polyglot benchmark）和前端开发任务上均有大幅改进。
精准的指令遵循：在理解复杂指令、多轮对话跟踪（MultiChallenge）和格式依从性（IFEval）方面比 GPT-4o 有显著提升。
突破性的长上下文处理：支持高达 100 万个 token 的上下文窗口，远超 GPT-4o 的 128k，并在“大海捞针”（Needle in a Haystack）等测试中展现了全范围的精确信息检索能力。

1. GPT-4.1 (旗舰版)：

2. GPT-4.1 mini (高效版)：

3. GPT-4.1 nano (高速版)：

同时，OpenAI 也对定价策略进行了调整，旨在提高性价比：

注意：混合均价是考虑了典型输入/输出比例和缓存命中率后的估算参考值。

此外，Prompt 缓存机制的折扣提升至 75%，使用 Batch API 还可再享 50% 折扣，进一步降低了大规模应用成本。

OpenAI 这次 GPT-4.1 系列发布，无疑是大型语言模型发展史上的又一重要里程碑。它不仅带来了性能上的飞跃，更在上下文长度、推理效率和成本效益上实现了结构性优化。

这预示着 AI 将能更稳定、更可控地应用于更复杂的现实世界任务。