真是太激动了啊,哈哈哈,让不让人睡觉了还。过去两天,先是Gemini 3 Pro、然后是GPT-5.1-Codex-Max和GPT-5.1 Pro,一个比一个好。1.综合编程能力 GPT-5.1-Codex-Max > Gemini 3 Pro >GPT-5.1-Codex >> Claude Sonnet 4.52. 但是,Gemini 3 Pro 的前端能力极强,我并不认为GPT-5.1-Codex-Max的前端表现能超过Gemini 3 Pro。 因此,在今天,我的选择是3.GPT-5.1-Codex-Max除了编程能力重新登顶,还带来的新特性:- 长程任务能力。原生训练支持多上下文窗口、24小时工作。朋友们,如果你们想用Codex来复刻揭秘 Claude Code 榜一大哥:一个 AI 创业者如何把工具用到极致 | 对话刘小排现在变得很容易了
- 提供更长时思考的Extra High(xhigh)模式,大力出奇迹。注意:日常推荐medium,只有特别难的任务才需要用high和xhigh
4.GPT-5.1-Codex-Max 可以通过Codex CLI、Codex IDE Extension使用,暂时无法通过API使用。 这次发布,OpenAI一改以前高调的作风,让人很不习惯。没有视频、没有发布后,只有两条孤零零的Twitter。在OpenAI的技术博文,它重点强调了GPT-5.1-Codex-Max 能够连续工作24小时的能力。这是因为,GPT-5.1-Codex-Max 是OpenAI首个「原生训练支持多窗口上下文」机制的模型,可以跨越多个上下文工作。所谓「原生训练支持多窗口上下文」机制,并不是OpenAI首创。Claude 系列模型已经在几个月前开始了,9月Claude Sonnet 4.5刚刚发布时,它也是可以连续工作超过24小时的。Peter Gostev大神用GPT-5.1-Codex-Max(Extra-High)的长程任务能力,做了高级金门大桥场景,感叹道:
下面两个截图,图1是GPT-5.1-Codex-Max(Extra-High) ,图2是 Gemini 3 Pro做的。 GPT-5.1-Codex-Max(Extra-High) 做得实在是太好了,我把原始视频放出来吧。 |