Claude Opus 4.1：静悄悄的革命，响当当的实力。

显示全部楼层

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">昨天除了 OpenAI 的更新之外，Anthropic 也“悄悄”更新了模型。Claude Opus 4 升级到 Claude Opus 4.1 了。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">为了狙击 OpenAI，Anthropic 也是真拼了。我也是前天看到了它们在内测新模型的消息，没想到今天就放出来了。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">目前新模型 Opus 4.1 已经可以通过客户端和 API 进行使用，而且API 价格和之前的 Opus 保持不变。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;padding: 0.3em 1em;color: rgb(255, 255, 255);background: rgb(201, 99, 66);border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 6px;">升级概览

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">根据官方的说法，Claude Opus 4.1 在ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(201, 99, 66);">真实世界的编码任务、推理、代理任务中都有提升。在ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: inherit;color: rgb(201, 99, 66);">SWE-bench Verified这个测试代码能力的 Benchmark中，Claude Opus 4.1 提升到了 74.5% 的准确率。得益于这个提升，让 Claude 在深度研究和数据分析的能力上都得到了进一步的加强。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">有一说一，看这个 Benchmark 图真的发现 Claude 在代码这个领域非常垂类了。在别家 AIME 2025 这个数学竞赛榜都刷到 88% 的时候，它还只停留在 78%，比别家还低 10 个百分点。

光从 Benchmark 上看，其实 Opus 4.1 提升不是很大。所以我也实际上手体验对比了下，看看到底效果提升在哪儿。