我们的最新力作——Claude Opus 4.5,于今日正式上线。它不仅智能、高效,更堪称目前全球范围内处理代码、驱动 AI 智能体 (AI Agent) 以及操作计算机的最佳模型。在深度研究、处理幻灯片和电子表格等日常任务上,它也展现出了显著的进步。Opus 4.5 不仅代表了 AI 系统能力的一次飞跃,更预示着未来工作方式将迎来巨大的变革。
在针对现实世界软件工程的测试中,Claude Opus 4.5 展现出了业界领先的实力:
即日起,您可以通过我们的 App、API 以及三大主流云平台访问 Opus 4.5。如果您是开发者,只需通过Claude API调用claude-opus-4-5-20251101即可体验。定价现已调整为每百万 Token 5 美元(输入)/ 25 美元(输出)——这使得更多用户、团队和企业能够以亲民的价格享受到 Opus 级别的强大能力。
与 Opus 同步推出的,还有Claude Developer Platform、Claude Code以及我们面向消费者的App的一系列更新。我们为长周期运行的智能体提供了新工具,并解锁了在 Excel、Chrome 和桌面上使用 Claude 的全新方式。在 Claude App 中,长对话将不再受限。更多详情,请参阅下方的产品专区。
Opus 系列模型一直被视为“真正的业界标杆 (SOTA)”,但过去其高昂的成本让人望而却步。现在的 Claude Opus 4.5 价格已十分亲民,完全可以成为您处理大多数任务的首选模型。它是当之无愧的赢家,展现了我们迄今为止见过的最强前沿任务规划和工具调用能力。
Jeff Wang CEO
Claude Opus 4.5 能交付高质量的代码,并且在配合 GitHub Copilot 处理重型智能体工作流方面表现卓越。早期测试显示,它在超越内部代码基准的同时,将 Token 使用量减少了一半,特别适合代码迁移和重构等任务。
Mario Rodriguez Chief Product Officer
评估 Claude Opus 4.5
我们通常会用一套极具挑战性的“家庭作业”式考题来筛选性能工程 (Performance Engineering) 岗位的候选人。我们也利用这套考题作为内部基准来测试新模型。在限定的 2 小时内,Claude Opus 4.5 的得分超越了我们要招聘的所有人类候选人的历史最高记录
这项测试旨在评估候选人在高压环境下的技术能力与判断力。当然,它无法涵盖协作、沟通或经年累月积累的职业直觉等其他关键软技能。但这一结果——AI 模型在核心技术技能上超越了优秀的人类候选人——引发了我们对 AI 将如何重塑工程这一职业的深思。我们的社会影响和经济未来研究正是旨在理解各领域即将面临的此类变革。我们将很快分享更多研究成果。
软件工程并非 Claude Opus 4.5 唯一取得突破的领域。该模型的各项能力均有显著提升——Opus 4.5 在视觉、推理和数学能力上都超越了前代产品,并在多个领域达到了业界最先进水平 (State-of-the-art)
Opus 4.5 代码编写能力更强,在 SWE-bench Multilingual 的 8 种编程语言中,有 7 种处于领先地位。
Opus 4.5 能轻松解决复杂的编码难题,在 Aider Polyglot 上比 Sonnet 4.5 提升了 10.6%。
Opus 4.5 在前沿智能体搜索方面有所改进,在 BrowseComp-Plus 上实现了大幅跃升。
Opus 4.5 在长期任务中能保持专注,在 Vending-Bench 上比 Sonnet 4.5 高出 29%。
像 Claude Code 这样的产品,生动展示了 Claude 开发者平台各项升级融合后的无限可能。随着 Opus 4.5 的发布,Claude Code 迎来了两大升级。Plan Mode(计划模式)现在能制定更精准的计划并执行得更为彻底——Claude 会预先询问澄清性问题,并在执行前生成一个用户可编辑的plan.md文件。
Claude Code 现已集成至我们的桌面应用中,支持并行运行多个本地及远程会话:您可以让一个智能体修复 Bug,另一个在 GitHub 上进行调研,同时让第三个负责更新文档。
对于Claude App用户而言,长对话将不再受阻——Claude 会根据需要自动总结早期的上下文信息,让您的对话流畅延续。Claude for Chrome让 Claude 能够跨浏览器标签页处理任务,现已面向所有 Max 用户开放。我们在 10 月发布了Claude for Excel,即日起,我们将 Beta 测试权限扩展至所有 Max、Team 和 Enterprise 用户。这些更新都充分利用了 Claude Opus 4.5 在计算机操作、电子表格处理及长周期任务执行方面的业界领先性能。
对于有权访问 Opus 4.5 的 Claude 和 Claude Code 用户,我们取消了针对 Opus 的特定限制。针对 Max 和 Team Premium 用户,我们提高了整体使用额度,这意味着您拥有的 Opus Token 数量将与此前使用 Sonnet 时大致相当。我们正在调整使用限额,以确保 Opus 4.5 能够满足您的日常工作需求。请注意,这些限额专为 Opus 4.5 设定。随着未来更强模型的问世,我们将根据需要动态调整限制。