Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

显示全部楼层

就在DeepSeek V3.2发布" target="_blank" data-linktype="2">DeepSeek V3.2发布后不久，北京时间9月30日凌晨，敌对Anthropic发布Claude Sonnet 4.5，号称世界最强编程模型，上演一场狙击表演！要我说，敌对还是好好参考一下DeepSeek的DSA稀疏注意力，别再整什么量化降智的骚操作了！

回到Sonnet 4.5本身，可以看到4.5在Terminal Bench进入50%分位，在Agentic tool use的bench上更是有一个质的飞跃，从71来到了98，不会是蒸馏的gpt-5吧？因为他俩数值好接近。再一个就是Computer Use上也是质的飞跃，从44迈入61.4，好想看看gpt-5在该榜单表现…

Claude Code赢来升级，还带来VS Code扩展，可以通过检查点功能进行回退。所以说我看不懂Github推出Copilot CLI命令行的copilot是不是反向操作？

此外，Claude还可以使用代码分析数据创建文件以及可视化，他们的Chrome扩展插件也正式发布并公开给所有人使用，他们演示了使用Claude让浏览器自动发邮件和编辑Google Docs。

还带来了两个新的API

功能来构建Agent，且不会频繁达到上下文限制：

- 上下文编辑可自动清除陈旧的上下文
- 用于存储和查阅上下文窗口之外的信息的记忆工具

最后一个是临时研究预览版Imagine With Claude，只有Max可用。

价格保持一致，未有更新。到底还是敌对，DeepSeek R1发布的时候，那个CEO就是各种讽刺抵制，现在狙击的行为好明显。不过DeepSeek只是发了个实验版本，瞧把你吓得。