回到Sonnet 4.5本身,可以看到4.5在Terminal Bench进入50%分位,在Agentic tool use的bench上更是有一个质的飞跃,从71来到了98,不会是蒸馏的gpt-5吧?因为他俩数值好接近。再一个就是Computer Use上也是质的飞跃,从44迈入61.4,好想看看gpt-5在该榜单表现…
Claude Code赢来升级,还带来VS Code扩展,可以通过检查点功能进行回退。所以说我看不懂Github推出Copilot CLI命令行的copilot是不是反向操作?
此外,Claude还可以使用代码分析数据创建文件以及可视化,他们的Chrome扩展插件也正式发布并公开给所有人使用,他们演示了使用Claude让浏览器自动发邮件和编辑Google Docs。
最后一个是临时研究预览版Imagine With Claude,只有Max可用。
价格保持一致,未有更新。到底还是敌对,DeepSeek R1发布的时候,那个CEO就是各种讽刺抵制,现在狙击的行为好明显。不过DeepSeek只是发了个实验版本,瞧把你吓得。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |