|
10分钟前,Anthropic 发布了 Claude Haiku 4.5 先说结论: ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;line-height: 2;" class="list-paddingleft-1">性能接近五个月前的旗舰 Sonnet 4成本降到三分之一,速度快了一倍多某些任务上甚至超过 Sonnet 4直到上个月,Sonnet 4 还都是旗舰模型,现在一个小模型就能达到 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.578px;margin-top: 32px;margin-bottom: 8px;padding: 0px 2px;width: fit-content;font-weight: bold;color: rgb(217, 119, 87);font-size: 20px;">性能表现从完整的 benchmark 来看,Haiku 4.5 的表现很有意思 编程能力: ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;line-height: 2;" class="list-paddingleft-1">Agentic coding(SWE-bench):73.3%Terminal coding:41.0%跟 Sonnet 4(72.7%、36.4%)基本持平数学能力: ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;line-height: 2;" class="list-paddingleft-1">Python 工具支持:96.3%无工具:80.7%这个表现甚至超过了很多大模型Computer Use: ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;line-height: 2;" class="list-paddingleft-1">OSWorld:50.7%这个成绩是亮点,直接超过 Sonnet 4 的 42.2%说实话,在计算机使用这个任务上,Haiku 4.5 的表现确实让人意外 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.578px;margin-top: 32px;margin-bottom: 8px;padding: 0px 2px;width: fit-content;font-weight: bold;color: rgb(217, 119, 87);font-size: 20px;">速度升级Anthropic 特别强调了速度这个点 原话是:more than twice the speed 体感就是:同样的任务,等待时间直接砍半,Claude Code 写代码的速度感会好很多 对于需要频繁调用 API 的应用来说,这个速度提升的价值可能比成本降低更重要 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.578px;margin-top: 32px;margin-bottom: 8px;padding: 0px 2px;width: fit-content;font-weight: bold;color: rgb(217, 119, 87);font-size: 20px;">价格便宜对比 Sonnet 4 的价格,Haiku 4.5 便宜了三分之一: ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;line-height: 2;" class="list-paddingleft-1">输入:$1 / 百万 tokens输出:$5 / 百万 tokens对比一下 Sonnet 4 的价格,Haiku 4.5 便宜了三分之一 
部署渠道: ingFang SC", "Helvetica Neue", Helvetica, Arial, sans-serif;line-height: 2;" class="list-paddingleft-1">Claude APIAmazon BedrockGoogle Cloud Vertex AIClaude CodeClaude 网页版和 App基本上,能用 Claude 的地方,现在都能用 Haiku 4.5 模型名称:claude-haiku-4-5 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.578px;margin-top: 32px;margin-bottom: 8px;padding: 0px 2px;width: fit-content;font-weight: bold;color: rgb(217, 119, 87);font-size: 20px;">安全性这里有个很有意思的点:Haiku 4.5 是 Anthropic 目前最安全的模型 按照 Anthropic 的自动化对齐评估,Haiku 4.5 的 misaligned behaviors 比例甚至低于 Sonnet 4.5 和 Opus 4.1 然后,因为在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2 
相比之下,Sonnet 4.5 和 Opus 4.1 都是更严格的 ASL-3 最后说两句我觉得吧,Haiku 4.5 的发布,其实展示了一个很清晰的趋势: AI 能力的「下沉」速度,远比我们想象的快 五个月前还是旗舰的性能,现在已经变成了小模型的标配 |