链载Ai

标题: Claude 4:彻底炸了 [打印本页]

作者: 链载Ai    时间: 前天 21:01
标题: Claude 4:彻底炸了


ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(15, 76, 129);">一、一骑绝尘的孤独

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Anthropic 今晚揭幕的ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">Claude Opus 4ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">Claude Sonnet 4,把大模型从「一次对话回答」推向「长时段、自主管理的思考实体」。从并行工具调用、可写可读的持久记忆、可挂起数小时的“扩展思考”——便会发现:

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;font-style: normal;padding: 1em;border-radius: 6px;color: rgba(0, 0, 0, 0.5);background: rgb(247, 247, 247);">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1em;display: block;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这些改动让 AI 第一次具备了“自己给自己留备忘录、再回头翻阅并继续任务”的能力。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这一能力,也许比任何单项基准分数都更具箭头意义,兄弟们,AI 越来越像个人了,会自己整理知识,会并行的使用与反思进展!人类距离下岗还有多久!!

Illustration of Claude juggling several tasks in parallel

二、Code、Code、Code

不得不表扬,Claude 系列在 Coding 上持续有效的投入,本次发布在Coding 上又有新的提,而且不仅仅是代码层面的提升,而是整体生态的突破:

Bar chart comparison between Claude and other LLMs on software engineering tasks

三、上不去的跑分,得上去的智商

有意思的是Opus 并不是在任何领域都强于 Sonnet,反而在代码领域 Sonnet 更强一些,这信息其实很有意思,至少能说明几个事情:

Benchmark table comparing Opus 4 and Sonnet 4 to other LLM

四、其他汇总

维度
Opus 4
Sonnet 4
共同新特性
定位
超长任务、极限推理与代码生成的旗舰
性价比与瞬时响应兼顾的中坚
双模式:瞬时回答 / 扩展思考
代码基准
SWE-bench 72.5%、Terminal-bench 43.2%,居业界首位
SWE-bench 72.7%,刷新中档模型纪录
并行工具调用;可写入本地“记忆文件”
安全等级
首批触发 Anthropic ASL-3 风险管控的模型,启动更严密的越狱防护与安全赏金
同步继承
65% ↓ “走捷径”倾向;思维摘要仅在 5 % 长链条场景触发
价格
$15 / $75 每百万 tokens(入/出)
$3 / $15
旧价续用,API、Bedrock、Vertex AI 同步上架








欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5