Claude Sonnet 4 上下文翻 5 倍！100 万 token 能处理更大型代码库，AI 代码分析起飞。

显示全部楼层

Claude Sonnet 4 也加入了“百万 token 俱乐部”，现在跟 Gemini 一样，都支持 100 万上下文了。

上下文容量直接翻了 5 倍，现在能一次性塞进整个代码库或者几十篇论文。

价格也变了，超过 200K token 就按新价格算：输入 15/M tok (贵 5 倍)，输出 22.5/M tok (贵 1.5 倍)。注意，最强的 Opus 模型还没这待遇。

不过这功能还在 Beta，想用的话有几个门槛和限制：

百万上下文有多大？大概 75 万个单词，或者 7.5 万行代码。好处是 AI 能看懂项目结构，跨文件追踪，理解长篇需求，不用来回切上下文。

Anthropic 还提到“有效上下文”的概念，就是模型真正理解的部分，不只是存着。这对于长时间跑的 AI 智能体很重要，能减少跑偏和返工。

对比

市场格局
：GPT-4o 是 128K，Gemini 1.5 Pro 是 1M (可扩展至 2M)，Llama 3 传闻有 2M。
Anthropic 的卖点
：不光是上下文长，更强调 1M 上下文的可靠性、实用的定价，以及对大代码库和长周期智能体的适用性。
价格对比
：Gemini Pro 和 Flash 便宜多了。Gemini 1.5 Pro 超过 128K token 后是 $7/M，比 Claude 便宜不少。
实测效果
：有人测试发现，Sonnet 3.5 在文本分析上比 Gemini 更快、幻觉更少。但在代码分析上，Gemini 在长上下文里找细节还是更强。
提示词策略
：有人担心，这么长的上下文，提示词策略也得跟着变，不然效果不好。

更长的上下文为 Claude 带来了更广泛、更数据密集型的应用场景。

在大规模代码分析方面，开发者可以将整个代码库加载到模型中，让 Claude 理解项目架构、识别依赖关系并提出系统级建议。

在文档综合方面，模型可以处理法律合同、研究论文等海量文档，并在完整上下文中进行分析。

在智能体构建方面，模型可以在数百次工具调用和多步工作流中保持上下文连贯。

一些客户已经开始使用这一新功能。Bolt.new 的 CEO Eric Simons 表示，Sonnet 3.5 在其代码生成工作流中持续表现优于其他模型，百万上下文使其能够处理更大的项目。

想在 Claude Code 里用上 Sonnet 3.5 的 100 万上下文？有人分享了个技巧：用 `/model sonnet-3.5-20240620-1m` 这个命令就能切换。

不过，这招有前提：