Opus 4.6 和 Sonnet 4.6 的 1M 上下文现已普遍可用

1M 上下文现已普遍可用,适用于 Opus 4.6 和 Sonnet 4.6
Claude Opus 4.6 和 Sonnet 4.6 现在在 Claude Platform 上以标准定价包含完整的 1M 上下文窗口。整个 1M 窗口适用标准的按 token 定价,不收取长上下文附加费,并且每次请求的媒体限制已扩展。
普遍可用的新变化
- 单一价格,完整上下文窗口:整个 1M 上下文窗口采用标准定价。没有长上下文溢价或乘数。
- 在所有上下文长度都适用完整速率限制:标准账户吞吐量在整个窗口内均可使用。
- 每次请求的媒体数量增加 6 倍:媒体限制扩展至最多 600 张图片或 PDF 页面(之前为 100)。
- 无需 beta header:超过 200K token 的请求现在会自动生效;如果您已经发送了 beta header,会被忽略,因此无需更改代码。
定价与计费详情
- Opus 4.6:每百万 tokens $5 / $25。
- Sonnet 4.6:每百万 tokens $3 / $15。
没有乘数:例如 90 万令牌(900K)的请求按与 9 千令牌(9K)请求相同的每令牌费率计费。
平台可用性
扩展后的 1M 上下文和媒体限制从今天起在 Claude Platform 原生可用,并通过主要云端服务提供:微软 Azure Foundry 和 Google Cloud 的 Vertex AI。
Claude Code 的包含情况
对于使用 Opus 4.6 的 Max、Team 和 Enterprise 用户,Claude Code 现已包含 1M 上下文。Opus 4.6 会话可以自动使用完整的 1M 上下文窗口,这意味着更少的压缩(compaction)和更多的会话内容得以保留。此前,使用 1M 上下文需要额外用量。
能真正支撑长上下文的能力
一百万令牌的上下文只有在模型能跨越这些内容正确回忆细节并进行推理时才有意义。Opus 4.6 在 MRCR v2 上的得分为 78.3%,在该上下文长度中位列前沿模型之首。
Claude Opus 4.6 和 Sonnet 4.6 在整个 1M 窗口内保持了准确性。随着每一代模型,长上下文检索能力都有所提升。
这意味着您可以直接加载整套代码库、成千上万页的合同,或一个长期运行代理的完整追踪——包括工具调用、观察结果、中间推理——并直接使用它们。此前为长上下文工作所需的工程工作、有损摘要和上下文清理不再必要。完整的对话得以保留。
“科学发现需要同时跨越研究文献、数学框架、数据库和仿真代码进行推理。Claude Opus 4.6 的 1M 上下文和扩展的媒体限制让我们的自治系统能在单次处理内综合数百篇论文、证明和代码库,帮助我们显著加速基础与应用物理研究。” — Dr. Alex Wissner‑Gross, 联合创始人
“有了 Claude 的 1M 上下文,内部律师可以在一个会话中引入五轮 100 页合伙协议的内容,最终看到谈判的完整轨迹。不再需要在版本之间来回切换或弄丢三轮之前发生的变化。” — Bardia Pourvakil, 联合创始人兼 CTO
大规模生产系统存在无尽的上下文,生产事故也可能变得非常复杂。借助 Claude 的 1M 上下文窗口,我们能够从第一次告警到恢复的全过程中保持每一个实体、信号和工作假设的可见性。
总结:为什么这很重要
- 以标准定价提供完整的 1M 上下文,消除了使用长上下文时常见的成本障碍。
- 扩展的媒体限制(600 张图片/PDF 页面)使在单次请求中包含大型文档或大量图片成为可行。
- 在 Opus 4.6 上将其纳入 Claude Code(Max、Team、Enterprise)减少了手动压缩和上下文工程的需要。
- 更高的 MRCR v2 性能表明模型能够有效地在长上下文中回忆和推理。
如果您的工作依赖于长时会话、大型代码库、多文档研究或复杂的生产事故追踪,Opus 4.6 和 Sonnet 4.6 的普遍可用 1M 上下文窗口消除了此前在定价、吞吐量和媒体大小方面的限制。
来源:
准备好保护您的隐私了吗?
下载Doppler VPN,今天就开始安全浏览。

