正文
-
Claude Opus 4和Sonnet 4混合模型的两种模式:
几乎即时的响应和用于更深度推理的扩展思考。
-
扩展思考与工具使用(测试版):
两款模型均可在扩展思考过程中使用工具(例如网络搜索),使Claude能在推理与工具使用间灵活切换,从而优化响应质量。
-
新的模型能力:
两款模型均可并行使用工具,更精确地遵循指令,并且(当开发者授予其访问本地文件的权限时)展现出显著增强的记忆能力,能提取、保存关键信息,以保持连续性,并随时间积累隐性知识。
-
Claude Code:
可通过GitHub Actions支持后台任务,并与VS Code和JetBrains进行了原生集成,可直接在文件中显示编辑内容,实现无缝结对编程。
-
新的API能力:
Anthropic API新增四项新功能,让开发者能够构建更强大的AI智能体——代码执行工具、MCP连接器、文件API,以及长达一小时的提示词缓存能力。
所以,什么人能用上这次的新模型?
目前,订阅了Pro、Max、Team和Enterprise版的Claude用户,可以立即体验到这两款模型及扩展思考功能。其中,Sonnet 4还将向免费用户开放。
开发者则可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI调用。
而Claude 4的定价,也与此前保持一致:
Claude Opus 4号称是Anthropic迄今为止最强大的模型,也是全球最顶尖的编码模型。
在SWE-bench和Terminal-bench测试中,分别以72.5%和43.2%的得分全面领先,碾压OpenAI刚刚发布的编程智能体Codex-1和最强推理模型o3。
即使在需要高度专注并执行数千步骤的长时间运行任务中,它都能展现出持续稳定的性能,连续工作数小时。
可以说,Opus 4的推出极大扩展了AI智能体的能力边界。众多前沿的AI智能体产品,都将获得强大支持。