专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

Claude 4系列模型正式发布，号称“世界上最好的”AI编程模型

DeepTech深科技 · 公众号 · 科技媒体 · 2025-05-23 07:57

主要观点总结

Anthropic在其首次开发者大会上发布了下一代Claude模型系列：Claude Opus 4和Claude Sonnet 4。新旗舰模型Claude Opus 4被宣称是“世界上最好的编程模型”，旨在处理复杂、长时间运行的任务和智能体工作流程。此外，新模型在编程、高级推理和AI智能体方面取得了显著进步，并提供了强大的编码能力。除了强大的编码能力，新一代Claude模型在推理和AI智能体功能方面也迈出了重要一步。伴随着新模型的发布，Anthropic还推出了Claude Code，旨在将Claude的能力更广泛地融入开发者的工作流程中，并发布了可扩展的Claude Code SDK和Anthropic API的四项新功能。

关键观点总结

关键观点1: Claude Opus 4被誉为‘世界上最好的编程模型’，旨在处理复杂、长时间运行的任务。

新模型在编程、高级推理和AI智能体方面取得了显著进步，尤其是编码领域表现突出。

关键观点2: Claude Sonnet 4作为对Sonnet 3.7的重大升级，在编程和推理能力等方面取得了相当大的进步，表现出色。

它在SWE-bench上实现了高准确率，一些早期测试用户的体验验证了其强大。

关键观点3: 新一代Claude模型在推理和AI智能体功能方面迈出了重要一步，推出了‘工具使用下的扩展思考’测试版功能。

新模型具备并行使用工具的能力，能更精确地遵循指令，并且展现了显著改进的记忆能力。

关键观点4: Claude 4系列的记忆能力是另一大看点，能够在《宝可梦》游戏中以智能体方式工作长达24小时。

新模型在长期任务感知、连贯性和逐步建立隐性知识方面有所改进。

关键观点5: 伴随新模型的发布，Anthropic还推出了Claude Code，旨在将Claude的能力更广泛地融入开发者的工作流程中。

此外，还发布了可扩展的Claude Code SDK和Anthropic API的四项新功能，帮助开发者构建更强大的AI智能体。

正文

请到「今天看啥」查看全文

一些早期测试用户在社交媒体上分享了他们的体验，从侧面印证了 Claude 4 的强大。

例如，知名 AI 博主 Ethan Mollick 仅用一句简单的提示： “ the book Piranesi as a p5js 3d space. do it for me ” （将《皮拉内西》这本书创作成一个 p5.js 的 3D 空间，帮我实现它），没有提供任何其他提示， Claude 4 便生成了一个令人印象深刻的 3D 空间演示，其中包含了鸟、水和光照效果，效果看起来相当不错。

视频丨相关视频（来源： X ）

还有用户仅用单次提示就生成了复杂的双摆模拟系统，表现非常出色。

视频丨相关视频（来源： X ）

另一位知名博主 Peter Yang 也获得了早期访问权限，他总结道： “ 1. 它在写作和编辑方面仍然是同类最佳。 2. 它的编码能力和 Gemini 2.5 一样好。 ” 还展示了 Claude 4 一次性构建了一个功能齐全的俄罗斯方块游戏。

图丨相关推文（来源： X ）

除了强大的编码能力，新一代 Claude 模型在推理和 AI 智能体功能方面也迈出了重要一步。 Anthropic 推出了 “