专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
新浪科技  ·  【#三星贴脸嘲讽iOS26没新意#】在苹果W ... ·  15 小时前  
36氪  ·  苏超背后的老板们 ·  2 天前  
新浪科技  ·  【#AI大模型写高考作文哪家强# ... ·  3 天前  
51好读  ›  专栏  ›  DeepTech深科技

Claude 4系列模型正式发布,号称“世界上最好的”AI编程模型

DeepTech深科技  · 公众号  · 科技媒体  · 2025-05-23 07:57

主要观点总结

Anthropic在其首次开发者大会上发布了下一代Claude模型系列:Claude Opus 4和Claude Sonnet 4。新旗舰模型Claude Opus 4被宣称是“世界上最好的编程模型”,旨在处理复杂、长时间运行的任务和智能体工作流程。此外,新模型在编程、高级推理和AI智能体方面取得了显著进步,并提供了强大的编码能力。除了强大的编码能力,新一代Claude模型在推理和AI智能体功能方面也迈出了重要一步。伴随着新模型的发布,Anthropic还推出了Claude Code,旨在将Claude的能力更广泛地融入开发者的工作流程中,并发布了可扩展的Claude Code SDK和Anthropic API的四项新功能。

关键观点总结

关键观点1: Claude Opus 4被誉为‘世界上最好的编程模型’,旨在处理复杂、长时间运行的任务。

新模型在编程、高级推理和AI智能体方面取得了显著进步,尤其是编码领域表现突出。

关键观点2: Claude Sonnet 4作为对Sonnet 3.7的重大升级,在编程和推理能力等方面取得了相当大的进步,表现出色。

它在SWE-bench上实现了高准确率,一些早期测试用户的体验验证了其强大。

关键观点3: 新一代Claude模型在推理和AI智能体功能方面迈出了重要一步,推出了‘工具使用下的扩展思考’测试版功能。

新模型具备并行使用工具的能力,能更精确地遵循指令,并且展现了显著改进的记忆能力。

关键观点4: Claude 4系列的记忆能力是另一大看点,能够在《宝可梦》游戏中以智能体方式工作长达24小时。

新模型在长期任务感知、连贯性和逐步建立隐性知识方面有所改进。

关键观点5: 伴随新模型的发布,Anthropic还推出了Claude Code,旨在将Claude的能力更广泛地融入开发者的工作流程中。

此外,还发布了可扩展的Claude Code SDK和Anthropic API的四项新功能,帮助开发者构建更强大的AI智能体。


正文

请到「今天看啥」查看全文


一些早期测试用户在社交媒体上分享了他们的体验,从侧面印证了 Claude 4 的强大。

例如,知名 AI 博主 Ethan Mollick 仅用一句简单的提示: the book Piranesi as a p5js 3d space. do it for me (将《皮拉内西》这本书创作成一个 p5.js 3D 空间,帮我实现它),没有提供任何其他提示, Claude 4 便生成了一个令人印象深刻的 3D 空间演示,其中包含了鸟、水和光照效果,效果看起来相当不错。

视频丨相关视频(来源: X

还有用户仅用单次提示就生成了复杂的双摆模拟系统,表现非常出色。

视频丨相关视频(来源: X

另一位知名博主 Peter Yang 也获得了早期访问权限,他总结道: 1. 它在写作和编辑方面仍然是同类最佳。 2. 它的编码能力和 Gemini 2.5 一样好。 还展示了 Claude 4 一次性构建了一个功能齐全的俄罗斯方块游戏。

图丨相关推文(来源: X

除了强大的编码能力,新一代 Claude 模型在推理和 AI 智能体功能方面也迈出了重要一步。 Anthropic 推出了







请到「今天看啥」查看全文