专栏名称: 彭涛说
副业/自媒体/出海/创业交流vx:257735
目录
相关文章推荐
VC/PE/MA金融圈  ·  一个不怕任何事的顶级思维 ·  14 小时前  
九卦金融圈  ·  九卦 | ... ·  昨天  
VC/PE/MA金融圈  ·  一位广州00后女生爆红 ·  昨天  
Wind万得  ·  【RimeData周报05.31-06.06 ... ·  3 天前  
INTERNATIONAL IDEAL 筑梦求职  ·  UCLA学长:不敢相信,被拒10次后,我奇迹 ... ·  3 天前  
51好读  ›  专栏  ›  彭涛说

刚刚!Claude4横空出世!连续编程7小时不卡壳,智商碾压人类程序员?

彭涛说  · 公众号  ·  · 2025-05-24 13:30

正文

请到「今天看啥」查看全文


  • Claude Opus 4和Sonnet 4混合模型的两种模式: 几乎即时的响应和用于更深度推理的扩展思考。

  • 扩展思考与工具使用(测试版): 两款模型均可在扩展思考过程中使用工具(例如网络搜索),使Claude能在推理与工具使用间灵活切换,从而优化响应质量。

  • 新的模型能力: 两款模型均可并行使用工具,更精确地遵循指令,并且(当开发者授予其访问本地文件的权限时)展现出显著增强的记忆能力,能提取、保存关键信息,以保持连续性,并随时间积累隐性知识。

  • Claude Code: 可通过GitHub Actions支持后台任务,并与VS Code和JetBrains进行了原生集成,可直接在文件中显示编辑内容,实现无缝结对编程。

  • 新的API能力: Anthropic API新增四项新功能,让开发者能够构建更强大的AI智能体——代码执行工具、MCP连接器、文件API,以及长达一小时的提示词缓存能力。

所以,什么人能用上这次的新模型?

目前,订阅了Pro、Max、Team和Enterprise版的Claude用户,可以立即体验到这两款模型及扩展思考功能。其中,Sonnet 4还将向免费用户开放。

开发者则可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI调用。

而Claude 4的定价,也与此前保持一致:

  • Opus 4 每百万Token为 15美元(输入) / 75美元(输出)

  • Sonnet 4 每百万Token为 3美元(输入) / 15美元(输出)


Claude 4:AI编程新王登基


Claude Opus 4号称是Anthropic迄今为止最强大的模型,也是全球最顶尖的编码模型。

在SWE-bench和Terminal-bench测试中,分别以72.5%和43.2%的得分全面领先,碾压OpenAI刚刚发布的编程智能体Codex-1和最强推理模型o3。

即使在需要高度专注并执行数千步骤的长时间运行任务中,它都能展现出持续稳定的性能,连续工作数小时。

可以说,Opus 4的推出极大扩展了AI智能体的能力边界。众多前沿的AI智能体产品,都将获得强大支持。







请到「今天看啥」查看全文