正文
在编程、工具使用、视觉推理、数学等领域的基准测试中,这两款模型超越了OpenAI o3,而在多语言问答、研究生级别推理任务上,Claude Opus 4与OpenAI o3得分持平。
同时,Claude 4系列模型的自主性进一步提升,Claude 3.7最多可自主运行45分钟,而Claude 4可以独立运行数小时,最高达到7小时。连续7小时自助编程不是梦了。
Anthropic增长与营收负责人Kate Jensen表示:“Claude Opus 4和Claude Sonnet 4将AI从工具变为真正的协作伙伴。
Claude Opus 4和Sonnet 4不再仅仅生成内容,而是更像专业的虚拟协作伙伴——专注复杂任务、保留上下文,并在无需持续指导下提供完整的解决方案。这一能力改变了企业应对各种挑战的方式,从开发软件系统到制定全面的营销策略。对于普通用户而言,它意味着与更理解需求的AI协作,且AI能独立承担更大比例的项目工作。
Amazon Bedrock上如何使用Claude 4系列模型?
目前,亚马逊云科技Amazon Bedrock中已经上线Claude Opus 4和Claude Sonnet 4这两款最新大模型。
亚马逊云科技也给出了使用这2款大模型的方法。
用户可以使用Bedrock Converse API进行编码,在Amazon Bedrock中选择想要使用的模型,模型 ID 为 anthropic.claude-opus-4-20250514-v1:0(适用于 Opus 4)和 anthropic.claude-sonnet-4-20250514-v1:0(适用于 Sonnet 4)。
亚马逊云科技也建议使用Converse API,因为它提供了一致的 API,可与所有支持消息的 Amazon Bedrock 模型兼容。这意味着用户只需编写一次代码,即可将其用于不同的模型。
例如,假设用户编写了一个agent,用于在代码库合并变更前审查代码。用户写了如下代码,利用 Bedrock Converse API 发送系统和用户提示。然后,该agent会使用流式传输的结果。
Claude Opus 4 现已在北美以下 AWS 区域上线:美国东部(俄亥俄州、弗吉尼亚州北部)和美国西部(俄勒冈州)。Claude Sonnet 4 不仅在北美 AWS 区域上线,还在亚太地区和欧洲地区上线:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(海得拉巴、孟买、大阪、首尔、新加坡、悉尼、东京)和欧洲(西班牙)。