专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
51好读  ›  专栏  ›  大数据文摘

AI超级碗!英伟达GTC大会宣布Blackwell升级架构及下三代GPU,黄仁勋展现AI大布局!

大数据文摘  · 公众号  · 大数据  · 2025-03-20 12:00

正文

请到「今天看啥」查看全文


升级版Blackwell Ultra GPU架构更擅长满足AI推理需求。
该架构增强了训练和测试时间扩展推理(在推理过程中应用更多计算以提高准确性的艺术),使开发者能够加速AI推理、代理AI和物理AI等应用。
Blackwell Ultra以一年前推出的Blackwell架构为基础,包括NVIDIA GB300 NVL72机架级解决方案和NVIDIA HGX B300 NVL16系统。GB300 NVL72的AI性能比NVIDIA GB200 NVL72高出1.5倍,与使用NVIDIA Hopper构建的相比,Blackwell性能增加了50倍。
与Hopper一代相比,NVIDIA HGX B300 NVL16在大型语言模型上的推理速度提高了11倍,计算能力提高了7倍,内存增加了4倍。
基于Blackwell Ultra的产品将从2025年下半年开始提供。预计思科、戴尔科技、惠普、联想和超微等将提供基于Blackwell Ultra产品的各种服务器。
NVIDIA Dynamo开源推理框架今天也宣布扩展了推理AI服务,通过提供最有效的测试时间计算扩展解决方案,实现了吞吐量的飞跃,同时缩短响应时间和模型服务成本。
英伟达预计将于2026年下半年开始发售其下一代GPU产品,以天文学家Vera Rubin的名字命名,将比去年的Grace Blackwell芯片中使用的CPU快两倍。
Rubin可以在进行推理时实现每秒50千万亿次浮点运算,比该公司目前的Blackwell芯片每秒20千万亿次浮点运算的速度高出一倍多,Rubin还可以支持高达288 GB的快速内存,这是AI开发人员关注的核心规格之一。
以物理学家理查德·费曼命名的Feynman架构,预计会在2028年问世,目前并未有太多细节。
全面渗透的“算力生意”

除了GPU架构展望,今年GTC推出的核心组件产品瞄准了数据中心AI超算和个人AI超算,以及基于英伟达硬件的一系列AI推理、AI智能体软件支撑。
黄仁勋介绍了目前全球最先进的企业级AI基础设施—搭载NVIDIA Blackwell Ultra GPU的NVIDIA DGX SuperPOD™,旨在为各行各业的企业提供AI超级计算,实现最先进的代理AI推理,该超级计算机可提供FP4精度和更快的AI推理能力,从而为AI应用程序增强令牌生成能力。






请到「今天看啥」查看全文