专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯科技

一文读懂英伟达GTC:有关Blackwell全家桶、硅光芯片和黄仁勋的“新故事”

腾讯科技  · 公众号  · 科技媒体  · 2025-03-19 06:07

主要观点总结



关键观点总结



正文

请到「今天看啥」查看全文


3)提前预告真“核弹”GPU Rubin芯片

按照英伟达的路线图,GTC2025的主场就是Blackwell Ultra。
不过,黄仁勋也借这个场子预告了2026年上市的基于Rubin架构的下一代GPU以及更强的机柜Vera Rubin NVL144——72颗Vera CPU+144颗 Rubin GPU,采用288GB显存的HBM4芯片,显存带宽13TB/s,搭配第六代NVLink和CX9网卡。
这个产品有多强呢?FP4精度的推理算力达到了3.6ExaFLOPS,FP8精度的训练算力也达到了1.2ExaFlOPS,性能是Blackwell Ultra NVL72的3.3倍。
如果你觉得还不够,没关系,2027年还有更强的 Rubin Ultra NVL576机柜,FP4精度的推理和FP8精度的训练算力分别是15ExaFLOPS和5ExaFLOPS,14倍于Blackwell Ultra NVL72。

图片

英伟达官方提供的Rubin Ultra NVL144和Rubin Ultra NVL576参数

4)Blackwell Ultra版DGX Super POD“超算工厂“

对于那些现阶段Blackwell Ultra NVL72都不能满足需求,又不需要搭建超大规模AI集群的客户,英伟达的解决方案是基于Blackwell Ultra、即插即用的DGX Super POD AI超算工厂。
作为一个即插即用的AI超算工厂,DGX Super POD主要面向专为生成式AI、AI Agent和物理模拟等AI场景,覆盖从预训练、后训练到生产环境的全流程算力扩展需求,Equinix作为首个服务商,提供液冷/风冷基础架构支持。
图片
由Blackwell Ultra构建的DGX SuperPod
基于Blackwell Ultra定制的DGX Super POD分两个版本:
  • 内置DGX GB300(Grace CPU ×1+Blackwell Ultra GPU ×2) 的DGX SuperPOD,总计288颗Grace CPU+576颗 Blackwell Ultra GPU,提供300TB的快速内存,FP4精度下算力为11.5ExaFLOPS
  • 内置DGX B300的DGX SuperPOD,这个版本不含Grace CPU芯片 ,具备进一步的扩展空间,且采用的是风冷系统,主要应用场景为普通的企业级数据中心

5)DGX Spark与DGX Station

今年1月份,英伟达在CES上晒了一款售价3000美元的概念性的AI PC产品——Project DIGITS,现在它有了正式名称DGX Spark。
产品参数方面,搭载GB10芯片,FP4精度下算力可以达到1PetaFlops,内置128GB LPDDR5X 内存,CX-7网卡,4TB NVMe存储,运行基于Linux定制的DGX OS操作系统,支持Pytorch等框架,且预装了英伟达提供的一些基础AI软件开发工具,可以运行2000亿参数模型。整机的尺寸和Mac mini的大小接近,两台DGX Spark互联,还可以运行超过4000亿参数的模型。
虽然我们说它是AI PC,但本质上仍然属于超算范畴,所以被放在了DGX产品系列当中,而不是RTX这样的消费级产品里面。
不过也有人吐槽这款产品,FP4的宣传性能可用性低,换算到FP16精度下只能跟RTX 5070,甚至是250美元的Arc B580对标,因此性价比极低。

图片

DGX Spark计算机与DGX Station工作站
除了拥有正式名称的DGX Spark,英伟达还推出了一款基于Blackwell Ultra的AI工作站,这个工作站内置一颗Grace CPU和一颗Blackwell Ultra GPU,搭配784GB的统一内存、CX-8网卡,提供20PetaFlops的AI算力(官方未标记,理论上也是FP4精度)。

6)RTX横扫AI PC,还要挤进数据中心

前面介绍的都是基于Grace CPU和Blackwell Ultra GPU的产品SKU,且都是企业级产品, 考虑到很多人对RTX 4090这类产品在AI推理上的妙用,英伟达本次GTC也进一步强化了Blackwell和RTX系列的整合 ,推出了一大波内置GDDR7内存的AI PC相关GPU,覆盖笔记本、桌面甚至是数据中心等场景。
  • 桌面GPU:,包括RTX PRO 6000 Blackwell 工作站版、RTX PRO 6000 Blackwell Max-Q工作站版、RTX PRO 5000 Blackwell、RTX PRO 4500 Blackwell 以及RTX PRO 4000 Blackwell
  • 笔记本GPU:RTX PRO 5000 Blackwell、RTX PRO 4000 Blackwell、RTX、PRO 3000 Blackwell、RTX PRO 2000 Blackwell、RTX PRO 1000 Blackwell以及RTX PRO 500 Blackwell
  • 数据中心 GPU:NVIDIA RTX PRO 6000 Blackwell服务器版

图片

英伟达针对企业级计算打造的AI“全家桶”
以上还只是部分基于 Blackwell Ultra芯片针对不同场景定制的SKU,小到工作站,大到数据中心集群,英伟达自己将其称之为“Blackwell Family”(Blackwell家族),中文翻译过来“Blackwell全家桶”再合适不过。

英伟达Photonics

站在队友肩膀上的CPO系统

光电共封模块(CPO)的概念,简单来说就是将交换机芯片和光学模块共同封装,可实现光信号转化为电信号,充分利用光信号的传输性能。
在此之前,业界就一直在讨论英伟达的CPO网络交换机产品,但一直迟迟未上线,黄仁勋在现场也给了解释——由于在数据中心中大量使用光纤连接,光学网络的功耗相当于计算资源的10%,光连接的成本直接影响着计算节点的Scale-Out网络和AI性能密度提升。

图片







请到「今天看啥」查看全文


推荐文章
考研研学姐  ·  为何英语复习努力无成效
8 年前
叔叔恋爱学  ·  男人怎样戴领带
8 年前