专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
直播海南  ·  叶文翀(1995年生),不幸殉职 ·  15 小时前  
51好读  ›  专栏  ›  企业存储技术

Meta的GB200液冷AI服务器 - Catalina

企业存储技术  · 公众号  ·  · 2025-03-30 08:30

正文

请到「今天看啥」查看全文




  • 具体组件包括:

    • DC-SCM 2.0

    • OCP NIC (开放计算项目网卡)

    • E1.S 固态硬盘(启动盘和数据盘)

    • 配电板( PDB

    • 风扇

    • 用于液冷高功耗组件的冷板回路


    平台架构

    如上图, Catalina 1U 节点由 2 GB200 主板组成,每块上面包含 Grace ARM CPU B200 GPU 。除了 B200 对外提供 NVLink 5 Scale-out 扩展互连接口之外; CPU GPU 之间,以及 2 Grace CPU 之间应该也是 NVLink C2C 互连,提供内存一致性访问。

    B200 片上自带 HBM 内存, Grace CPU 的内存则由 LPDDR5x CAMM 模组提供(下图供参考)。

    Grace CPU B200 GPU 之间,看上去还有蓝色示意的 PCIe 连接, B200 支持 Gen6 x16 Endpoint 设备模式,但 Grace CPU 应该还只能支持到 PCIe 5.0

    CPU+GPU 1:1 配比 的模式(传统 x86 CPU+GPU 的服务器多为 1:4 ),不需要 PCIe Switch ,也可以理解为 CPU 兼做了 PCIe Switch 的工作 。东西向网络是 2 块后端的 CX7 400G 网卡;另有 1 CX7-200G 应该是用于南北向网络(存储、管理等流量)。

    每块主板连接到机箱前端的 2 E1.S NVMe SSD ,支持 Gen5 x4 1U 机箱一共能安装 4 块盘。

    机械规格

    - 1RU 规格的托盘,可安装在适配卡上,以实现与 Open      Rack 的兼容。

    • - 尺寸:高 43.60 毫米 × 498 毫米 × 766 毫米






    请到「今天看啥」查看全文