专栏名称: 电子工程专辑
电子工程专辑是中国创建较早的电子工程类网站,是《电子工程专辑》杂志的有力补充。专注为工程师提供最新技术及实用方法的专业平台。包括:16个热门技术栏目在内的,新品信息和新闻报道、专题报道以及厂商应用报告、行业重要新闻的信息速递。
目录
相关文章推荐
春江潮起  ·  镇江人注意!电价新政今起正式实施 ·  2 天前  
春江潮起  ·  镇江人注意!电价新政今起正式实施 ·  2 天前  
江苏警方  ·  不管几岁,快乐万岁! ·  2 天前  
51好读  ›  专栏  ›  电子工程专辑

4个问题看懂NVIDIA Photonics硅光芯片:为什么说它是为Agentic AI准备的?

电子工程专辑  · 公众号  ·  · 2025-04-29 11:30

正文

请到「今天看啥」查看全文


基于先进封装技术,可以围绕网络芯片,做多片硅光transceiver的chiplet;而光纤也就可以直接连接到封装上。IEEE Spectrum在 上个月的报道文章 中说,除了激光器之外,其他组成部分基本都可以放到单片封装内。激光器外置的原因主要是其材料是非硅的。“即便如此,CPO每8条数据连接通道也仅需一个激光器。”

这么做带来的具体收益,就在于NVIDIA宣传的3.5倍的能效提升,更高10倍的网络弹性(network resiliency)——这个弹性应该是指抗干扰、打断能力更强,以及更快1.3倍的部署速度——毕竟简化了部署流程、降低了网络的复杂度。另外资料中还提到,采用CPO技术的AI数据中心,只需要用到过去1/4的激光器,信号从一台设备到另一台设备的准时可靠性提升63倍。

什么是CPO(Co-packaged Optics)和MRM(Micro Ring Modulators)?

在CPO具体是怎么封装的问题上,我们只能基于老黄的PPT大致谈一谈:对于整个CPO的Quantum-X Photonics Switch交换芯片而言,看起来各组成部分是通过interposer中介实现互联的。除了中间的交换芯片die(Quantum-X800 ASIC),周围的chiplet(硅光引擎)为3D垂直堆叠:如我们以往对硅光芯片的理解,这些chiplet上层是EIC——电芯片,下层是PIC(Photonic IC)——基于台积电的封装技术。换句话说,整颗芯片是2.5D, 3D封装联用的。

PPT中出现了台积电的COUPE(Compact Universal Photonic Engine),这就是一种专用于硅光芯片的封装方案,基于SoIC、CoWoS先进封装技术,实现光和电组件的集成;另外这种技术平台也可以集成μLens微镜——μLens的作用应当是在光纤和PIC之间做光信号的聚焦和对齐的,减少耦合损耗。

芯片外围有光纤连接器;而激光光源模组也的确是外置的——从上面这张PPT能看得出来(后文也有对应的技术细节截图)。

从技术、组件、装配整个供应链角度来看,NVIDIA Photonics集合了诸多企业的共同努力。除了台积电和NVIDIA以外,还有Lumentum, Sumitomo(住友)的laser optics,以及Browave(波若威科技)、Coherent、Corning(康宁)、Fabrinet、Foxconn(富士康)、Senko、CFC等,构成包括光纤连接器、微镜及相关光学系统,确保可靠的信号路径和最低损耗。

Ian Buck(NVIDIA超大规模与高性能计算副总裁)在媒体会上说,这颗芯片背后有“数百专利、出色的生态系统技术合作伙伴支持”,目标就是要在AI时代充分利用CPO技术,提供出色的性能、效率和规模。

这部分的最后再谈一谈所谓的MRM(Micro Ring Modulators)——这是一种光调制技术,也就是把电信号转为光的方法。硅光领域主要有两类调制器:分别是MRM(微环谐振器),和前面老黄提到的Mach-Zehnder(MZM)。

可插拔光transceiver常见Mach-Zehnder方案:IEEE Spectrum在文章中说,基于这种方案的光通过波导,切分成两个并行的部分,再应用电场去做调制,改变光的相位,然后再结合构成单波导。而MRM则基于环形波导:如果光在环内谐振构成驻波(standing wave),则会提取出来——过滤出来的波长用于后续处理分析。

MRM具备更紧凑的特点,相比Mach-Zehnder的损失也更低;不过通常MRM对温度较为敏感,所以还需要配合更精准的温度控制电路。IEEE Fellow Clint Schow评价NVIDIA实现MRM硅光引擎量产是“工程壮举”。显然其技术和工程难度是相当大的。

Spectrum和Quantum交换机会变成什么样?

NVIDIA Photonics硅光共封芯片最终的产品化落脚点,自然就是Spectrum-X和Quantum-X交换机了,实现所谓scale out的性能扩展和效率最大化,并且为潜在需求更高算力的AI应用做好准备。

对NVIDIA的networking产品熟悉的读者应该很清楚,Quantum-X基于InfiniBand网络技术——其上市时间在今年下半年。Quantum-X Photonics交换机144端口,每个端口800Gb/s的速率(基于200Gb/s SerDes);两颗CPO芯片专门配了液冷。相比Quantum家族的上代产品,速度快2倍,扩展性提升5倍。

就Quantum-X系统来看,每颗CPO芯片都配有18个硅光chiplet(也就是前文提到3D堆叠的硅光引擎),每个硅光引擎采用TSMC N6工艺,2.2亿晶体管、1000个集成的光器件;每个硅光引擎连接2个激光器以及16条光纤(一颗CPO芯片也就要连36个激光器、288条数据连接)。

NVIDIA虽然没有针对这套芯片和系统提供太多文字资料,不过有个短视频给出了部分数字信息,我们对其中的关键内容做了截图,呈现如下——对技术感兴趣的同学可做深究:







请到「今天看啥」查看全文