专栏名称: 电子工程专辑

电子工程专辑是中国创建较早的电子工程类网站，是《电子工程专辑》杂志的有力补充。专注为工程师提供最新技术及实用方法的专业平台。包括：16个热门技术栏目在内的，新品信息和新闻报道、专题报道以及厂商应用报告、行业重要新闻的信息速递。

4个问题看懂NVIDIA Photonics硅光芯片：为什么说它是为Agentic AI准备的？

电子工程专辑 · 公众号 · · 2025-04-29 11:30

正文

请到「今天看啥」查看全文

基于先进封装技术，可以围绕网络芯片，做多片硅光transceiver的chiplet；而光纤也就可以直接连接到封装上。IEEE Spectrum在上个月的报道文章中说，除了激光器之外，其他组成部分基本都可以放到单片封装内。激光器外置的原因主要是其材料是非硅的。“即便如此，CPO每8条数据连接通道也仅需一个激光器。”

这么做带来的具体收益，就在于NVIDIA宣传的3.5倍的能效提升，更高10倍的网络弹性（network resiliency）——这个弹性应该是指抗干扰、打断能力更强，以及更快1.3倍的部署速度——毕竟简化了部署流程、降低了网络的复杂度。另外资料中还提到，采用CPO技术的AI数据中心，只需要用到过去1/4的激光器，信号从一台设备到另一台设备的准时可靠性提升63倍。

什么是CPO（Co-packaged Optics）和MRM（Micro Ring Modulators）？

在CPO具体是怎么封装的问题上，我们只能基于老黄的PPT大致谈一谈：对于整个CPO的Quantum-X Photonics Switch交换芯片而言，看起来各组成部分是通过interposer中介实现互联的。除了中间的交换芯片die（Quantum-X800 ASIC），周围的chiplet（硅光引擎）为3D垂直堆叠：如我们以往对硅光芯片的理解，这些chiplet上层是EIC——电芯片，下层是PIC（Photonic IC）——基于台积电的封装技术。换句话说，整颗芯片是2.5D, 3D封装联用的。

PPT中出现了台积电的COUPE（Compact Universal Photonic Engine），这就是一种专用于硅光芯片的封装方案，基于SoIC、CoWoS先进封装技术，实现光和电组件的集成；另外这种技术平台也可以集成μLens微镜——μLens的作用应当是在光纤和PIC之间做光信号的聚焦和对齐的，减少耦合损耗。

芯片外围有光纤连接器；而激光光源模组也的确是外置的——从上面这张PPT能看得出来（后文也有对应的技术细节截图）。

从技术、组件、装配整个供应链角度来看，NVIDIA Photonics集合了诸多企业的共同努力。除了台积电和NVIDIA以外，还有Lumentum, Sumitomo（住友）的laser optics，以及Browave（波若威科技）、Coherent、Corning（康宁）、Fabrinet、Foxconn（富士康）、Senko、CFC等，构成包括光纤连接器、微镜及相关光学系统，确保可靠的信号路径和最低损耗。

Ian Buck（NVIDIA超大规模与高性能计算副总裁）在媒体会上说，这颗芯片背后有“数百专利、出色的生态系统技术合作伙伴支持”，目标就是要在AI时代充分利用CPO技术，提供出色的性能、效率和规模。

这部分的最后再谈一谈所谓的MRM（Micro Ring Modulators）——这是一种光调制技术，也就是把电信号转为光的方法。硅光领域主要有两类调制器：分别是MRM（微环谐振器），和前面老黄提到的Mach-Zehnder（MZM）。

可插拔光transceiver常见Mach-Zehnder方案：IEEE Spectrum在文章中说，基于这种方案的光通过波导，切分成两个并行的部分，再应用电场去做调制，改变光的相位，然后再结合构成单波导。而MRM则基于环形波导：如果光在环内谐振构成驻波（standing wave），则会提取出来——过滤出来的波长用于后续处理分析。

MRM具备更紧凑的特点，相比Mach-Zehnder的损失也更低；不过通常MRM对温度较为敏感，所以还需要配合更精准的温度控制电路。IEEE Fellow Clint Schow评价NVIDIA实现MRM硅光引擎量产是“工程壮举”。显然其技术和工程难度是相当大的。

Spectrum和Quantum交换机会变成什么样？

NVIDIA Photonics硅光共封芯片最终的产品化落脚点，自然就是Spectrum-X和Quantum-X交换机了，实现所谓scale out的性能扩展和效率最大化，并且为潜在需求更高算力的AI应用做好准备。

对NVIDIA的networking产品熟悉的读者应该很清楚，Quantum-X基于InfiniBand网络技术——其上市时间在今年下半年。Quantum-X Photonics交换机144端口，每个端口800Gb/s的速率（基于200Gb/s SerDes）；两颗CPO芯片专门配了液冷。相比Quantum家族的上代产品，速度快2倍，扩展性提升5倍。

就Quantum-X系统来看，每颗CPO芯片都配有18个硅光chiplet（也就是前文提到3D堆叠的硅光引擎），每个硅光引擎采用TSMC N6工艺，2.2亿晶体管、1000个集成的光器件；每个硅光引擎连接2个激光器以及16条光纤（一颗CPO芯片也就要连36个激光器、288条数据连接）。

NVIDIA虽然没有针对这套芯片和系统提供太多文字资料，不过有个短视频给出了部分数字信息，我们对其中的关键内容做了截图，呈现如下——对技术感兴趣的同学可做深究：