正文
此外,新芯片总处理性能(TPP)严格控制在4800以下,不会采用台积电先进的 CoWoS 封装技术,转而采用传统封装工艺。这种 “性能阉割” 策略在满足美国商务部对 “性能密度阈值” 要求的同时,还进一步降低了成本。
在具体参数设计上,第二代 Transformer 引擎支持 4 位浮点计算,可处理数万亿参数的混合专家模型;第五代 NVLink 实现 1.8TB/s 双向吞吐量,支持多达 576 个 GPU 的无缝协作;RAS 引擎通过 AI 驱动的预防性维护提升可靠性。尽管带宽受限,H20B 仍能在垂类模型训练和推理场景中保持较高效率,例如在 1750 亿参数的 GPT-3 基准测试中,其训练速度是 H100 的 4 倍。
你就说这算不算价格战吧?
英伟达此次推出 B40 的核心目标是应对中国市场的双重挑战:
一方面,美国对华先进计算芯片的出口管制导致 H100、A100 等产品供应受限;另一方面,华为昇腾 910B、寒武纪思元 590 等国产芯片在政策支持下快速崛起。B40 的定价策略直接瞄准国产芯片的价格带 —— 华为昇腾 910B 单卡售价约 8 万元人民币,而 B40 的 6500-8000 美元定价(约合人民币 4.6 万 - 5.7 万元)形成显著价格优势。
为巩固市场地位,英伟达同步启动 “硬件 + 软件” 的生态绑定策略。其 CUDA-X 软件栈已针对 B40 进行深度优化,支持主流深度学习框架如 PyTorch、TensorFlow 的无缝迁移。