专栏名称: Cocoa开发者社区
CocoaChina苹果开发中文社区官方微信,提供教程资源、app推广营销、招聘、外包及培训信息、各类沙龙交流活动以及更多开发者服务。
目录
相关文章推荐
51好读  ›  专栏  ›  Cocoa开发者社区

老黄狂拼CPU!英伟达掏出800亿晶体管显卡,外加世界最快AI超算Eos

Cocoa开发者社区  · 公众号  · ios  · 2022-03-23 18:23

正文

请到「今天看啥」查看全文


同时,H100的SXM版本将TDP增加到了700W,而A100为400W。而75%的功率提升,通常来说可以预计获得2到3倍的性能。
为了优化性能,Nvidia还推出了一个新的Transformer Engine,将根据工作负载在FP8和FP16格式之间自动切换。

H100
A100 (80GB)
CUDA核心
16896
6912
张量核心
528
432
超频频率
约1.78GHz
1.41GHz
内存
4.8Gbps HBM3
3.2Gbps HBM2e
内存带宽
3TB/s
2TB/s
FP32矢量
60 TFLOPS
19.5 TFLOPS
FP64矢量
30 TFLOPS
9.7 TFLOPS
(1/2 FP32)
INT8张量
2000 TOPS
624 TOPS
FP16张量
1000 TFLOPS
312 TFLOPS
TF32张量
500 TFLOPS
156 TFLOPS
FP64张量
60 TFLOPS
19.5 TFLOPS
总线
NVLink 4
18条 (900GB/s)






请到「今天看啥」查看全文