专栏名称: AI科技评论
点评学术,服务 AI !
目录
相关文章推荐
来去之间  ·  转发微博-20250616215306 ·  22 小时前  
顾扯淡  ·  友人新书……这次是灵异类了 ... ·  昨天  
纯银V  ·  富士 X-E5 就是旁轴版本的 X-T50 ... ·  2 天前  
王路在隐身  ·  LABUBU不是LABUBU:一个符号如何逃 ... ·  2 天前  
51好读  ›  专栏  ›  AI科技评论

独享 MRDIMM 有多强?至强 6 性能核处理器的内存二三事

AI科技评论  · 公众号  ·  · 2024-12-25 14:43

正文

请到「今天看啥」查看全文



2

至强6性能核的NUMA与集群模式
谈服务器的内存就绕不过NUMA(Non-Uniform Memory Access,非统一内存访问)。因为随着CPU内核数量的增加,各内核的内存访问请求冲突会迅速增加。NUMA是一个有效的解决方案,将内核分为若干组,分别拥有相对独立的缓存、内存空间。规模缩小后,冲突就会减少。一般来说,NUMA划分的原则是让物理上临近某内存控制器的内核为一个子集。这个子集被英特尔称为SUB-NUMA Clustering,简称SNC。同一SNC的内核绑定了末级缓存(LLC)和本地内存,访问时的时延最小。
譬如,在第三代至强可扩展处理器中,一个CPU内可划分两个SNC域,每个SNC对应一组三通道DDR4内存控制器。如果关闭NUMA,那么整个CPU的内存将对称访问。
而第四代至强可扩展处理器使用了4颗芯粒的封装,可以被划分为2个或4个SNC域。如果希望每个内核可以访问所有的缓存代理和内存,可以将第四代至强可扩展处理器设置为Hemisphere Mode或者Quadrant Mode,默认是后者。第五代至强可扩展处理器是2颗芯粒,可以划分为两个SNC域。
在至强6性能核中,可以将每个计算单元芯片作为一个SNC,每个域拥有4个内存通道,这被称为SNC3 Mode。如果要通过其他芯粒的缓存代理访问所有内存,那就是HEX Mode。
根据英特尔提供的数据,几种不同模式的内存访问时延差异较大,与内核、内存控制器之间的“距离”直接相关。至强6性能核的内核规模、内存控制器数量增加之后,相应的访问时延也会上升。例如,至强6性能核内每个计算单元芯片中,内核与内存控制器的最远距离为10列,而第四代/第五代至强可扩展处理器无NUMA的为8列。这反映在英特尔的数据上,就是至强6900P在SNC3 Mode的时延略高于上一代至强处理器的Quad Mode。如果至强6900P设为HEX Mode,那么内核与内存控制器的最远距离将达到13甚至15列,时延增加会比较明显。






请到「今天看啥」查看全文