Blackwell GPU 的性能有望比 H100 GPU 提高 7 到 30 倍,B200 GPU将取代 H100 成为数据中心最先进的 AI 加速器。
Blackwell GPU芯片
图源:Nvidia
将两个B200 GPU与一个基于Arm的Grace CPU进行配对,再通过900GB/s的超低功耗NVLink连接在一起,可以组成GB200超级芯片。Blackwell B200 GPU单颗芯片的功耗1000W,一颗Grace CPU和两颗Blackwell GPU组成的超级芯片GB200的功耗达到了2700W。 Blackwell GB200 图源:Nvidia GB200使用了NVLink5.0,每颗B200 GPU有18个NVLink5.0端口可以和交换芯片NVlink Switch 进行互联,每个端口的速率是双向100GB/s,由4对差分信号线组成。 英伟达GB200 NVL4是基于GB200扩展的一个全新模块,GB200 NVL4模块在更大的主板上配置两个Grace CPU和4个Blackwell B200 GPU。具有4-GPU NVLink域和1.3T相干内存的单服务器解决方案。 GB200 NVL4 图源:Nvidia超级芯片GB200
GB200 NVL4
将两个GB200超级芯片合并安装到一块主板上,可以组成一个Blackwell计算节点。Blackwell Compute Node 也叫Compute Tray。
Blackwell Compute Node
图源:Nvidia
把18个Blackwell 计算节点(Compute Tray)组合在一起,可以形成新一代计算单元:GB200 NVL72(Blackwell Node × 18 + NVLink Switch = GB200 NVL72)。 GB200 NVL72 包含18个Blackwell Compute Node 图源:Nvidia 为了给18个Blackwell Compute Node提供数据交换能力,GB200 NVL72配备了9个NVLink交换节点(Switch Tray),每个交换节点中配置了2颗NVLink Switch芯片,向外提供14.4TB/s的聚合带宽。 Blackwell NVLink Switch Tray 图源:Nvidia Quantum-X800可提供 144 个 800Gbps 端口和 ConnectX-8 SuperNIC 设备端智能网卡。利用英伟达 SHARPv4x 协议进行的网内算力也提升了 9 倍,达到 14.4 Tflops。 Blackwell Quantum-X800 图源:Nvidia 把若干GB200 NVL72计算单元用Quantum InfiniBand交换机连接起来,再配合上散热系统,可以组成新一代DGX GB200 SuperPod集群。 DGX GB200 SuperPod 图源:Deltacomputer DGX GB200 SuperPod 是一个包含32000块GPU的分布式超算集群,采用新型高效液冷机架,可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。 Blackwell GPU加速成长,重点关注光模块、铜连接和PCB方向-广大证券 英伟达官网:https://www.nvidia.comGB200 NVL72
Blackwell NVLink Switch Tray
Quantum-X800
DGX GB200 SuperPod