
全互联的超集:NVLink NVL72 与 GPU 集群的变革
单机柜容纳72颗GPU直接互联,并以统一内存池对外呈现——这就是NVL72的颠覆性所在。借助第五代NVLink,每对GPU之间的双向带宽高达1.8TB/s,NVL72系统总聚合带宽达到惊人的130TB/s。通过NVLink Switch芯片的调度,系统实现了真正的全线速all-to-all通信,硬件自动维护缓存一致性,任一GPU皆可直接读写另一块GPU的HBM内存。
这套设计将72个GPU和36个Grace CPU压缩在一个液冷机柜内,单柜即可实现1.1百亿亿次浮点的FP4算力——一台可落地的百亿亿次级超级计算机。对于万亿参数规模的MoE大模型,72路分散式KV Cache可大幅降低推理延迟,单柜的批处理扩展性远非传统8卡服务器所能比拟。
纵横数据www.170yun.com专业提供B300、B3000服务器、B300显卡服务器、B300服务器租用、8卡B300、B300GPU服务器、B300价格、B300服务器价格、算力服务器、算力服务器租用、B300算力、B3000GPU算力可以联系客服QQ:609863413,微信:17750597993
智能云域名资讯|域名门户|域名新闻中心