智能云域名资讯|域名门户|域名新闻中心

新闻资讯频道
云计算领域最新资讯

标签: 8卡B300

互联网+

“DeepSeek”等爆款应用如何推动对 B300 大容量显存的算力需求

阅读(104 ) 评论()

“DeepSeek”等爆款应用如何推动对 B300 大容量显存的算力需求 2024 年底爆火的 DeepSeek 模型,展示了新一代 AI 应用的共同特征:极长的上下文窗口(百万 token 级别)、复杂的思维链推理、以及多轮交互中的状态保持。这些特性对大容量显存提出了硬性要求——单次推[……]

Read more

互联网+

万亿至十万亿参数 MoE 模型的训练与微调实践

阅读(102 ) 评论()

万亿至十万亿参数 MoE 模型的训练与微调实践 当模型规模迈向万亿乃至十万亿参数,MoE(混合专家)架构成为唯一可行路径。但训练和微调如此庞大的模型,面临着专家负载不均、通信开销爆炸、显存墙三大难题。B300 的硬件与软件协同设计给出了系统性答案。 在训练层面,B300 集成[……]

Read more