纵横云资讯-云计算资讯新闻-IDC云主机VPS服务器

【置顶推荐】终于有人把云计算、大数据和人工智能讲明白了！

一般谈云计算的时候会提到大数据、谈人工智能的时候会提大数据、谈人工智能的时候会提云计算……感觉者之间相辅相成又不可分割。但如果是非技术的人员，就可能比较难理解这三者之间的相互关系，所以有必要解释一下。今天跟大家讲讲云计算、大数据和人工智能。这三个词现在非常火，并且它们之间好像互相有关[……]

Grant-as-a-Service 算力银行：B300 算力基础设施的新商业模式

2026-05-28 燕子阅读(36 ) 评论()

Grant-as-a-Service 算力银行：B300 算力基础设施的新商业模式随着 B300 集群的单位算力成本不断下降，一种新型商业模式正在兴起——Grant-as-a-Service（GaaS，算力银行）。其核心逻辑是：云服务商或大型算力池发行“算力信用”，允许中小团队、学术机[……]

互联网+

“DeepSeek”等爆款应用如何推动对 B300 大容量显存的算力需求

2026-05-28 燕子阅读(30 ) 评论()

“DeepSeek”等爆款应用如何推动对 B300 大容量显存的算力需求 2024 年底爆火的 DeepSeek 模型，展示了新一代 AI 应用的共同特征：极长的上下文窗口（百万 token 级别）、复杂的思维链推理、以及多轮交互中的状态保持。这些特性对大容量显存提出了硬性要求——单次推[……]

互联网+

推理 Token 成本下降的拐点：B300 及后续 Rubin 的经济影响

2026-05-28 燕子阅读(35 ) 评论()

推理 Token 成本下降的拐点：B300 及后续 Rubin 的经济影响 AI 推理的经济账，核心在于每 token 的成本。B300 的大容量 HBM3e 和高带宽设计，大幅减少推理时的 KV-cache 换入换出，使得批量推理的 token 成本较 H100 下降 50% 以上。以[……]

互联网+

B300 的长期寿命：预计三到四年，Rubin 问世前的 AI 算力基石

2026-05-28 燕子阅读(31 ) 评论()

B300 的长期寿命：预计三到四年，Rubin 问世前的 AI 算力基石 B300 并非过渡产品，而是 NVIDIA 产品路线图中承上启下的“长生命期”核心。根据现有架构规划，下一代 Rubin 平台预计于 2027–2028 年面世，这意味着 B300 将拥有至少三到四年的市场主导期。[……]

互联网+

美国对华管制升级：国内B300出货受阻与H200放行预期

2026-05-28 燕子阅读(31 ) 评论()

美国对华管制升级：国内B300出货受阻与H200放行预期美国对华半导体出口管制再度加码。据最新供应链消息，NVIDIA B300 GPU 对中国的批量出货已实质性受阻，涉及数据中心与高性能计算领域。B300 作为 Blackwell 架构的旗舰产品，其 HBM 带宽和 FP8 算力均触[……]

互联网+

视频生成与多模态 AI：B300 支持即时的复杂推理运算

2026-05-25 燕子阅读(56 ) 评论()

视频生成与多模态 AI：B300 支持即时的复杂推理运算视频生成和多模态理解是目前 AI 最具挑战性的方向。一段 1080p、5 秒的视频包含近 3 亿个时空 token，传统 GPU 需要数十秒甚至分钟级的推理时间，且难以在生成过程中进行逻辑调整。B300 的出现，使得“边生成边推理[……]

互联网+

药物研发：礼来部署基于 DGX B300 的全球最大 AI 工厂

2026-05-25 燕子阅读(40 ) 评论()

药物研发：礼来部署基于 DGX B300 的全球最大 AI 工厂礼来公司近日宣布，将部署由 1024 套 DGX B300 系统构建的全球最大 AI 算力工厂，专门用于小分子药物发现和蛋白质结构预测。这一设施的总 FP8 算力达到 2.1 ExaFLOPS，HBM3e 内存池超过 64[……]

互联网+

单 GPU 运行更长的逻辑链条：B300 解决 KV Cache 瓶颈

2026-05-25 燕子阅读(40 ) 评论()

单 GPU 运行更长的逻辑链条：B300 解决 KV Cache 瓶颈长思维链推理中最令人头疼的是 KV Cache 的爆炸式增长。传统 GPU 在处理超过 3 万 token 的序列时，KV Cache 会迅速占满显存，导致频繁的缓存逐出与重新计算，严重拖慢推理速度，甚至[……]

互联网+

万亿至十万亿参数 MoE 模型的训练与微调实践

2026-05-25 燕子阅读(44 ) 评论()

万亿至十万亿参数 MoE 模型的训练与微调实践当模型规模迈向万亿乃至十万亿参数，MoE（混合专家）架构成为唯一可行路径。但训练和微调如此庞大的模型，面临着专家负载不均、通信开销爆炸、显存墙三大难题。B300 的硬件与软件协同设计给出了系统性答案。在训练层面，B300 集成[……]

互联网+

B300 为何专为 OpenAI o1 / DeepSeek 等推理大模型量身打造？

2026-05-25 燕子阅读(46 ) 评论()

B300 为何专为 OpenAI o1 / DeepSeek 等推理大模型量身打造？ OpenAI o1、DeepSeek R1 等“推理大模型”的核心特点是：在推理阶段进行长时间的思维链（Chain-of-Thought）展开，通过反复推演、自我纠错来提升答案质量。这类模型的计算模式与[……]

智能云域名资讯|域名门户|域名新闻中心

【置顶推荐】终于有人把云计算、大数据和人工智能讲明白了！

最新文章

Grant-as-a-Service 算力银行：B300 算力基础设施的新商业模式

“DeepSeek”等爆款应用如何推动对 B300 大容量显存的算力需求

推理 Token 成本下降的拐点：B300 及后续 Rubin 的经济影响

B300 的长期寿命：预计三到四年，Rubin 问世前的 AI 算力基石

美国对华管制升级：国内B300出货受阻与H200放行预期

视频生成与多模态 AI：B300 支持即时的复杂推理运算

药物研发：礼来部署基于 DGX B300 的全球最大 AI 工厂

单 GPU 运行更长的逻辑链条：B300 解决 KV Cache 瓶颈

万亿至十万亿参数 MoE 模型的训练与微调实践

B300 为何专为 OpenAI o1 / DeepSeek 等推理大模型量身打造？