Nvidia 发布全新 Rubin CPX GPU,助力「海量上下文」人工智能应用
2025 年 9 月 10 日
Nvidia 宣布全新 Vera Rubin 微架构处于研发阶段,计划 2026 年推出。其下的 Rubin CPX 变体专注处理海量上下文窗口的人工智能工作负载,适用于处理超百万个 token 的场景。Vera Rubin NDL144CPX 类 GPU 将于 2026 年底上市,具备强大 AI 性能、内存配置等。Nvidia 还计划推出千兆规模的数据中心参考设计,助力 AI 工厂建设。此前,Nvidia 公布的 MLPerf 推理测试中,黑威尔 GPU 创记录,「解耦服务」可提升硬件性能。
2025-10-29
NVIDIA 推出革命性 AI 数据中心设计 助力高效能计算2025-03-19
NVIDIA 推出 DGX 个人 AI 超级计算机,联想戴尔等厂商制造体验专业版特色功能,拓展更丰富、更全面的相关内容。