华为 UCM 推理记忆管理技术正式开源
2025 年 11 月 5 日
华为针对 AI 推理加速的关键技术 ——UCM 推理记忆数据管理正式宣布开源,UCM 目前具备稀疏注意力、前缀缓存、预填充卸载、异构 PD 解耦四大能力,可实现首 Token 时延最高降低 90%,系统吞吐最大提升 22 倍,达到 10 倍级上下文窗口扩展。
2026-03-17
华为发布针对 AI 推理场景的全新 AI 数据基础设施2026-03-03
华为在 MWC 2026 发布 AI 数据平台,首创「3+1」架构2025-12-27
华为:全球悬赏 300 万元解决 AI 时代的存储难题2025-12-08
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等2025-11-26
算力利用率提升 30%,华为与三大高校开源 Flex:ai2025-11-21
华为发布 Flex:ai AI 容器技术,实现单卡同时承载多个 AI 工作负载2025-11-05
华为 UCM 推理记忆管理技术正式开源2025-10-15
华为发布以 AI-Centric 全面升级的 AI WAN 解决方案2025-09-12
华为悬赏单项最高 100 万,6 支科研团队获第五届「奥林帕斯奖」2025-08-26
中国信通院联合华为、三大运营商等成立「先进存力 AI 推理工作组」查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。