梁文锋署名新论文曝光:DeepSeek V4 或引入全新记忆架构
1 月 13 日
今日凌晨,DeepSeek 开源全新架构模块「Engram」并发布技术论文,署名作者有梁文锋。Engram 引入可扩展的查找式记忆结构,为大模型提供新的稀疏性维度。当前主流大模型处理「查表式」记忆和复杂推理计算任务时存在结构性低效,Engram 基于现代化哈希 N-Gram 嵌入实现 O (1) 查找式记忆,检索成本稳定,提供「条件记忆」,通常置于模型早期层承担「模式重建」职责。27B 参数规模实验显示,等参数、等算力条件下,模型在多任务上显著提升。相关讨论认为其减少模型早期层对静态模式的重建需求,部分开发者指出该架构使大规模静态记忆脱离 GPU 存储限制、推理开销低。多位观察者推测 Engram 可能成为 DeepSeek 下一代模型「V4」的核心技术基础。
2026-04-10
传梁文锋内部发声,DeepSeek V4 将于 4 月下旬发布2026-04-07
DeepSeek V4 又灰度测试:全新界面、多模态重大升级2026-04-04
DeepSeek V4 优先支持国产 AI 芯片:巨头已开始提前抢货2026-03-14
消息称 DeepSeek V4 和腾讯姚顺雨的新混元模型将下月同时发布2026-02-28
消息称 DeepSeek 多模态大模型 V4 将于下周发布2026-02-26
DeepSeek 未让美芯片商测试 V4 模型 优先开放给国内厂商2026-02-11
DeepSeek 更新模型 可一次性处理超长文本2026-01-27
DeepSeek 发布 DeepSeek-OCR 2 模型2026-01-21
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布2026-01-13
梁文锋署名新论文曝光:DeepSeek V4 或引入全新记忆架构查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。