面壁智能发布基于稀疏-线性混合架构 SALA 训练 9B 模型
2 月 12 日
面壁智能正式发布稀疏-线性注意力混合架构 SALA 及基于该架构的文本模型 MiniCPM-SALA,模型仅 9B 参数。MiniCPM-SALA 不使用投机采样等加速算法,在云端推理芯片上,序列长度为 256K 词元时推理速度达 Qwen3-8B 的 3.5 倍,且支持在云端芯片和消费级端侧 GPU 上进行高达一百万词元上下文长度的推理。
面壁智能发布基于稀疏-线性混合架构 SALA 训练 9B 模型
华尔街见闻 / 界面 / 格隆汇 / 36Kr / 钛媒体 / 和讯网
2026-02-12
面壁智能发布基于稀疏-线性混合架构 SALA 训练 9B 模型2026-02-04
面壁智能开源新一代全模态旗舰模型 MiniCPM-o 4.52025-12-23
面壁智能完成数亿元融资,资金将用于端侧高效大模型研发2025-06-07
面壁智能发布端侧大模型 MiniCPM 4.02025-01-16
面壁发布首个端侧多模态模型 MiniCPM-o 2.62024-06-14
面壁智能 CEO 李大海:正与电脑厂商合作端侧模型,下半年或有新产品出现2023-11-05
面壁智能大模型宣布全面开放 含免费商用基座模型体验专业版特色功能,拓展更丰富、更全面的相关内容。