Meta 推出 LlamaRL 强化学习框架,效率提升超 10 倍
2025 年 6 月 11 日
Meta 推出 LlamaRL 强化学习框架,采用全异步分布式架构,大幅提升大模型训练效率。在 4050 亿参数模型上,强化学习步骤耗时从 635.8 秒降至 59.5 秒,性能提升超 10 倍。该框架通过模块化设计和高效数据传输技术,解决内存占用高和 GPU 利用率低等问题,为更大规模模型训练提供扩展性方案。
2025-09-19
Meta 发布 MobileLLM – R1 系列小型模型 编码测试表现领先2025-06-11
Meta 推出 LlamaRL 强化学习框架,效率提升超 10 倍2025-05-09
Meta 开源 LlamaFirewall,面向 AI 智能体的安全框架体验专业版特色功能,拓展更丰富、更全面的相关内容。