腾讯混元开源首个面向世界模型的强化学习后训练框架

3 月 10 日

腾讯混元 3D 团队开源首个面向世界模型的强化学习后训练框架 WorldCompass,它专为长时序、交互式世界模型设计,引入强化学习机制,可引导模型准确遵循用户指令探索世界并保持长时序视觉一致性。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
科技新闻,每天 3 分钟