蚂蚁集团开源全模态大模型 Ming-flash-omni 2.0

2 月 11 日

蚂蚁集团开源发布全模态大模型 Ming-flash-omni 2.0,其在视觉语言理解等关键能力的多项公开基准测试中表现突出,部分指标超越 Gemini 2.5 Pro,也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
科技新闻,每天 3 分钟