蚂蚁集团开源 EchoMimic 项目,为人像照片对口型
2024 年 7 月 12 日
蚂蚁集团开源了旗下 AI 项目 EchoMimic,该模型能够根据音频和面部标志点生成稳定且自然的视频,支持单用音频或面部标志点,也支持音频和人像照片结合,可实现对口型的效果,同时支持多语言和多风格,适用于唱歌等多种场景。
2026-02-13
蚂蚁集团开源 Ring-2.5-1T,全球首个混合线性架构万亿参数思考模型来了2026-02-11
蚂蚁集团开源全模态大模型 Ming-flash-omni 2.02026-01-27
蚂蚁灵波开源空间感知模型 LingBot-Depth2025-11-20
蚂蚁开源万亿参数强化学习高性能权重交换框架 Awex2025-10-09
蚂蚁发布万亿参数旗舰模型 Ling-1T 并开源2025-09-24
蚂蚁集团支付宝体验技术部开源智能编程助手 Neovate Code2025-06-16
蚂蚁集团联手 inclusion AI ,推出开源多模态模型 Ming-Omni2024-07-12
蚂蚁集团开源 EchoMimic 项目,为人像照片对口型2022-07-04
蚂蚁集团面向全球开发者正式开源「隐语」2022-03-10
蚂蚁集团开源最大规模视频侵权定位数据集和代码查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。