火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度
2025 年 12 月 5 日
火山引擎推出豆包语音识别模型 2.0(Doubao-Seed-ASR-2.0),该版本在推理能力上显著提升,支持多种语言和视觉信息精准识别。它继承前作高性能音频编码器优势,优化复杂场景识别,依托先进 PPO 方案实现精准识别。具备多模态理解能力,可结合图像内容进行语音识别,避免偏差。支持 13 种海外语言,拓展跨语言应用。模型已上线并提供 API 服务,未来将持续进化,此次发布展示了其创新能力和技术实力,预计带来积极影响。
2026-03-25
火山引擎云端大模型日均调用量破百万亿 Tokens,跻身全球前三2025-12-23
传字节火山引擎成为 2026 年春晚独家 AI 云合作伙伴 豆包也将参与2025-12-18
豆包助手 API正式登陆火山方舟2025-12-18
豆包大模型 1.8 正式发布 日均调用量超过 50 万亿2025-12-05
火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度2025-12-03
火山引擎:发布豆包图像创作模型 Seedream 4.52025-11-11
火山引擎发布豆包编程模型 首月 9.9 元引领性价比潮流2025-10-16
火山引擎发布豆包语音模型 2.0 实现语义与情感双突破2025-09-30
豆包大模型 1.6-vision 正式发布查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。