火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度

2025 年 12 月 5 日

火山引擎推出豆包语音识别模型 2.0（Doubao-Seed-ASR-2.0），该版本在推理能力上显著提升，支持多种语言和视觉信息精准识别。它继承前作高性能音频编码器优势，优化复杂场景识别，依托先进 PPO 方案实现精准识别。具备多模态理解能力，可结合图像内容进行语音识别，避免偏差。支持 13 种海外语言，拓展跨语言应用。模型已上线并提供 API 服务，未来将持续进化，此次发布展示了其创新能力和技术实力，预计带来积极影响。

豆包语音识别模型 2.0 发布：能听懂字看懂图支持 13 种外语

站长之家

火山引擎发布豆包语音识别模型 2.0，强化多模态与多语言能力

品玩

豆包语音识别模型 2.0 上线：不仅「听懂字」还能「看懂图」，支持日韩德法等 13 种外语

IT 之家

展开全部报道

2026-04-02

豆包大模型日均 Token 使用量超 120 万亿，Seedance 2.0 API 开启公测

2026-03-25

火山引擎云端大模型日均调用量破百万亿 Tokens，跻身全球前三

2025-12-23

传字节火山引擎成为 2026 年春晚独家 AI 云合作伙伴豆包也将参与

2025-12-18

豆包助手 API正式登陆火山方舟

2025-12-18

豆包大模型 1.8 正式发布日均调用量超过 50 万亿

2025-12-05

火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度

2025-12-03

火山引擎：发布豆包图像创作模型 Seedream 4.5

2025-11-11

火山引擎发布豆包编程模型首月 9.9 元引领性价比潮流

2025-10-16

火山引擎发布豆包语音模型 2.0 实现语义与情感双突破

2025-09-30

豆包大模型 1.6-vision 正式发布

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。