亚马逊首个大型语音 AI 模型 BASE TTS 问世
2024 年 2 月 19 日
亚马逊人工智能研究团队开发了一项名为 BASE TTS 的文本转语音技术,该技术拥有 9.8 亿个参数,是有史以来最大的模型之一。BASE TTS 使用了 10 万个小时的录音进行训练,包括英语、德语、荷兰语和西班牙语等,处理复杂的语言结构方面表现出色,单词发音质量得到了显著提升。尽管存在发音和语调错误等问题,这一技术仍标志着文本转语音技术的重要进展,未来可能得到广泛应用,但 BASE TTS 不会向公众发布,将仅用于学习应用中。
2026-03-20
亚马逊时隔 12 年重启智能手机项目:内部代号 Transformer2025-10-24
亚马逊计划推出 AI 购物助手,帮助用户挑选商品2025-07-03
亚马逊推出 Deep Fleet 模型,机器人数量突破百万2025-04-09
亚马逊推出全新 AI 语音模型 Nova Sonic,叫板 OpenAI 和谷歌2025-04-01
亚马逊发布新型 AI 模型 可实现浏览器内自主操作2025-02-27
亚马逊推出新版语音助手 Alexa+2025-01-31
亚马逊宣布将 DeepSeek-R1 模型纳入 Bedrock 人工智能模型市场2024-11-28
亚马逊开发视频人工智能模型,减少对 Anthropic 的依赖2024-07-15
亚马逊向美国用户推出 Rufus AI 购物助手查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。