当地时间 4 月 17 日,xAI 宣布正式推出 Grok 平台的语音转文本(STT)与文本转语音(TTS)API,面向开发者开放,目标是提供高保真、低延迟的语音交互能力,支持集成更自然的语音对话体验。新增接口可覆盖语音交互关键环节,开发者可调用服务搭建相关功能,与现有文本对话能力结合形成端到端语音对话流程。此前 xAI 已提供 Grok 相关 API,此次语音能力加入使 Grok 平台在多模态交互方向进一步扩展,不过 xAI 未披露 STT 与 TTS API 的具体计费、可用语种与模型版本覆盖范围。