OpenAI发布三大音频模型，语音技术再升级

1年前 (2025) Ai138

71 0 0

OpenAI近日推出了新一代音频模型，涵盖语音转文本和文本转语音功能。其中，gpt-4o-transcribe单词错误率显著降低，优于现有Whisper模型；gpt-4o-mini-transcribe为精简版，速度更快、效率更高；gpt-4o-mini-tts首次支持“可引导性”，让开发者能灵活控制语音风格，语音交互技术迈向新高度。

欢迎访问AI工具网 Ai138.com，我们致力于为AI专业人士和人工智能爱好者提供全面的AI工具和资源。在我们的平台上，您可以找到涵盖AI聊天、自然语言处理、图像与绘画处理、机器学习以及视频和音频制作等领域的顶尖工具。探索AI，深入了解AI技术如何赋能创新和效率提升，让我们一起步入AI技术的未来世界！

关于我们收录申请免责声明

OpenAI发布三大音频模型，语音技术再升级

腾讯混元T1深度思考模型正式发布

百度“秒哒”对话式应用开发平台全量上线