—— AI头条 ——

OpenAI发布三大音频模型,语音技术再升级

1个月前 Ai138
8 0

OpenAI近日推出了新一代音频模型,涵盖语音转文本和文本转语音功能。其中,gpt-4o-transcribe单词错误率显著降低,优于现有Whisper模型;gpt-4o-mini-transcribe为精简版,速度更快、效率更高;gpt-4o-mini-tts首次支持“可引导性”,让开发者能灵活控制语音风格,语音交互技术迈向新高度。