Whisper (OpenAI)

19 0

Whisper 是一种开源的自动语音识别系统，经过从网络收集的 680,000 小时多语言和多任务监督数据的训练。它被设计为对口音、背景噪音和技术语言具有鲁棒性，并且可以将多种语言的语音转录和翻译成英语。这是一种简单的端到端方法，实现为编码器-解码器 Transformer。它还能够执行语言识别和短语级时间戳。它被设计为易于使用且具有高精度，允许开发人员将语音接口添加到更多应用程序中。

https://openai.com/blog/whisper

访问网站
复制网址

当前网址国内可以直接访问