Whisper 是一种开源的自动语音识别系统,经过从网络收集的 680,000 小时多语言和多任务监督数据的训练。它被设计为对口音、背景噪音和技术语言具有鲁棒性,并且可以将多种语言的语音转录和翻译成英语。这是一种简单的端到端方法,实现为编码器-解码器 Transformer。它还能够执行语言识别和短语级时间戳。它被设计为易于使用且具有高精度,允许开发人员将语音接口添加到更多应用程序中。
https://openai.com/blog/whisper
访问网站
复制网址
复制网址
当前网址国内可以直接访问
© 版权声明
文章版权归作者所有,未经允许请勿转载。